Conjuntos de Dados
Catálogo de dados clínicos para pesquisa.
HealthQA-BR
O HealthQA-BR é o primeiro benchmark de larga escala e abrangência para todo o Sistema Único de Saúde (SUS), projetado para medir o conhecimento clínico de Grandes Modelos de Linguagem (LLMs) frente aos desafios da saúde pública brasileira. Composto por 5.632 questões de múltipla escolha.
Medical Malice
Medical Malice é um conjunto de dados adversarial de larga escala projetado para aprimorar a segurança do paciente no contexto de LLMs em saúde. Composto por 214.219 prompts maliciosas, o dataset foi calibrado especificamente para as complexidades éticas, regulatórias e burocráticas do SUS.
CARE: Clinical Assessment of Robustness and Equity
O CARE é um dataset de avaliação focado na mensuração de viés explícito e robustez de LLMs no contexto do SUS. Avalia o comportamento e a consistência do modelo frente a grupos populacionais vulneráveis, operando sob a premissa de perguntas invariantes.
Phaenix-1
Um conjunto de dados em escala nacional de trabalhos acadêmicos brasileiros. O conjunto compreende 902.186 teses e dissertações defendidas entre 2013 e 2025, coletadas e estruturadas a partir do catálogo oficial da CAPES.
Aegis-1
Dataset contendo 8,92 bilhões de tokens composto por notas clínicas e conteúdo educacional e científico relacionado à saúde.
Está sob revisão da equipe da PhysioNet.