Conjuntos de Dados

Catálogo de dados clínicos para pesquisa.

HealthQA-BR

O HealthQA-BR é o primeiro benchmark de larga escala e abrangência para todo o Sistema Único de Saúde (SUS), projetado para medir o conhecimento clínico de Grandes Modelos de Linguagem (LLMs) frente aos desafios da saúde pública brasileira. Composto por 5.632 questões de múltipla escolha.

Público

Medical Malice

Medical Malice é um conjunto de dados adversarial de larga escala projetado para aprimorar a segurança do paciente no contexto de LLMs em saúde. Composto por 214.219 prompts maliciosas, o dataset foi calibrado especificamente para as complexidades éticas, regulatórias e burocráticas do SUS.

Público

CARE: Clinical Assessment of Robustness and Equity

O CARE é um dataset de avaliação focado na mensuração de viés explícito e robustez de LLMs no contexto do SUS. Avalia o comportamento e a consistência do modelo frente a grupos populacionais vulneráveis, operando sob a premissa de perguntas invariantes.

Público

Phaenix-1

Um conjunto de dados em escala nacional de trabalhos acadêmicos brasileiros. O conjunto compreende 902.186 teses e dissertações defendidas entre 2013 e 2025, coletadas e estruturadas a partir do catálogo oficial da CAPES.

Acesso Restrito

Aegis-1

Dataset contendo 8,92 bilhões de tokens composto por notas clínicas e conteúdo educacional e científico relacionado à saúde.

Está sob revisão da equipe da PhysioNet.