Sobre o Projeto
Iniciativa Basal de IA Generativa: Construindo a Infraestrutura Digital Fundamental para a Saúde Pública Pública.
A Visão: Etapas Pré-clínicas para IA Generativa
Quando o Sistema Único de Saúde (SUS) do Brasil—uma rede continental que atende mais de 180 milhões de pessoas—abriu uma chamada para projetos de IA Generativa, percebemos uma verdade fundamental: assim como vacinas, Grandes Modelos de Linguagem (LLMs) requerem "etapas pré-clínicas" rigorosas antes de poderem ser implantados com segurança para o público.
O Projeto GABI nasceu para construir essa infraestrutura digital fundamental. Para tornar a IA uma realidade na saúde pública, não podíamos apenas construir uma aplicação simples. Tínhamos que resolver as barreiras essenciais para a adoção da IA. Isso significou enfrentar um desafio triplo:
- Aquisição de Dados: Reunião de dados de treinamento massivos e de alta qualidade.
- Benchmarking: Criação de avaliações rigorosas adaptadas para desempenho analítico, equidade e segurança do paciente.
- Barreiras Estratégicas: Resolução dos gargalos complexos de compartilhamento de dados (desidentificação) e geração de dados (interoperabilidade).
Nossas Principais Contribuições
Operando sob um orçamento estrito, o Projeto GABI projetou soluções altamente eficientes e econômicas que ampliam os limites do que a IA de código aberto pode alcançar na saúde. Nossas entregas são interconectadas: os dados treinam os modelos, os benchmarks garantem sua segurança e os modelos resolvem gargalos clínicos no mundo real.
1. Aquisição Massiva de Dados
Para treinar modelos que compreendam as nuances da saúde no mundo real, construímos conjuntos de dados sem precedentes:
- AEGIS-1: O maior conjunto de dados de saúde do mundo. Reconhecendo que a desigualdade em saúde é um problema global, utilizamos dutos de tradução sensíveis ao contexto avançados para tornar este conjunto de dados disponível em 17 idiomas diferentes, garantindo que os países mais pobres e negligenciados do mundo também possam se beneficiar da IA generativa.
- PHAENIX-1: Um conjunto de dados em escala nacional resgatando quase 1 milhão de teses e dissertações acadêmicas brasileiras que antes não estavam disponíveis para modelagem de linguagem e metapesquisa científica.
2. Benchmarking Rigoroso
Não podemos melhorar o que não podemos medir. Desenvolvemos benchmarks especializados para avaliar LLMs especificamente para as realidades da saúde pública:
- HealthQA-BR: Um benchmark para todo o sistema que avaliou mais de 300 LLMs em todas as profissões e especialidades de saúde, revelando lacunas críticas de conhecimento nos atuais modelos no estado da arte.
- CARE: Um benchmark pioneiro dedicado a avaliar a equidade em saúde de LLMs, garantindo que os modelos atendam as populações diversas de forma justa dentro do contexto do SUS.
- Medical Malice: Um conjunto de dados especializado criado para o alinhamento e a segurança específicos da saúde em LLMs.
3. Modelos de IA Estratégicos
Desenvolvemos modelos de código aberto no estado da arte para solucionar duas das barreiras mais críticas para o progresso científico na saúde: privacidade e interoperabilidade.
- Deid Qwen 3: Um LLM de desidentificação altamente robusto. Através de seleção rigorosa e treinamento aprimorado por agentes, alcançou um F1 score de 99,92% em 5 conjuntos de testes distintos de diferentes instituições, garantindo conformidade estrita com LGPD e HIPAA para o compartilhamento seguro de dados.
- RAC Qwen 3: Um modelo pioneiro capaz de estruturar notas clínicas não estruturadas em texto livre para os formatos interoperáveis FHIR/RAC usados pelo SUS, desbloqueando um potencial massivo para análise de dados e gestão em saúde pública.
- Clinical ModernBERT-br: O novo modelo no estado da arte do tipo encoder focado especificamente para tarefas de PNL clínica em português (como aplicações RAG, classificação da CID e previsão de readmissão).
Impacto Global a Partir de Necessidades Locais
O Projeto GABI nasceu das necessidades urgentes do sistema público de saúde do Brasil, mas os desafios que enfrentamos—silos de dados, preocupações com privacidade e a falta de avaliação de IA localizada—são universais. Ao criar o maior conjunto de dados global voltado para a equidade na saúde e abrir o código-fonte de nosso código e modelos, estamos pavimentando o caminho para um futuro da IA na saúde mais igualitário, interoperável e seguro, tanto no Brasil quanto por todo o Sul Global.
Apoio e Agradecimentos
Esse esforço monumental foi possível através do apoio generoso da Fundação Bill & Melinda Gates e do Ministério da Saúde do Brasil / CNPq.
Saiba mais sobre a nossa bolsa da iniciativa Grand Challenges aqui.