Agentes Autônomos vs. CFM 2.454: A IA que Age e a Lei que Exige que o Médico Decida

Agentes Autônomos vs. CFM 2.454: A IA que Age e a Lei que Exige que o Médico Decida

Em junho, um agente de IA superou clínicos experientes operando sozinho num prontuário. Dois meses depois entra em vigor a resolução do CFM que proíbe exatamente esse tipo de autonomia — a colisão é a fronteira onde a medicina brasileira vai se redesenhar.

Dr. Mbula Luzingu Barros | Médico Pediatra Intensivista · 25 anos de UTI Pediátrica | Consultor em IA na Saúde | Fundador da INOVAMED | Criador da Metodologia AIMED

📅 Publicado em 22 de junho de 2026

⏱ Vigência da CFM 2.454 em: 65 dias — 26 de agosto de 2026

Por Que Este Cruzamento Importa

No dia 17 de junho de 2026, a Nature publicou um trabalho que vale a pena ler antes que vire manchete distorcida. Ferber e colaboradores apresentaram a MIRA (Medical Intelligence for Reasoning and Action), um agente de IA operando dentro de um prontuário eletrônico em ambiente sandboxed. Não é um chatbot que sugere — é um agente que age: coleta história, solicita e interpreta exames de laboratório, imagem e microbiologia, formula diagnósticos diferenciais e propõe condutas, incluindo prescrever medicação, agendar cirurgia e planejar internação. Em casos retrospectivos reais, a MIRA superou clínicos experientes, aderindo a padrões de segurança e diretrizes.

Cinco dias depois eu escrevo isto, e a pergunta que importa não é “a IA vai substituir o médico?”. Essa pergunta é preguiçosa. A pergunta que importa para quem opera no chão do hospital é: o que acontece quando a tecnologia que age sozinha encontra uma legislação desenhada para impedir que ela aja sozinha? Essa legislação já existe no Brasil, e seu nome é Resolução CFM 2.454/2026.

O Que a MIRA Realmente Fez

A leitura honesta do artigo separa o sinal do ruído. A MIRA não é um oráculo. Os próprios autores são explícitos: o agente não substitui equipe humana especializada e não atingiu perfeição em todas as escolhas terapêuticas — a seleção de antibióticos específicos foi um dos pontos de falha. Eric Topol, comentando o achado, situou-o ao lado da AMIE como marco da “IA agêntica” em medicina, com a mesma ressalva: supervisão humana estrita e salvaguardas em nível de paciente continuam sendo a condição de existência dessas ferramentas.

Traduzindo para o beira-leito

A MIRA é o residente brilhante de primeiro ano que conhece a literatura inteira, acerta o raciocínio na maioria das vezes — e ainda assim você não deixa prescrever vancomicina sozinho às três da manhã. A diferença é que esse “residente” escala para milhares de leitos simultâneos. É justamente a escala que transforma um erro pontual de antibiótico em problema de saúde pública.

⚠ O que NÃO se deve concluir do paper

Superar clínicos em casos retrospectivos simulados não é o mesmo que segurança prospectiva à beira-leito. Casos retrospectivos têm desfecho conhecido e ruído controlado; o plantão real é ambíguo, dinâmico e tem custo assimétrico de erro. O dado é promissor — não é licença de deploy autônomo.

A Colisão: MIRA × CFM 2.454/2026

Em 11 de fevereiro de 2026 o Conselho Federal de Medicina publicou a Resolução nº 2.454/2026 (DOU de 27/02/2026), com vigência a partir de 26 de agosto de 2026 — 180 dias depois. Ou seja: quando a MIRA apareceu na Nature, o Brasil já tinha, no papel, a moldura jurídica que define o que dela é utilizável aqui. A tabela abaixo cruza, capacidade por capacidade, o que a MIRA faz com o que a resolução exige.

Capacidade da MIRA O que a CFM 2.454 exige Veredito
Coleta autônoma de história clínica Apoio à decisão; transparência ao paciente sobre uso de IA Compatível com supervisão e informação ao paciente
Solicita e interpreta exames Julgamento crítico do médico sobre cada output Compatível se houver revisão médica documentada
Gera diagnósticos diferenciais Decisão final e responsabilidade integral humana Condicional — vedada a comunicação autônoma
Prescreve, agenda cirurgia e interna autonomamente Vedada a delegação de decisões terapêuticas sem mediação humana Incompatível — risco alto a inaceitável

O veredito é nítido: a MIRA, do jeito que o paper a descreve, é incompatível com o deploy clínico brasileiro — não por mérito técnico, mas pelo grau de autonomia. O que sobrevive aqui é a MIRA rebaixada a copiloto, com o médico no laço em cada decisão de conduta.

Onde a MIRA Cairia na Classificação de Risco

Os Arts. 12 e 13 da resolução estabelecem quatro níveis de risco — baixo, médio, alto e inaceitável — e obrigam a instituição (não o fornecedor) a classificar e documentar o sistema. Os critérios incluem grau de autonomia do modelo, criticidade do contexto e nível de intervenção humana no resultado. Um agente que executa condutas sem revisão obrigatória é precisamente o que a norma desenha no topo da pirâmide.

⚠ Ponto crítico: a classificação é obrigação sua

Se você usa hoje qualquer sistema de apoio à decisão clínica sem ter feito a avaliação formal de risco, está operando fora da conformidade a partir de 26/08/2026 — independentemente do que o fornecedor afirme sobre o produto. A MIRA importada “as is” não seria um sistema de médio risco gerenciável: sem o rebaixamento de autonomia, ela é uso vedado.

A “Supervisão Significativa” é o Verdadeiro Trabalho

O conceito mais subestimado da resolução é o de supervisão significativa. Ele inverte o ônus da prova da segurança: não basta o fornecedor dizer “tem humano no laço”; é preciso provar que o humano tem condições reais de revisar — tempo, interface, contexto clínico e capacidade de auditar o que a IA propôs.

E aqui a evidência clínica recente joga contra a fantasia da automação total. A Nature Medicine mostrou em 2026 que LLMs generalistas de fronteira superaram ferramentas clínicas especializadas em conhecimento, alinhamento e queries do mundo real — o gargalo já não é a capacidade bruta do modelo. Em paralelo, estudos de raciocínio clínico mostram que esses mesmos modelos despencam em testes de concordância de script, que medem como o clínico atualiza a decisão diante de informação nova e ambígua. O modelo brilha na múltipla escolha e tropeça no raciocínio incremental do beira-leito — precisamente o terreno do intensivista.

O Buraco Pediátrico

O delta que poucos veem

A MIRA foi avaliada majoritariamente em populações adultas. A literatura é explícita sobre o buraco pediátrico: a variabilidade fisiológica por faixa etária, as diferenças de apresentação e a escassez de datasets de qualidade tornam a terapia intensiva pediátrica o último território a ser “automatizado” com segurança.

Para quem atua em UTI pediátrica e pós-operatório cardíaco, isso não é limitação acadêmica distante — é a garantia de que, por anos, o agente será no máximo um copiloto. E o piloto que sabe construir e auditar o copiloto será o profissional insubstituível.

A Linha do Tempo

Da publicação da norma ao agente autônomo

Por que a coincidência de calendário entre a MIRA e a CFM 2.454 não é fortuita.

11–27/02/2026
CFM 2.454/2026 publicada
Aprovada em 11/02; publicada no DOU em 27/02. Vacatio legis de 180 dias.
17/06/2026 · Você está aqui
MIRA publicada na Nature
Agente autônomo supera clínicos em prontuário simulado — cinco dias antes deste artigo. Janela de adaptação ainda aberta.
26/08/2026
Vigência plena da CFM 2.454
Todos os deveres tornam-se exigíveis ética e disciplinarmente. Agentes autônomos sem revisão médica passam a ser uso vedado.
Após
Fiscalização dos CRMs
Conselhos Regionais iniciam supervisão ativa. A dupla conformidade CFM + ANVISA é o cenário real para sistemas de alto risco.

O Que Fazer na Segunda-Feira

Da teoria regulatória à conduta de plantão

Migre da “IA informal” para a IA institucional. O ChatGPT pessoal no celular durante a visita morre com a 2.454. Sobrevive a IA corporativa, rastreável, com registro de quem propôs o quê e quem decidiu.
Desenhe a interface de supervisão, não só o modelo. A conformidade não está no algoritmo — está na tela em que o médico revisa. Tempo, contexto e trilha de auditoria são requisitos de produto.
Documente o diferencial humano. Onde o modelo erra (antibiótico específico, raciocínio incremental, pediatria) é onde o médico agrega valor mensurável. Registrar isso constrói a defesa ética e jurídica do seu serviço.
Classifique e documente o risco de cada sistema em uso. Antes de 26/08, com base nos critérios do Art. 12. Sem essa avaliação formal, você está fora da conformidade independentemente do fornecedor.

Entenda a IA Agêntica e a CFM 2.454 na Profundidade que Elas Merecem

A metodologia AIMED forma médicos que usam IA com rigor crítico, consciência regulatória e aplicação clínica real — incluindo governança e conformidade na prática, com framework de implementação e casos aplicados.

Conheça o AIMED →

Considerações Finais

A MIRA não é uma ameaça ao médico brasileiro. É um espelho. Ela mostra exatamente o que a máquina já faz melhor — e, por contraste, ilumina o que continua sendo nosso: a decisão sob incerteza, a responsabilidade pelo paciente concreto e a capacidade de auditar a própria ferramenta.

A Resolução 2.454 não freou o futuro; apenas exigiu que o futuro tenha um nome assinado embaixo. E esse nome, por lei e por mérito, continua sendo o do médico.

💡 Connecting the Dots: a coincidência de calendário é estratégica. A MIRA prova que a autonomia técnica chegou; a 2.454 garante que a responsabilidade jurídica não se automatiza junto. O valor profissional migra da execução clínica (que a máquina copia) para a governança da máquina — quem sabe classificar o risco, projetar a supervisão significativa e auditar o agente. A próxima vantagem competitiva do intensivista não é diagnosticar mais rápido que a IA; é ser a autoridade que a IA precisa para ter permissão de existir no hospital.

Referências

  1. Ferber D, et al. Towards autonomous medical artificial intelligence agents. Nature. 2026 jun 17. Disponível em: https://www.nature.com/articles/s41586-026-10675-5
  2. Conselho Federal de Medicina. Resolução CFM nº 2.454, de 11 de fevereiro de 2026. DOU 2026 fev 27; Ed. 39, Seção 1, p. 158. Disponível em: https://sistemas.cfm.org.br/normas/arquivos/resolucoes/BR/2026/2454_2026.pdf
  3. Topol E. Agentic AI Comes to Medicine. Ground Truths. 2026. Disponível em: https://erictopol.substack.com/p/agentic-ai-comes-to-medicine
  4. General-purpose large language models outperform specialized clinical AI tools on medical benchmarks. Nature Medicine. 2026. Disponível em: https://www.nature.com/articles/s41591-026-04431-5
  5. Assessment of Large Language Models in Clinical Reasoning (Script Concordance Testing). NEJM AI. 2026. Disponível em: https://ai.nejm.org/doi/full/10.1056/AIdbp2500120
  6. Assessing the Capability of LLMs in Answering Pediatric Critical Care Board-Style Questions. PMC/NCBI. 2025–26. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC12637821/

DEIXE UM COMENTÁRIO

Campos obrigatórios são marcados com *