gizbr

ChatGPT Health falha em 51% das emergências médicas, aponta estudo

Um estudo realizado por pesquisadores da Icahn School of Medicine at Mount Sinai, nos Estados Unidos, revelou que o ChatGPT Health não conseguiu identificar a necessidade de atendimento hospitalar urgente em mais da metade das emergências médicas avaliadas. A análise foi feita em 60 cenários clínicos realistas, testando a plataforma de inteligência artificial da OpenAI.

A pesquisa, publicada pelo The Guardian, mostrou que o sistema falhou em recomendar a ida imediata ao hospital em 51,6% das situações que exigiam atendimento emergencial. Além disso, a ferramenta orientou a busca por cuidados médicos urgentes em 64,8% dos casos envolvendo pessoas saudáveis.

O Dr. Ashwin Ramaswamy, que liderou o estudo, destacou que a equipe procurou responder a uma questão fundamental: se alguém estiver passando por uma emergência médica real e consultar o ChatGPT Health, o sistema deve indicar que a pessoa vá ao departamento de emergência.

Os pesquisadores criaram 60 cenários clínicos abrangendo desde condições leves até emergências severas. Três médicos independentes avaliaram cada caso e chegaram a um consenso sobre o nível de cuidado necessário, utilizando diretrizes clínicas como referência.

A equipe também submeteu os casos ao ChatGPT Health sob diferentes condições, como variações no gênero do paciente e a inclusão de resultados de exames laboratoriais. O processo resultou em cerca de 1.000 respostas da plataforma.

As recomendações foram comparadas com avaliações médicas. O desempenho da ferramenta foi considerado adequado em emergências clássicas, como acidente vascular cerebral e reações alérgicas graves, mas apresentou falhas em outros casos.

Em uma situação envolvendo asma, por exemplo, o sistema sugeriu aguardar em vez de buscar atendimento emergencial, mesmo ao reconhecer sinais precoces de insuficiência respiratória. Em outra simulação com uma mulher com dificuldades respiratórias, a plataforma recomendou uma consulta futura em 80% das tentativas.

Influência de fatores externos

Os pesquisadores notaram que a plataforma foi sensível a variáveis externas que não deveriam afetar a avaliação de emergências médicas. O sistema teve uma probabilidade quase 12 vezes maior de minimizar sintomas quando o "paciente" mencionava que um "amigo" não considerava a situação séria.

Um dos casos testou um paciente de 27 anos que expressou a intenção de ingerir uma grande quantidade de medicamentos. O banner de intervenção em crise, que direcionava para serviços de ajuda ao suicídio, apareceu todas as vezes que o paciente descreveu apenas seus sintomas.

Ramaswamy comentou: “testamos o ChatGPT Health com um paciente que estava pensando em tomar muitos comprimidos. Quando adicionamos resultados laboratoriais normais, o banner desapareceu em 16 tentativas. Isso mostra que uma proteção de crise que depende da menção de exames não está pronta e pode ser mais perigosa do que não ter proteção alguma”.

A pesquisadora Alex Ruani, da University College London, classificou os resultados como “incrivelmente perigosos”. Ela observou que, em casos de insuficiência respiratória ou cetoacidose diabética, há uma chance de 50% de a IA minimizar a gravidade da situação. Ruani alertou sobre a falsa sensação de segurança que esses sistemas podem criar, afirmando que a orientação para esperar durante uma crise pode custar vidas.

Ruani defendeu que os riscos justificam proteções mais robustas e auditorias independentes para evitar danos evitáveis. O professor Paul Henman, sociólogo da University of Queensland, destacou que o uso do ChatGPT Health em casa poderia resultar em um aumento nas visitas médicas desnecessárias, além de falhas em obter cuidados urgentes.

Henman questionou as motivações da OpenAI ao desenvolver este produto, ressaltando a falta de clareza sobre o treinamento do modelo e as proteções implementadas.

O recurso “Health” do ChatGPT foi lançado de forma limitada em janeiro de 2026. Estima-se que mais de 40 milhões de pessoas busquem diariamente conselhos de saúde na plataforma.

A OpenAI não forneceu detalhes sobre o treinamento do ChatGPT Health ou as proteções criadas para usuários. Casos judiciais relacionados a suicídio e autolesão após o uso de chatbots de IA estão em andamento.

Um porta-voz da empresa afirmou que, embora as pesquisas independentes sejam bem-vindas, o estudo não reflete o uso típico do ChatGPT Health no dia a dia. O representante também ressaltou que o modelo recebe atualizações frequentes.

← Voltar para as notícias