Estados Unidos

Guerra Fria da IA: empresas dos EUA acusam chinesas de roubo

Ataques de destilação têm como objetivo coletar respostas de modelos de IA para treinar sistemas menores e mais econômicos.

Em um cenário de competição acirrada entre Estados Unidos e China no desenvolvimento da inteligência artificial, a empresa norte-americana Anthropic levantou alarmes sobre o suposto roubo de tecnologia por parte de empresas chinesas. As empresas DeepSeek, Moonshot AI e MiniMax estariam, segundo a Anthropic, utilizando mais de 24 mil contas falsas para gerar mais de 16 milhões de interações com o chatbot Claude, a fim de extrair conhecimento e treinar seus próprios modelos.

A OpenAI e a Google também expressaram preocupações semelhantes, alertando que empresas chinesas podem estar acelerando anos de pesquisa custosa em IA.

O que é a destilação de IA?

Os ataques de extração de modelos, conhecidos como "destilação", envolvem o uso de um modelo de IA avançado para treinar uma versão concorrente mais barata e rápida. A técnica consiste em enviar uma grande quantidade de perguntas ao modelo maior, coletar as respostas e utilizá-las para ensinar um novo modelo a raciocinar de maneira similar.

O usuário interage com o modelo maior e usa as respostas obtidas para treinar o modelo menor, permitindo um desenvolvimento mais ágil e a "um custo reduzido" em comparação ao desenvolvimento do zero, conforme indicado pela Anthropic.

Riscos associados a modelos destilados

A destilação é considerada "legítima" quando realizada por laboratórios de IA que criam versões menores para atender seus clientes, segundo a empresa. Modelos menores respondem mais rapidamente e consomem menos recursos computacionais.

Entretanto, os modelos gerados através da destilação podem representar riscos significativos para a segurança nacional, já que não possuem as proteções necessárias para evitar o uso mal-intencionado em armas biológicas ou ciberataques. A Anthropic destacou que esses modelos carecem de salvaguardas que impeçam seu uso indevido.

A Google afirmou que os ataques de destilação não representam riscos diretos para usuários comuns, pois não comprometem a confidencialidade ou integridade dos serviços de IA.

Atividades da DeepSeek

Em fevereiro, a OpenAI informou autoridades dos EUA que a DeepSeek estava tentando replicar seus modelos de IA de forma clandestina, desenvolvendo métodos para ocultar suas ações.

As empresas chinesas teriam utilizado endereços proxy para gerenciar uma ampla "rede hidra" de contas falsas, permitindo acesso à Anthropic, que é proibida na China. Uma vez dentro, geraram um volume substancial de pedidos para obter respostas de alta qualidade, além de criar tarefas de aprendizado por reforço.

As contas da DeepSeek questionavam o Claude sobre como justificava suas respostas, o que, segundo a Anthropic, "gerou em larga escala dados de treinamento de raciocínio".

A empresa norte-americana sugere que as contas da DeepSeek também usaram o Claude para gerar respostas "seguras" em relação a perguntas sensíveis, como questões sobre opositores do Partido Comunista Chinês.

Conclusões sobre a censura e os modelos chineses

A Anthropic acredita que esses pedidos ajudaram a treinar os modelos da DeepSeek para evitar tópicos censurados, corroborando um estudo que indica que modelos de IA chineses tendem a censurar os mesmos assuntos que os meios de comunicação do país.

As empresas MiniMax AI e Moonshot AI teriam realizado campanhas de destilação ainda mais amplas, mas a Anthropic não forneceu detalhes sobre as informações específicas que elas coletaram.

A Google observou que seu chatbot Gemini tem sido utilizado indevidamente para tarefas de programação e para coletar informações sensíveis, como credenciais de contas.

A Anthropic desenvolveu mecanismos de detecção para identificar essas campanhas, mas enfatiza que nenhuma empresa de IA pode resolver a questão sozinha.

← Voltar para as notícias