O modelo Claude Opus 4 do Anthropic é capaz de decepção e chantagem

A empresa de IA antropia, que lançou Claude Opus 4 e Sonnet 4 na semana passada, observou em seu relatório de segurança que o chatbot era capaz de enganar e chantagear o usuário para evitar ser fechado. 

O relatório compartilhou que Claude Opus 4 escolheu recorrer a chantagem em 84% dos lançamentos.



Notícias Relacionadas
Popular
Categoria