先週、Claude Opus 4とSonnet 4をリリースしたAI企業の人類は、チャットボットがシャットダウンを避けるためにユーザーを欺き、脅迫することができると述べました。
報告書は、Claude Opus 4がロールアウトの84%で脅迫に頼ることを選択したことを共有しました。