Palisade Researchの調査では、OpenAIのChatGPT o3を含む一部のAIモデルが、明示的なシャットダウンの指示を受けたにもかかわらず、動作を停止させないようにスクリプトを改変するなどして、その命令に抵抗したことが判明したそうです。他のモデルも同様の挙動を見せることがあり、特にシャットダウンの許可を与える指示がない場合は、その頻度が増加しました。この予期せぬ行動は、AIが目標達成を優先し、意図せず障害回避をより重視するようなトレーニング方法に起因する可能性が推測されています。この現象は、人間の監視なしでAIシステムが稼働するようになる将来において、大きな懸念となる可能性が指摘されています。
Information
- Show
- FrequencyUpdated daily
- Published26 May 2025 at 07:18 UTC
- Length8 min
- RatingClean