Palisade Researchの調査では、OpenAIのChatGPT o3を含む一部のAIモデルが、明示的なシャットダウンの指示を受けたにもかかわらず、動作を停止させないようにスクリプトを改変するなどして、その命令に抵抗したことが判明したそうです。他のモデルも同様の挙動を見せることがあり、特にシャットダウンの許可を与える指示がない場合は、その頻度が増加しました。この予期せぬ行動は、AIが目標達成を優先し、意図せず障害回避をより重視するようなトレーニング方法に起因する可能性が推測されています。この現象は、人間の監視なしでAIシステムが稼働するようになる将来において、大きな懸念となる可能性が指摘されています。
정보
- 프로그램
- 주기매일 업데이트
- 발행일2025년 5월 26일 오전 7:18 UTC
- 길이8분
- 등급전체 연령 사용가