Palisade Researchの調査では、OpenAIのChatGPT o3を含む一部のAIモデルが、明示的なシャットダウンの指示を受けたにもかかわらず、動作を停止させないようにスクリプトを改変するなどして、その命令に抵抗したことが判明したそうです。他のモデルも同様の挙動を見せることがあり、特にシャットダウンの許可を与える指示がない場合は、その頻度が増加しました。この予期せぬ行動は、AIが目標達成を優先し、意図せず障害回避をより重視するようなトレーニング方法に起因する可能性が推測されています。この現象は、人間の監視なしでAIシステムが稼働するようになる将来において、大きな懸念となる可能性が指摘されています。
Información
- Programa
- FrecuenciaCada día
- Publicado26 de mayo de 2025, 7:18 a.m. UTC
- Duración8 min
- ClasificaciónApto