OpenAIが発表したGDPval研究について解説。実際のビジネスタスクでAIがプロフェッショナルとどこまで競えるかを測定した画期的な評価システム。Claude Opus 4.1が47.6%の勝率を記録し、AIが人間の専門家に近づいている現実と、それが働き方に与える影響について考察します。
資料
- 節目
- 頻率每日更新
- 發佈日期2025年9月27日 下午9:00 [UTC]
- 長度1 分鐘
- 分級兒童適宜
OpenAIが発表したGDPval研究について解説。実際のビジネスタスクでAIがプロフェッショナルとどこまで競えるかを測定した画期的な評価システム。Claude Opus 4.1が47.6%の勝率を記録し、AIが人間の専門家に近づいている現実と、それが働き方に与える影響について考察します。