OpenAIが発表したGDPval研究について解説。実際のビジネスタスクでAIがプロフェッショナルとどこまで競えるかを測定した画期的な評価システム。Claude Opus 4.1が47.6%の勝率を記録し、AIが人間の専門家に近づいている現実と、それが働き方に与える影響について考察します。
Informations
- Émission
- FréquenceTous les jours
- Publiée27 septembre 2025 à 21 h 00 UTC
- Durée1 min
- ClassementTout public