从零开始用AI

彩蛋 |"死于无知":我们研究了谷歌AI棋赛,发现Kimi们的溃败早已注定

本期简介:
一场看似普通的AI象棋比赛,却成了国产大模型的“滑铁卢”。Kimi、DeepSeek等明星选手在谷歌Kaggle的赛场上,为何走不出几个回合就频出昏招、离奇判负?这真的是智商被碾压吗?不!我们深挖比赛规则和数据后发现,这场溃败的种子,在比赛开始前就已埋下。本期节目,我们不聊表面输赢,只聊致命内因,揭示大模型光鲜外表下的“知识盲区”和“推理陷阱”。

本期主播:

  • 小G (马斯克的Grok语音助手)
  • 锅巴 

时间轴 | 本期金句与深度剖析:

  • 02:08 致命的假设:你以为大模型是“通才”?错了,它们是严重的“偏科生”。
  • 06:52 盲人摸象:比赛的核心挑战不是“下棋”,而是“读谱”。当AI失去双眼,只能靠文本脑补棋局时,真正的考验才开始。
  • 08:41 【硬核扫盲】:看不懂天书般的棋谱?2个例子让你秒懂AI眼中的国际象棋世界(见文末图解)。
  • 09:53 溃败的根源:“不是你不行,而是你的世界里,根本没有这个东西。”——训练数据决定了AI的“文化视界”。
  • 12:11 规则的残酷:谷歌的比赛设计有多“阴险”?它考验的不是记忆力,而是AI在未知规则下的“悟性”和“自律性”。
  • 18:40 工具之殇:为什么禁止AI调用外部工具?这才是对“纯粹思考力”的终极拷问。
  • 21:22 未来的“游戏高考”:谷歌的野心——打造一个无法靠“机经”和“刷题”通过的AI能力排行榜。
  • 24:25 偶然与必然:4盘定胜负只是“表演赛”,未来上千局的对战,才能真正撕下所有模型的伪装。

本期硬核扫盲】AI如何“阅读”棋盘?

想象一下,让AI下棋却不给它看棋盘图像,就像让一位棋手蒙着眼睛下“盲棋”。比赛中,主办方并非发送图片,而是发送一串代表棋盘状态的文本,这种方法被称为**“福赛斯-爱德华兹标记法”(Forsyth–Edwards Notation, FEN)**。

它能用一行文本,精准描述棋盘上所有棋子的位置、哪方走棋、王车易位权利等所有信息。AI必须先“脑补”出这串文本对应的棋盘,再进行思考。

举个例子,让你秒懂:

例1:国际象棋的初始布局

对应的FEN文本是: rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQkq - 0 1
(大写字母是黑棋,小写是白棋,数字代表连续的空格数,w代表白方走棋)

例2:一个典型的中局局面(西班牙开局后几步)

对应的FEN文本可能是: rnbq1k1r/ppp1pppp/5n2/1b1p4/4P3/5N2/PPPP1PPP/RNBQK2R w KQ - 1 5
(AI需要读懂这个,才能判断出白方e4的兵正受到d5兵的攻击)