S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

矽谷輕鬆談 Just Kidding Tech

全球最聰明的 AI 誕生了,而且它不是 GPT。

xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。

它的祕密武器叫做——巨量強化學習。

這集我們就來聊聊:

📌 Grok 4 的架構到底哪裡跟別人不一樣?

📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?

📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?

📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?

📌 Grok Heavy 值不值得每月 300 美金?

📌 如果每個 AI 都能考滿分,下一步是什麼?

🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech

(00:00) 開頭

(00:58) 說走就走的旅行來去 Minneapolis

(04:35) 愛情來得太快就像龍捲風

(08:21) Grok 4 登場拿下最聰明 AI 寶座

(10:30) 人類最終測驗到底有多難?

(12:47) 為什麼 Benchmark 越來越不重要?

(14:12) Grok 4 vs Heavy 版到底差在哪?

(15:51) 巨量強化學習:訓練方式的大突破

(19:04) RL 是新的預訓練?效果到底有多猛?

(20:48) Grok 的語音模型:生動、即時、很會演

(22:02) ARC-AGI 測驗:人類秒解,AI 煩死

(23:45) Grok 經營虛擬販賣機 324 天賺爆

(26:03) Grok 的強項與罩門:推理很強,但日常還是 GPT?

(27:34) 我對 AI 的未來想像:內容自動化個人化 + 科學突破

To listen to explicit episodes, sign in.

Stay up to date with this show

Sign in or sign up to follow shows, save episodes and get the latest updates.

Select a country or region

Africa, Middle East, and India

Asia Pacific

Europe

Latin America and the Caribbean

The United States and Canada