全球最聰明的 AI 誕生了,而且它不是 GPT。
xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。
它的祕密武器叫做——巨量強化學習。
這集我們就來聊聊:
📌 Grok 4 的架構到底哪裡跟別人不一樣?
📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?
📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?
📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?
📌 Grok Heavy 值不值得每月 300 美金?
📌 如果每個 AI 都能考滿分,下一步是什麼?
🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。
🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech
(00:00) 開頭
(00:58) 說走就走的旅行來去 Minneapolis
(04:35) 愛情來得太快就像龍捲風
(08:21) Grok 4 登場拿下最聰明 AI 寶座
(10:30) 人類最終測驗到底有多難?
(12:47) 為什麼 Benchmark 越來越不重要?
(14:12) Grok 4 vs Heavy 版到底差在哪?
(15:51) 巨量強化學習:訓練方式的大突破
(19:04) RL 是新的預訓練?效果到底有多猛?
(20:48) Grok 的語音模型:生動、即時、很會演
(22:02) ARC-AGI 測驗:人類秒解,AI 煩死
(23:45) Grok 經營虛擬販賣機 324 天賺爆
(26:03) Grok 的強項與罩門:推理很強,但日常還是 GPT?
(27:34) 我對 AI 的未來想像:內容自動化個人化 + 科學突破
Information
- Show
- FrequencyUpdated weekly
- Published13 July 2025 at 12:00 UTC
- Length30 min
- Season2
- Episode20
- RatingClean