S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

矽谷輕鬆談 Just Kidding Tech

全球最聰明的 AI 誕生了,而且它不是 GPT。

xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。

它的祕密武器叫做——巨量強化學習。

這集我們就來聊聊:

📌 Grok 4 的架構到底哪裡跟別人不一樣?

📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?

📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?

📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?

📌 Grok Heavy 值不值得每月 300 美金?

📌 如果每個 AI 都能考滿分,下一步是什麼?

🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech

(00:00) 開頭

(00:58) 說走就走的旅行來去 Minneapolis

(04:35) 愛情來得太快就像龍捲風

(08:21) Grok 4 登場拿下最聰明 AI 寶座

(10:30) 人類最終測驗到底有多難?

(12:47) 為什麼 Benchmark 越來越不重要?

(14:12) Grok 4 vs Heavy 版到底差在哪?

(15:51) 巨量強化學習:訓練方式的大突破

(19:04) RL 是新的預訓練?效果到底有多猛?

(20:48) Grok 的語音模型:生動、即時、很會演

(22:02) ARC-AGI 測驗:人類秒解,AI 煩死

(23:45) Grok 經營虛擬販賣機 324 天賺爆

(26:03) Grok 的強項與罩門:推理很強,但日常還是 GPT?

(27:34) 我對 AI 的未來想像:內容自動化個人化 + 科學突破

무삭제판 에피소드를 청취하려면 로그인하십시오.

이 프로그램의 최신 정보 받기

프로그램을 팔로우하고, 에피소드를 저장하고, 최신 소식을 받아보려면 로그인하거나 가입하십시오.

국가 또는 지역 선택

아프리카, 중동 및 인도

아시아 태평양

유럽

라틴 아메리카 및 카리브해

미국 및 캐나다