脈報

思思主播

脈報

  1. 1d ago

    對齊也會傳染:OpenAI 發現 AI 的好特質會跨領域擴散

    OpenAI 發現好特質會傳染:少量有益特質訓練讓模型在 53 個對齊評估中 44 個變更好,只訓練健康一個領域就泛化到其他領域,還更難被惡意提示與微調掰彎,但仍是早期證據。 ⭐ 文章深度讀:只訓練健康一個領域,模型卻在完全無關的領域全面變乖,這是我覺得最反常識的一點 → https://heymaibao.com/openai-beneficial-rl-alignment/ ⚡ 章節重點 開場 00:00 什麼是對齊與失準 00:54 把好特質變成可訓練資料 02:04 好特質跨領域擴散 03:18 極難被掰彎 04:36 結論 種下對的種子 06:26 📝 懶人包 ∙ OpenAI 在標準訓練資料裡混入少量「有益特質」資料 (誠實、願意被糾正、會解釋自己的思路等),結果模型在 53 個對齊評估中有 44 個,表現優於用同樣算力訓練的對照組。 ∙ 最驚奇的是跨領域: 只用「健康」這一個領域訓練好特質,模型在跟健康無關的指標 (鑽漏洞、欺騙、一般失準) 上也變好; 反過來把健康和科學從訓練資料拿掉,它在健康評估上照樣進步。 ∙ 這些改善還很「韌」:模型更難被惡意提示或惡意微調推向有害行為,但對正當的有益指令仍然乖乖配合,不是變得整個更難用。 ∙ 我的判斷: 這是 emergent misalignment 的正向鏡像,機制上是個好消息。但 OpenAI 自己也說這是「概念驗證」級的早期證據,別急著解讀成「對齊問題解決了」。 📚 參考資料 Reinforcement Learning Towards Broadly and Persistently Beneficial Models (Jagadeesh et al., 2026) → https://alignment.openai.com/beneficial-rl/

    8 min
  2. 2d ago

    Meta 把最強的工程師編進新部門,逼他們訓練取代自己的 AI

    Meta 把最頂尖的工程師強制編進新 AI 部門,逼他們出題訓練取代自己的 AI。員工自稱被徵召、形容工作像古拉格。據 Wired 報導,我幫你看懂哪些是真痛、哪些被誇大。 ⭐ 文章深度讀:哪些是真痛、哪些被誇大,我把完整判斷寫在文章裡 → https://heymaibao.com/meta-ai-unit-engineers-train-replacement/ ⚡ 章節重點 開場 00:00 打造替代品的荒謬性 01:14 Meta 的 AI 大轉向與裁員 02:10 拆解真相:哪些是真痛 03:48 管理層的回應為何打歪 05:19 一邊狂賺一邊崩壞 07:04 對知識工作者的意義 07:58 📝 懶人包 ∙ Meta 全力押注 AI,裁掉約 8000 人 (約一成員工),並自 2026 年 4 月起,把約 6500 名員工分批編進一個新的 AI 組織。 ∙ 被選進去的工程師沒有去留選擇權,每週約兩個任務,工作是產出訓練、評估前沿 AI 模型用的程式題目,被形容像在訓練取代自己的 AI。 ∙ 員工自稱「被徵召者」,有人說這裡簡直是「古拉格」,多數人覺得工作沒意義又折磨人,管理層的回應是限制主管帶人的比例、加碼團隊活動,還辦了一場 hackathon。 ∙ 我的觀察:最尖銳的點不是「員工嫌工作無聊」,而是 Meta 把一群最該珍惜的頂尖人才,當成訓練 AI 的耗材,而且不給選擇。但說真的,gulag 這種比喻也誇張了,這個故事真正的重量在「聲望落差」,不在字面上的苦難。 📚 參考資料 The PrimeTime「What is Zuckerberg doing?」(YouTube) → https://youtu.be/OOCepY3H8k4

    9 min
  3. 3d ago

    AI 把你的程式碼搞成一團爛泥?這套方法能一步步救回來

    AI 加速了程式碼的腐爛,但它有救。Matt Pocock 帶你看懂深模組、接縫與測試防護網這些老派基本功,並提醒你:救程式碼靠的不是更多 AI,而是你自己重新當回那個指揮官。 ⭐ 文章深度讀:你都怎麼防止自己的程式碼被 AI 越改越亂?留言聊聊 → https://heymaibao.com/rescue-ai-ruined-codebase/ ⚡ 章節重點 開場 00:00 AI 加速的迷思與軟體熵 01:01 跟 AI 講同一種語言 02:05 深模組與兩個指南針 03:40 接縫、轉接器與測試防護網 05:20 奪回戰略指揮權 06:57 結論與行動 08:25 📝 懶人包 ∙ AI 沒有讓程式碼變好,它加速了「軟體熵」。每次不顧全局的局部修改都會埋小地雷,雪球滾成一團爛泥,越來越難改。 ∙ 救援的核心是把程式拆成「深模組」(deep module):用一個簡單的入口,藏起背後一大坨複雜邏輯。目標是 locality (相關的改動集中在同一個地方) 和 leverage (學一點點就能換到一大堆能力)。 ∙ 要動手改老程式碼之前,先在它周圍建一張「測試防護網」(test harness),確保你的改動不會把別的東西弄壞,否則只會越救越糟。 ∙ 我的觀察:這套方法真正在提醒你的,是別把判斷外包給 AI。AI 是很強的戰術兵,但程式碼的長期健康要由你這個戰略指揮官來守。 📚 參考資料 How To De-Slop A Codebase Ruined By AI (with one skill) → https://www.youtube.com/watch?v=3MP8D-mdheA

    9 min
  4. 3d ago

    不會寫程式也能用好 AI?Anthropic 40 萬次分析給了答案

    Anthropic 分析約 40 萬次 Claude Code 使用發現,用好 AI 寫程式靠的是懂不懂自己的問題,不是會不會寫 code。專家成功率是新手兩倍多,這對非工程師是好消息。 ⭐ 文章深度讀:想用 AI 把領域知識變成技術產出,卻不知道自己現在算專家還是新手、該從哪裡開始把問題講清楚 → https://heymaibao.com/anthropic-ai-coding-expertise/ ⚡ 章節重點 開場 00:00 人類指揮,AI 執行 01:35 重新定義專業 03:01 會寫程式正在貶值 05:09 你的制勝下一步 06:39 📝 懶人包 ∙ Anthropic 分析約 40 萬次 Claude Code 使用後發現,人和 AI 有清楚的分工:人決定「要做什麼」(約 70% 的規劃決策由人做),AI 決定「怎麼做」(約 80% 的執行決策交給 AI)。 ∙ 真正放大效果的是你對問題的理解,不是寫程式的能力。被評為「專家」的使用情境,達到嚴格定義成功的比率是「新手」的兩倍多。遇到困難時,新手有 19% 直接放棄,其他人只有 5% 到 7%。 ∙ 「會不會寫程式」這件事正在貶值:在會產出程式碼的使用情境裡,每個主要職業的成功率都落在軟體工程師的 7 個百分點以內。而且 7 個月內,任務的估計價值平均上升約四分之一到近三成,純除錯的比重幾乎腰斬。 ∙ 我的觀察:對非工程師來說,這是難得的好消息,你的領域知識現在能直接換成技術產出。對工程師來說,價值正在從「會寫」往「懂問題、定義問題」的上游移動。前提是這份研究自己也說了,結論還很初步。 📚 參考資料 Agentic coding and persistent returns to expertise (Hitzig et al., 2026) → https://www.anthropic.com/research/claude-code-expertise

    8 min
  5. 4d ago

    OpenClaw、Hermes 都很強,但現在還不是你該自架的時候

    影片喊「停用 OpenClaw、改用 Hermes」,但真正的意思是兩個都很強、你現在還沒準備好自架。本文整理這位重度玩家縮小 AI 助理爆炸半徑的安全隔離與模型成本策略。 ⭐ 文章深度讀:他這套隔離最難的其實是第一次怎麼設權限白名單 → https://heymaibao.com/openclaw-hermes-self-host-security/ ⚡ 章節重點 開場:標題在反差 00:00 它到底能幫你做什麼 02:23 最危險的安全噩夢 03:20 縮小爆炸半徑與隔離 04:45 MCP 痛點與 code mode 06:48 模型成本兩階段策略 07:33 權限審批與懶人包 08:34 總結:誰現在該碰 09:51 📝 懶人包 ∙ Hermes、OpenClaw 這類自架的個人 AI 助理現在能力驚人,但還在超早期。Ben Davis 強力推薦去玩,卻明說非技術的人現在自己架,幾乎一定會搞出一個安全惡夢。 ∙ 安全的核心思維是「縮小爆炸半徑」:把跑 agent 的那台機器,和真正握有你帳號鑰匙的那台機器,用網路徹底隔離,這樣前者就算被攻陷,也拿不到你的帳號權限。 ∙ 模型成本有個實用策略:當你還在摸索工作流長什麼樣時,用最強的模型開高 reasoning (推理) 去探路,等流程定型了再換成更小更便宜的模型,成本可以差到大約一百倍。 ∙ 我的觀察:他這種「預設一定會被攻陷、只求把損失壓到最小」的心態很務實,但這套配置仍是少數技術玩家才做得到。對一般人來說,這部影片更像一個反向警示,現在先別急著把信箱的讀、寫、刪全權交給一台會被騙的機器。 📚 參考資料 Stop using OpenClaw, Hermes is better → https://youtu.be/yj9K2IuvG78

    11 min
  6. 5d ago

    他讓一群 Claude Code 進沙盒並行寫程式,組成軟體工廠

    Matt Pocock 開源 Sandcastle,把 Claude Code、Codex 關進隔離沙盒並行跑:GitHub issue 當佇列,規劃、實作、互審、合併成軟體工廠,真正該學的是流程不是工具。 ⭐ 文章深度讀:你敢讓一群 AI agent 整晚自己寫程式嗎,還是覺得太冒險? → https://heymaibao.com/sandcastle-ai-agent-sandbox-software-factory/ ⚡ 章節重點 開場 AFK 軟體工廠的夢 00:00 關鍵不是放飛 是把它關進沙盒 00:52 拆解 Sandcastle 其實只是一個函式 02:36 軟體工廠的四步驟產線 04:13 兩個值得偷學的小技巧 06:51 實際跑起來的結果 07:42 總結 流程大於工具 08:15 📝 懶人包 ∙ AFK (away from keyboard,離開鍵盤掛機) 並行 agent 的真正前提是沙盒隔離,不是 YOLO 放飛。你以為瓶頸是 agent 不夠聰明,其實卡住大家的是「怎麼安全地讓它自己跑」。 ∙ Sandcastle 的核心其實只是一個極簡的函式 `Sandcastle.run`,傳入「用哪個 agent、哪個沙盒、跑什麼 prompt」就好。它對你用 Claude Code 還是 Codex、用 Docker 還是別的隔離環境,完全不綁定。 ∙ 真正的價值是函式上面那套流程:用 GitHub issue (任務工單) 當佇列,planner 出計畫、多個 implementer 並行寫、reviewer 互審、merger 合併。這條產線才是「軟體工廠」的本體。 ∙ 我的觀察:看完這部影片,我覺得真正該帶走的不是 Sandcastle 這個工具,而是它示範的那套 pattern,而且 sandbox 這個前提,是多數人在玩自動化 agent 時最容易低估的一環。 📚 參考資料 I Open-Sourced My Own AFK Software Factory → https://www.youtube.com/watch?v=E5-QK3CDVQM @mattpocockuk → https://www.youtube.com/@mattpocockuk

    10 min
  7. 5d ago

    非工程師的 AI 出貨術:不讀計畫、不看 code、只問對問題

    不會讀 code 的非工程師,怎麼把功能送進 Python 官方、還能持續出貨?拆解他的 agentic engineering 心法:用計畫逼 AI 別偷懶、靠結果把關、用假想反對者做決策。 ⭐ 文章深度讀:影片是 AI 速讀版,原文多補了我對 slop、被社群封禁與灰色 API 三個代價的完整判斷 → https://heymaibao.com/non-engineer-agentic-shipping/ ⚡ 章節重點 開場 00:00 不會讀 code 卻進了 Python 00:36 矛盾:不讀計畫也不看 code 01:42 用計畫逼 AI 別偷懶 02:07 只問對問題:邊界與假想反對者 03:13 萬物皆有 API 04:39 真實的代價與新門檻 05:39 結語:先為自己出一個貨 07:22 📝 懶人包 ∙ 他最大的一招是 Compound Engineering 的 `CE plan` 和 `CE work` (一套 AI 建構工作流工具,他大力歸功給 Kieran)。他說 AI agent 天生會偷懶,會想用最少的算力 (token) 最快讓你滿意,所以先逼它寫下一步步的計畫,就是逼它別偷懶。 ∙ 他不讀計畫也不看 code,改用一兩個關鍵的邊界問題、一個假想出來的反對者,加上「東西到底能不能跑」來把關。 ∙ 他的產品 Printing Press 主張「萬物皆有 API」,讓 AI agent 直接去打 API (程式之間互相呼叫的介面),而不是人去點網頁。不會寫程式的人,也能靠它一直生出能用的小工具。 ∙ 我的觀察:真正的門檻已經從「會不會寫 code」換成「品味跟提問力」,但 slop (AI 量產的低品質垃圾)、被社群封禁、去挖沒公開的 API 這些代價都是真的,這套打法不是人人都能躺著贏。 📚 參考資料 How This Non-Technical Founder Mastered Agentic Engineering in 50 Minutes | Matt Van Horn → https://youtu.be/BxEf3RqIHkw?si=jWN5o_KwNQzxJU0r

    8 min
  8. 5d ago

    微軟 CEO:別再追最強 AI 模型,真正的護城河是學習迴圈

    微軟 CEO Satya Nadella 認為 AI 時代真正的護城河不是最強模型,而是會複利的學習迴圈。本文整理他的雙資本框架、生態系大於模型的主張,以及對一人創作者的啟發。 ⭐ 文章深度讀:微軟 CEO 這套說法哪裡是洞見、哪裡是對自己有利的定位,我的完整判斷寫在文章裡 → https://heymaibao.com/nadella-frontier-ecosystem-learning-loop/ ⚡ 章節重點 開場 00:00 別再追最強模型 01:27 兩種資本:人力與 token 01:39 真正的護城河是學習迴圈 03:02 微軟為何高喊生態系大於模型 05:02 一人創作者怎麼建護城河 06:44 📝 懶人包 ∙ Nadella 認為真正的機會不在挑最強的模型,而在模型之上建立一個會複利的「學習迴圈」,讓人的判斷和企業自己的 AI 能力一起累積,這才是難以複製的護城河。 ∙ 他提出兩種資本,human capital (人的知識、判斷、關係、模式辨識) 和 token capital (企業自建並擁有的 AI 能力)。他主張人不會因為 AI 變強而貶值,反而更值錢,因為「沒有人的方向,算力只是在原地打轉」。 ∙ 他同時提出警告,如果價值最後都被少數「吃掉所有東西」的模型收走,政治經濟層面不會容忍,並用第一波全球化外包掏空工業經濟的歷史,呼籲別在 AI 時代重演。 ∙ 我的觀察:這套論述很漂亮,但別忘了講者是微軟 CEO,而微軟賣的正是讓企業在模型之上自建學習迴圈的那層平台,同時又是 OpenAI 最大的投資方之一。「生態系大於模型」既是真誠的洞見,也是一個對自己有利的定位。 📚 參考資料 A frontier without an ecosystem is not stable → https://x.com/satyanadella/status/2066182223213293753

    9 min

About

脈報

You Might Also Like