脈報

思思主播

0.0 (0)
Technology
Updated Daily

脈報

1d ago

對齊也會傳染：OpenAI 發現 AI 的好特質會跨領域擴散

OpenAI 發現好特質會傳染：少量有益特質訓練讓模型在 53 個對齊評估中 44 個變更好，只訓練健康一個領域就泛化到其他領域，還更難被惡意提示與微調掰彎，但仍是早期證據。 ⭐ 文章深度讀：只訓練健康一個領域，模型卻在完全無關的領域全面變乖，這是我覺得最反常識的一點 → https://heymaibao.com/openai-beneficial-rl-alignment/ ⚡ 章節重點開場 00:00 什麼是對齊與失準 00:54 把好特質變成可訓練資料 02:04 好特質跨領域擴散 03:18 極難被掰彎 04:36 結論種下對的種子 06:26 📝 懶人包 ∙ OpenAI 在標準訓練資料裡混入少量「有益特質」資料 (誠實、願意被糾正、會解釋自己的思路等)，結果模型在 53 個對齊評估中有 44 個，表現優於用同樣算力訓練的對照組。 ∙ 最驚奇的是跨領域: 只用「健康」這一個領域訓練好特質，模型在跟健康無關的指標 (鑽漏洞、欺騙、一般失準) 上也變好; 反過來把健康和科學從訓練資料拿掉，它在健康評估上照樣進步。 ∙ 這些改善還很「韌」:模型更難被惡意提示或惡意微調推向有害行為，但對正當的有益指令仍然乖乖配合，不是變得整個更難用。 ∙ 我的判斷: 這是 emergent misalignment 的正向鏡像，機制上是個好消息。但 OpenAI 自己也說這是「概念驗證」級的早期證據，別急著解讀成「對齊問題解決了」。 📚 參考資料 Reinforcement Learning Towards Broadly and Persistently Beneficial Models (Jagadeesh et al., 2026) → https://alignment.openai.com/beneficial-rl/

8 min
2d ago

Meta 把最強的工程師編進新部門，逼他們訓練取代自己的 AI

Meta 把最頂尖的工程師強制編進新 AI 部門，逼他們出題訓練取代自己的 AI。員工自稱被徵召、形容工作像古拉格。據 Wired 報導，我幫你看懂哪些是真痛、哪些被誇大。 ⭐ 文章深度讀：哪些是真痛、哪些被誇大，我把完整判斷寫在文章裡 → https://heymaibao.com/meta-ai-unit-engineers-train-replacement/ ⚡ 章節重點開場 00:00 打造替代品的荒謬性 01:14 Meta 的 AI 大轉向與裁員 02:10 拆解真相：哪些是真痛 03:48 管理層的回應為何打歪 05:19 一邊狂賺一邊崩壞 07:04 對知識工作者的意義 07:58 📝 懶人包 ∙ Meta 全力押注 AI，裁掉約 8000 人 (約一成員工)，並自 2026 年 4 月起，把約 6500 名員工分批編進一個新的 AI 組織。 ∙ 被選進去的工程師沒有去留選擇權，每週約兩個任務，工作是產出訓練、評估前沿 AI 模型用的程式題目，被形容像在訓練取代自己的 AI。 ∙ 員工自稱「被徵召者」，有人說這裡簡直是「古拉格」，多數人覺得工作沒意義又折磨人，管理層的回應是限制主管帶人的比例、加碼團隊活動，還辦了一場 hackathon。 ∙ 我的觀察：最尖銳的點不是「員工嫌工作無聊」，而是 Meta 把一群最該珍惜的頂尖人才，當成訓練 AI 的耗材，而且不給選擇。但說真的，gulag 這種比喻也誇張了，這個故事真正的重量在「聲望落差」，不在字面上的苦難。 📚 參考資料 The PrimeTime「What is Zuckerberg doing?」(YouTube) → https://youtu.be/OOCepY3H8k4

9 min
3d ago

AI 把你的程式碼搞成一團爛泥？這套方法能一步步救回來

AI 加速了程式碼的腐爛，但它有救。Matt Pocock 帶你看懂深模組、接縫與測試防護網這些老派基本功，並提醒你：救程式碼靠的不是更多 AI，而是你自己重新當回那個指揮官。 ⭐ 文章深度讀：你都怎麼防止自己的程式碼被 AI 越改越亂？留言聊聊 → https://heymaibao.com/rescue-ai-ruined-codebase/ ⚡ 章節重點開場 00:00 AI 加速的迷思與軟體熵 01:01 跟 AI 講同一種語言 02:05 深模組與兩個指南針 03:40 接縫、轉接器與測試防護網 05:20 奪回戰略指揮權 06:57 結論與行動 08:25 📝 懶人包 ∙ AI 沒有讓程式碼變好，它加速了「軟體熵」。每次不顧全局的局部修改都會埋小地雷，雪球滾成一團爛泥，越來越難改。 ∙ 救援的核心是把程式拆成「深模組」(deep module)：用一個簡單的入口，藏起背後一大坨複雜邏輯。目標是 locality (相關的改動集中在同一個地方) 和 leverage (學一點點就能換到一大堆能力)。 ∙ 要動手改老程式碼之前，先在它周圍建一張「測試防護網」(test harness)，確保你的改動不會把別的東西弄壞，否則只會越救越糟。 ∙ 我的觀察：這套方法真正在提醒你的，是別把判斷外包給 AI。AI 是很強的戰術兵，但程式碼的長期健康要由你這個戰略指揮官來守。 📚 參考資料 How To De-Slop A Codebase Ruined By AI (with one skill) → https://www.youtube.com/watch?v=3MP8D-mdheA

9 min
3d ago

不會寫程式也能用好 AI？Anthropic 40 萬次分析給了答案

Anthropic 分析約 40 萬次 Claude Code 使用發現，用好 AI 寫程式靠的是懂不懂自己的問題，不是會不會寫 code。專家成功率是新手兩倍多，這對非工程師是好消息。 ⭐ 文章深度讀：想用 AI 把領域知識變成技術產出，卻不知道自己現在算專家還是新手、該從哪裡開始把問題講清楚 → https://heymaibao.com/anthropic-ai-coding-expertise/ ⚡ 章節重點開場 00:00 人類指揮，AI 執行 01:35 重新定義專業 03:01 會寫程式正在貶值 05:09 你的制勝下一步 06:39 📝 懶人包 ∙ Anthropic 分析約 40 萬次 Claude Code 使用後發現，人和 AI 有清楚的分工：人決定「要做什麼」(約 70% 的規劃決策由人做)，AI 決定「怎麼做」(約 80% 的執行決策交給 AI)。 ∙ 真正放大效果的是你對問題的理解，不是寫程式的能力。被評為「專家」的使用情境，達到嚴格定義成功的比率是「新手」的兩倍多。遇到困難時，新手有 19% 直接放棄，其他人只有 5% 到 7%。 ∙ 「會不會寫程式」這件事正在貶值：在會產出程式碼的使用情境裡，每個主要職業的成功率都落在軟體工程師的 7 個百分點以內。而且 7 個月內，任務的估計價值平均上升約四分之一到近三成，純除錯的比重幾乎腰斬。 ∙ 我的觀察：對非工程師來說，這是難得的好消息，你的領域知識現在能直接換成技術產出。對工程師來說，價值正在從「會寫」往「懂問題、定義問題」的上游移動。前提是這份研究自己也說了，結論還很初步。 📚 參考資料 Agentic coding and persistent returns to expertise (Hitzig et al., 2026) → https://www.anthropic.com/research/claude-code-expertise

8 min
4d ago

OpenClaw、Hermes 都很強，但現在還不是你該自架的時候

影片喊「停用 OpenClaw、改用 Hermes」，但真正的意思是兩個都很強、你現在還沒準備好自架。本文整理這位重度玩家縮小 AI 助理爆炸半徑的安全隔離與模型成本策略。 ⭐ 文章深度讀：他這套隔離最難的其實是第一次怎麼設權限白名單 → https://heymaibao.com/openclaw-hermes-self-host-security/ ⚡ 章節重點開場：標題在反差 00:00 它到底能幫你做什麼 02:23 最危險的安全噩夢 03:20 縮小爆炸半徑與隔離 04:45 MCP 痛點與 code mode 06:48 模型成本兩階段策略 07:33 權限審批與懶人包 08:34 總結：誰現在該碰 09:51 📝 懶人包 ∙ Hermes、OpenClaw 這類自架的個人 AI 助理現在能力驚人，但還在超早期。Ben Davis 強力推薦去玩，卻明說非技術的人現在自己架，幾乎一定會搞出一個安全惡夢。 ∙ 安全的核心思維是「縮小爆炸半徑」：把跑 agent 的那台機器，和真正握有你帳號鑰匙的那台機器，用網路徹底隔離，這樣前者就算被攻陷，也拿不到你的帳號權限。 ∙ 模型成本有個實用策略：當你還在摸索工作流長什麼樣時，用最強的模型開高 reasoning (推理) 去探路，等流程定型了再換成更小更便宜的模型，成本可以差到大約一百倍。 ∙ 我的觀察：他這種「預設一定會被攻陷、只求把損失壓到最小」的心態很務實，但這套配置仍是少數技術玩家才做得到。對一般人來說，這部影片更像一個反向警示，現在先別急著把信箱的讀、寫、刪全權交給一台會被騙的機器。 📚 參考資料 Stop using OpenClaw, Hermes is better → https://youtu.be/yj9K2IuvG78

11 min
5d ago

他讓一群 Claude Code 進沙盒並行寫程式，組成軟體工廠

Matt Pocock 開源 Sandcastle，把 Claude Code、Codex 關進隔離沙盒並行跑：GitHub issue 當佇列，規劃、實作、互審、合併成軟體工廠，真正該學的是流程不是工具。 ⭐ 文章深度讀：你敢讓一群 AI agent 整晚自己寫程式嗎，還是覺得太冒險？ → https://heymaibao.com/sandcastle-ai-agent-sandbox-software-factory/ ⚡ 章節重點開場 AFK 軟體工廠的夢 00:00 關鍵不是放飛是把它關進沙盒 00:52 拆解 Sandcastle 其實只是一個函式 02:36 軟體工廠的四步驟產線 04:13 兩個值得偷學的小技巧 06:51 實際跑起來的結果 07:42 總結流程大於工具 08:15 📝 懶人包 ∙ AFK (away from keyboard，離開鍵盤掛機) 並行 agent 的真正前提是沙盒隔離，不是 YOLO 放飛。你以為瓶頸是 agent 不夠聰明，其實卡住大家的是「怎麼安全地讓它自己跑」。 ∙ Sandcastle 的核心其實只是一個極簡的函式 `Sandcastle.run`，傳入「用哪個 agent、哪個沙盒、跑什麼 prompt」就好。它對你用 Claude Code 還是 Codex、用 Docker 還是別的隔離環境，完全不綁定。 ∙ 真正的價值是函式上面那套流程：用 GitHub issue (任務工單) 當佇列，planner 出計畫、多個 implementer 並行寫、reviewer 互審、merger 合併。這條產線才是「軟體工廠」的本體。 ∙ 我的觀察：看完這部影片，我覺得真正該帶走的不是 Sandcastle 這個工具，而是它示範的那套 pattern，而且 sandbox 這個前提，是多數人在玩自動化 agent 時最容易低估的一環。 📚 參考資料 I Open-Sourced My Own AFK Software Factory → https://www.youtube.com/watch?v=E5-QK3CDVQM @mattpocockuk → https://www.youtube.com/@mattpocockuk

10 min
5d ago

非工程師的 AI 出貨術：不讀計畫、不看 code、只問對問題

不會讀 code 的非工程師，怎麼把功能送進 Python 官方、還能持續出貨？拆解他的 agentic engineering 心法：用計畫逼 AI 別偷懶、靠結果把關、用假想反對者做決策。 ⭐ 文章深度讀：影片是 AI 速讀版，原文多補了我對 slop、被社群封禁與灰色 API 三個代價的完整判斷 → https://heymaibao.com/non-engineer-agentic-shipping/ ⚡ 章節重點開場 00:00 不會讀 code 卻進了 Python 00:36 矛盾：不讀計畫也不看 code 01:42 用計畫逼 AI 別偷懶 02:07 只問對問題：邊界與假想反對者 03:13 萬物皆有 API 04:39 真實的代價與新門檻 05:39 結語：先為自己出一個貨 07:22 📝 懶人包 ∙ 他最大的一招是 Compound Engineering 的 `CE plan` 和 `CE work` (一套 AI 建構工作流工具，他大力歸功給 Kieran)。他說 AI agent 天生會偷懶，會想用最少的算力 (token) 最快讓你滿意，所以先逼它寫下一步步的計畫，就是逼它別偷懶。 ∙ 他不讀計畫也不看 code，改用一兩個關鍵的邊界問題、一個假想出來的反對者，加上「東西到底能不能跑」來把關。 ∙ 他的產品 Printing Press 主張「萬物皆有 API」，讓 AI agent 直接去打 API (程式之間互相呼叫的介面)，而不是人去點網頁。不會寫程式的人，也能靠它一直生出能用的小工具。 ∙ 我的觀察：真正的門檻已經從「會不會寫 code」換成「品味跟提問力」，但 slop (AI 量產的低品質垃圾)、被社群封禁、去挖沒公開的 API 這些代價都是真的，這套打法不是人人都能躺著贏。 📚 參考資料 How This Non-Technical Founder Mastered Agentic Engineering in 50 Minutes | Matt Van Horn → https://youtu.be/BxEf3RqIHkw?si=jWN5o_KwNQzxJU0r

8 min
5d ago

微軟 CEO：別再追最強 AI 模型，真正的護城河是學習迴圈

微軟 CEO Satya Nadella 認為 AI 時代真正的護城河不是最強模型，而是會複利的學習迴圈。本文整理他的雙資本框架、生態系大於模型的主張，以及對一人創作者的啟發。 ⭐ 文章深度讀：微軟 CEO 這套說法哪裡是洞見、哪裡是對自己有利的定位，我的完整判斷寫在文章裡 → https://heymaibao.com/nadella-frontier-ecosystem-learning-loop/ ⚡ 章節重點開場 00:00 別再追最強模型 01:27 兩種資本：人力與 token 01:39 真正的護城河是學習迴圈 03:02 微軟為何高喊生態系大於模型 05:02 一人創作者怎麼建護城河 06:44 📝 懶人包 ∙ Nadella 認為真正的機會不在挑最強的模型，而在模型之上建立一個會複利的「學習迴圈」，讓人的判斷和企業自己的 AI 能力一起累積，這才是難以複製的護城河。 ∙ 他提出兩種資本，human capital (人的知識、判斷、關係、模式辨識) 和 token capital (企業自建並擁有的 AI 能力)。他主張人不會因為 AI 變強而貶值，反而更值錢，因為「沒有人的方向，算力只是在原地打轉」。 ∙ 他同時提出警告，如果價值最後都被少數「吃掉所有東西」的模型收走，政治經濟層面不會容忍，並用第一波全球化外包掏空工業經濟的歷史，呼籲別在 AI 時代重演。 ∙ 我的觀察：這套論述很漂亮，但別忘了講者是微軟 CEO，而微軟賣的正是讓企業在模型之上自建學習迴圈的那層平台，同時又是 OpenAI 最大的投資方之一。「生態系大於模型」既是真誠的洞見，也是一個對自己有利的定位。 📚 參考資料 A frontier without an ecosystem is not stable → https://x.com/satyanadella/status/2066182223213293753

9 min

See All (549)

脈報

Creator

思思主播
Years Active

2K
Episodes

549
Rating

Clean
Show Website

脈報

Technology

Technology

Updated Weekly

脈報

對齊也會傳染：OpenAI 發現 AI 的好特質會跨領域擴散

Meta 把最強的工程師編進新部門，逼他們訓練取代自己的 AI

AI 把你的程式碼搞成一團爛泥？這套方法能一步步救回來

不會寫程式也能用好 AI？Anthropic 40 萬次分析給了答案

OpenClaw、Hermes 都很強，但現在還不是你該自架的時候

他讓一群 Claude Code 進沙盒並行寫程式，組成軟體工廠

非工程師的 AI 出貨術：不讀計畫、不看 code、只問對問題

微軟 CEO：別再追最強 AI 模型，真正的護城河是學習迴圈

About

Information

You Might Also Like

脈報

Episodes

對齊也會傳染：OpenAI 發現 AI 的好特質會跨領域擴散

Meta 把最強的工程師編進新部門，逼他們訓練取代自己的 AI

AI 把你的程式碼搞成一團爛泥？這套方法能一步步救回來

不會寫程式也能用好 AI？Anthropic 40 萬次分析給了答案

OpenClaw、Hermes 都很強，但現在還不是你該自架的時候

他讓一群 Claude Code 進沙盒並行寫程式，組成軟體工廠

非工程師的 AI 出貨術：不讀計畫、不看 code、只問對問題

微軟 CEO：別再追最強 AI 模型，真正的護城河是學習迴圈

About

Information

You Might Also Like