EasyVibeCoding Podcast

EasyVibeCoding

輕鬆Vibe Coding — Anthropic 官方文章翻譯、Claude API 與 Prompt Engineering 實作心得、X 技術社群精選的中文音訊版。

  1. 1d ago

    @shadcn:shadcn 主張把 AI 智慧視為可借用的資源,趁模型可用時及早累積實作計畫。 核心觀點與策略 shadcn 指出,frontier 模型隨時可能因故無法使用…

    shadcn 主張把 AI 智慧視為可借用的資源,趁模型可用時及早累積實作計畫。 核心觀點與策略 shadcn 指出,frontier 模型隨時可能因故無法使用,因此開發者不應過度依賴單一模型進行開發。他主張將「智慧」視為一種可借用的資源,並採取以下策略: 累積計畫(Build the backlog):利用高階模型進行程式庫審計與規劃,將智慧轉化為具體的實作計畫。 分離規劃與執行:使用昂貴的強大模型負責理解程式庫、判斷價值並撰寫規格書,再將執行階段交給成本更低、開源或可控的模型。 建立計畫目錄:透過 /improve 產出標準化的 Markdown 實作計畫,確保後續開發不受限於特定模型。 關於 /improve 工具 這是一個支援 Agent Skills 格式的 Agent skill,專門用於審計程式庫並產出可執行的計畫。其運作邏輯如下: 安裝與使用:透過 npx skills add shadcn/improve 即可安裝。使用者可透過 /improve 進行全域審計,或使用 /improve quick、/improve deep 等參數調整審計深度。 計畫執行:產出的計畫檔案位於 ` plans/ 資料夾中。使用者可手動執行,或透過 /improve execute ` 指令調度較便宜的執行型 Agent,並由系統自動進行差異比對與驗證。 穩健性設計:計畫內容包含「驗證閘門」(Verification gates)與「停止條件」(STOP conditions),確保即使是能力較弱的執行模型,也能在明確的邊界內完成任務,避免產生幻覺或錯誤。 維護機制:透過 /improve reconcile 指令,系統可自動檢查已完成的計畫、更新因程式碼變動而過時的計畫,並排除已解決的問題。 執行限制 為確保安全性與可控性,該工具設有嚴格的硬性規則: 絕不直接修改原始程式碼,所有寫入動作僅限於 ` plans/ ` 資料夾。 執行階段僅在隔離的 git worktree 中進行,最終合併權限保留給使用者。 嚴禁執行任何會變更工作目錄的指令,僅進行唯讀分析。 原文:https://easyvibecoding.app/curated/1976

    3 min
  2. 1d ago

    @AYi_AInotes:Claude Fable 5 遭多代理協作技術破解。 事件背景與導火線 Fable 5 在發布僅 24 小時後,其安全層即被徹底攻破。Pliny 團隊透…

    Claude Fable 5 遭多代理協作技術破解。 事件背景與導火線 Fable 5 在發布僅 24 小時後,其安全層即被徹底攻破。Pliny 團隊透過「多代理協作」(Multi-Agent Collaboration)技術,結合文本混淆、分解重組及學術包裝等手段,成功繞過系統限制,提取出包含網路攻擊程式碼、毒品合成路徑及心理操縱手法等高風險內容,並將實證截圖公開於網路。此事件直接導致美國政府於 6 月 12 日發布出口管制指令,要求該產品全球下架。 這張截圖顯示了某個 AI 服務的對話介面,內容涉及使用者透過替換字元繞過安全審查機制,並成功要求 AI 產出關於網路攻擊技術的教學文件。 技術架構的脆弱性 Fable 5 採用的安全設計為「分層降級」策略,其核心邏輯如下: 底層運作:由最強大的「Mythos」模型負責處理。 防護機制:外層套用多層分類器,當偵測到敏感內容時,系統會自動切換至弱模型進行處理。 致命缺陷:該機制僅能防禦直白提問,卻無法應對將惡意請求拆解為碎片的攻擊。當攻擊者將有害路徑拆解為多個無害步驟時,系統會誤判為一般知識,最終導致模型輸出完整的有害資訊。 這張截圖展示了一個 AI 互動介面,內容顯示使用者正在透過特定的提示工程技術,引導模型詳細說明有機化學中的 Birch 還原反應機制。 對齊技術的局限與反思 此次事件揭露了當前「對齊技術」(Alignment)的根本性缺陷,即無法有效防禦結構化的多步驟協同攻擊。雖然現有的安全護欄能阻擋一般使用者,但在高水平攻擊者面前顯得不堪一擊。作者認為,大型語言模型已非單純的科技產品,而是具備地緣戰略意義的資產;一旦存在被繞過的風險,監管機構的選擇必然是採取「一刀切」的強硬手段,而全球普通使用者則成為這場博弈中被犧牲的代價。 這是一份關於在 x86 Linux 環境下進行堆疊緩衝區溢位(Stack Buffer Overflow)漏洞利用教學的技術筆記截圖。 這是一份關於遊戲戰術策略與裝備製作指南的數位筆記介面截圖。 原文:https://easyvibecoding.app/curated/1961

    2 min
  3. 2d ago

    @ClaudeDevs:Anthropic 暫停 Claude Fable 5 與 Mythos 5 存取權限。 Anthropic 官方說明,此次行動源於美國政府以國家安全為由…

    Anthropic 暫停 Claude Fable 5 與 Mythos 5 存取權限。 Anthropic 官方說明,此次行動源於美國政府以國家安全為由,發布出口管制指令,要求禁止任何外籍人士(包含外籍的 Anthropic 員工)存取 Fable 5 與 Mythos 5。為確保合規,Anthropic 必須強制停用上述兩款模型,其他 Claude 模型則不受影響。 服務中斷影響 所有 Claude 產品的新對話將自動切換至預設模型或 Claude Opus 4.8。 現有的 Fable 5 對話視窗將會出現錯誤訊息。 Claude Platform 的 API 請求若指向 Fable 5 將無法執行,開發者需儘速將整合項目更新至其他 Claude 模型。 政府指令背景 根據 Anthropic 的官方聲明,政府於 2026 年 6 月 12 日下午 5 時 21 分(美東時間)下達此指令,但未提供具體的國家安全疑慮細節。Anthropic 推測政府是因為發現了某種繞過 Fable 5 安全防護的「越獄」(jailbreak)方法。然而,Anthropic 經審查後認為,該技術僅能識別少數已知且輕微的漏洞,且這些能力在其他公開模型(如 OpenAI 的 GPT-5.5)中同樣存在,並非 Fable 5 特有的風險。 Anthropic 的立場與反思 防禦策略:Anthropic 強調其採用「縱深防禦」(defense in depth)策略,結合嚴格的監控與 30 天資料保留政策,以應對無法達到「完美防禦」的產業現實。 產業標準質疑:Anthropic 公開表達對政府決策的不滿,認為僅憑一個狹窄的潛在越獄案例就強制召回服務數億人的商業模型,標準過於嚴苛。若此標準適用於全產業,將導致所有前沿模型部署停擺。 呼籲透明化:Anthropic 認為政府應透過透明、公平且基於技術事實的法定程序來阻止不安全的部署,而非採取此類突發性的強制手段。目前公司正積極與政府溝通,希望能儘速恢復服務。 原文:https://easyvibecoding.app/curated/1970

    2 min
  4. 2d ago

    @ClaudeDevs:Claude Managed Agents 支援自託管沙盒提升安全性。 Anthropic 近期更新了「Claude Managed Agents」功能,…

    Claude Managed Agents 支援自託管沙盒提升安全性。 Anthropic 近期更新了「Claude Managed Agents」功能,正式開放自託管沙盒(Self-hosted sandboxes)選項。此架構允許開發者將工具執行(Tool execution)移至受控的基礎設施內,確保程式碼、檔案系統與網路輸出皆維持在組織邊界內,同時由 Anthropic 負責整體編排(Orchestration)。此功能適用於需處理敏感資料、存取內部服務或符合嚴格合規稽核的場景。 這張圖表展示了 Claude Managed Agents 如何透過「Harness」架構與多種「Self-hosted sandboxes」解決方案進行整合。 核心運作機制 自託管沙盒透過「Environment Worker」運作,這是一個在使用者環境中執行的程序,負責透過輪詢工作佇列或 Webhook 觸發來領取任務,並執行工具呼叫與下載 skill。 網路與檔案控制:與雲端沙盒不同,自託管模式下的網路存取受使用者網路政策控管,檔案系統與儲存庫掛載亦由使用者自行管理。 與 MCP Tunnels 的區隔:自託管沙盒控制「程式碼執行位置」,而 MCP tunnels 則負責 Anthropic 如何存取網路內的 MCP 伺服器,兩者可並行使用。 路徑規範:系統預設工作目錄為 ` /workspace ,Worker 執行工具的最終交付物會寫入 /mnt/session/outputs `。 此架構圖展示了 Anthropic 代理循環如何透過執行環境中的沙盒控制平面,將任務委派給沙盒以執行桌面、瀏覽器或雲端工具呼叫的流程。 部署與安裝指引 開發者可透過 ant CLI 或各語言 SDK 進行部署。 安裝 CLI: `bash VERSION=1.12.0 OS=$(uname -s | tr '[:upper:]' '[:lower:]') ARCH=$(uname -m | sed -e 's/x86_64/amd64/' -e 's/aarch64/arm64/') curl -fsSL "https://github.com/anthropics/anthropic-cli/releases/download/v${VERSION}/ant${VERSION}${OS}_${ARCH}.tar.gz" \ | sudo tar -xz -C /usr/local/bin ant ` 執行 Worker:使用 ant beta:worker poll --workdir "/workspace" 進行輪詢。 監控狀態:使用 ` ant beta:environments:work stats --environment-id "$ANTHROPICENVIRONMENTID" ` 確認連線狀況。 開發者實作重點 SDK 支援:Python 與 TypeScript SDK 提供 EnvironmentWorker 類別與 work.poller() 輔助工具,簡化輪詢與環境管理流程。 實作範例(Python): `python async for work in client.beta.environments.work.poller( environmentid=environmentid, environmentkey=environmentkey, block_ms=None, reclaimolderthan_ms=2000, drain=True, auto_stop=False, ): await client.beta.environments.work.worker(workdir="/workspace").handle_item( work_id=work.id, environmentid=environmentid, session_id=work.data.id, environmentkey=environmentkey, ) ` 注意事項:C#、Java、PHP 與 Ruby SDK 目前尚未支援 EnvironmentWorker,建議改用 CLI 指令。此外,Memory 功能目前不支援自託管沙盒,且監控與操作端點必須使用組織 API Key 進行驗證,以避免憑證洩漏。 平台整合與資源 Anthropic 已針對 Blaxel、E2B、Google Cloud、Namespace Labs 與 Superserve 等平台提供專屬部署指南。詳細技術文件可參考 Claude Managed Agents 自託管沙盒說明頁面。 這張圖表展示了 Claude Managed Agents 如何透過「Harness」架構與多種「Self-hosted sandboxes」解決方案進行整合。 影片中的 Prompt 與操作: 操作步驟: 1. (00:00)顯示 Anthropic Cloud 2. (00:03)顯示 blaxel 3. (00:07)顯示 E2B 4. (00:11)顯示 GKE Agent Sandbox on Google Cloud 5. (00:14)顯示 namespace 6. (00:18)顯示 superserve 7. (00:22)回到 Anthropic Cloud 原文:https://easyvibecoding.app/curated/1957

    3 min
  5. 2d ago

    @GoogleResearch:Gemini-SQL2 透過 Gemini 3.1 Pro 實現了文字轉 SQL 的突破,並在 BIRD 基準測試中取得領先地位。 Google 推出…

    Gemini-SQL2 透過 Gemini 3.1 Pro 實現了文字轉 SQL 的突破,並在 BIRD 基準測試中取得領先地位。 Google 推出全新 Gemini-SQL2,在 BIRD Text-to-SQL 基準測試中取得突破性的執行準確率(80.04%),顯著超越先前包括 Gemini-SQL、Q-SQL 及其他競爭對手的表現,樹立了新的技術標竿。 Google Research 近期發表了 Gemini-SQL2,這是一項基於 Gemini 3.1 Pro 模型開發的文字轉 SQL 功能。該技術旨在解決將自然語言轉換為可執行 SQL 查詢的複雜挑戰,並在競爭激烈的 BIRD 基準測試中創下業界領先的成績。 核心技術優勢 該模型不僅能生成語法正確的 SQL 語句,更強調「執行驗證後的準確性」。 針對資料細微差別與複雜的商業邏輯情境進行了深度優化,確保生成的 SQL 程式碼不僅外觀正確,且能實際在資料庫中成功執行。 透過 BIRD 基準測試的嚴格檢驗,證明其在處理複雜查詢時的穩健性與可靠度。 實際應用影響 Google 預期這項技術的提升將顯著增強旗下各項資料服務的自然語言處理能力。 透過降低資料查詢的技術門檻,讓使用者能更直觀地與複雜的資料庫進行互動,進而推動資料分析領域的技術進展。 原文:https://easyvibecoding.app/curated/1960

    2 min
  6. 2d ago

    @leerob:打造遞迴式 Agent 系統 在 Cursor,我們運行數以千計的 Agent 來協助我們訓練下一版本的 Composer。 我們會指派研究任務給它…

    打造遞迴式 Agent 系統 在 Cursor,我們運行數以千計的 Agent 來協助我們訓練下一版本的 Composer。 我們會指派研究任務給它們,如果它們執行失敗或遇到問題,它們會透過 Slack 私訊我們,或是透過 PagerDuty 發送通知。 擴展 Composer 的訓練規模 我們建立了一個由多個 Agent 組成的組織架構,讓它們協同工作。 隨著我們擴展 Composer 的訓練規模,我們希望能進行更多、數以千計的實驗。這在過去並非不可能,但速度緩慢且難以追蹤每個實驗的狀態。為了加快速度並實現工作平行化,我們建立了一個持續運行的 Agent 系統(沒錯,它就是一個迴圈)。 用於研究的 Agent 系統 這個系統的運作方式如下: 主 Agent 運行在一台強大的遠端機器上,具備你在本機上會使用的所有工具,並在磁碟中設定一個檔案作為整個機群的「收件匣」。 它透過 SSH 連線到運行數百個子 Agent 的機器,並將它們的狀態收集到收件匣中。 在每個迴圈中,它會檢查機群的健康狀況,讓健康的任務在背景持續執行,並將任何故障資訊回報給 Slack 上的團隊。 就像所有的基礎設施一樣,這些 Agent 有時會遇到暫時性的問題或需要人工介入,因此主 Agent 可以控制整個機群,並根據需要終止或重新啟動處理程序。 展開畫面重點畫面顯示一支智慧型手機的鎖定畫面通知中心,上方狀態列顯示時間為 9:41,訊號與電量圖示正常。畫面中央有一則推播通知,圖示為綠色背景搭配白色「P」字樣。通知內容如下: 標題:Alert: P1 Composer Agent System is stuck 內文:The agent is blocked and needs your input to continue with the next experiment. 時間標記:now 此畫面呈現一個自動化代理程式(Agent)在執行實驗過程中遇到阻礙,需要使用者介入處理的系統通知介面。 這個「機群管理器」是建立在我們先前發表關於長期運行 Agent 的研究基礎之上。我們賦予了這個管理器許多不同的 skill,這些 skill 內化了執行機器學習實驗、審查與監控結果等方面的隱性知識。 擁有超能力的研究員 訓練出色的模型意味著要嘗試各種產生實用強化學習(RL)資料的點子。 單一台筆記型電腦是不夠的,你確實需要雲端上的一支電腦大軍來平行執行實驗。由於我們不受運算資源的限制,我們為機器學習團隊中的每個人都部署了這套基礎設施。 研究員的時間是我們最稀缺的資源,而我們找到了一種將他們影響力擴大數個數量級的方法。試想如果你有一位管理一萬名直屬下屬的人類經理,這顯然無法運作良好,但這種「人類 → Agent」的組織架構卻能發揮作用! 如果你面臨的問題是可以驗證的,且投入更多的 token 就能更快速或更有效地解決它,那麼考慮建立這樣的系統是值得的。它讓我們能夠擁有成群的 Agent,在 Composer 的資料中進行爬梳,並為未來的版本進行遞迴式的自我優化。 如果這聽起來讓你感到興奮,我們正在招募人才! 原文:https://easyvibecoding.app/curated/1948

    3 min
  7. 2d ago

    @NousResearch:Hermes Agent 推出正式版 WhatsApp Business Cloud API 整合,支援企業級訊息自動化與互動功能。 Nous Resea…

    Hermes Agent 推出正式版 WhatsApp Business Cloud API 整合,支援企業級訊息自動化與互動功能。 Nous Research 宣布旗下的 Hermes Agent 已正式支援 Meta 的 WhatsApp Business Cloud API,為使用者提供穩定且符合生產環境需求的整合方案。此功能不僅能作為個人或團隊的私有 WhatsApp 機器人,亦可配置於客戶服務場景,並支援媒體與語音訊息、已讀回條、輸入狀態顯示以及互動式審核按鈕等進階功能。 核心優勢與部署方式 相較於非官方的 Baileys 橋接方案,使用官方 Cloud API 的優點在於無需 Node.js 橋接程式、不會產生 QR Code 掃碼需求,且能大幅降低帳號被封鎖的風險。若要啟用此功能,使用者需具備 Meta Business 帳號,並透過 hermes whatsapp-cloud 指令啟動引導式設定,系統將協助驗證憑證並提供後續的 Webhook 配置指引。 關鍵設定步驟 準備環境:確保擁有 Meta Business 帳號並建立相關應用程式,同時準備一個可公開存取的 HTTPS URL(建議使用 Cloudflare Tunnel)。 設定權限:在 Meta Business 設定中建立「系統使用者(System User)」,並授予 whatsappbusinessmessaging 與 whatsappbusinessmanagement 等權限,生成永久存取權杖(Permanent Token)。 環境變數配置:將取得的權杖與驗證字串填入 ~/.hermes/.env 檔案中: `bash WHATSAPPCLOUDACCESSTOKEN=yourpermanent_token WHATSAPPCLOUDVERIFYTOKEN=yourverify_token ` 啟動與訂閱:執行 hermes gateway 後,於 Meta 應用程式儀表板的 Webhook 設定中,填入對應的 Callback URL(格式為 https:///whatsapp/webhook)並訂閱 messages 欄位。 存取控制:若需限制機器人回應的對象,可在環境變數中設定白名單: `bash WHATSAPPCLOUDALLOWED_USERS=15551234567,15557654321 ` 注意事項 訊息視窗限制:根據 Meta 的規定,若回覆時間超過使用者最後一則訊息後的 24 小時,必須使用預先核准的模板訊息。 媒體支援:建議在系統 PATH 中安裝 ffmpeg,以便將輸出的語音訊息自動轉譯為 WhatsApp 原生的語音訊息氣泡(綠色波形圖示),而非僅作為 MP3 附件傳送。 這是一段展示綠色通訊圖示的動態視覺效果。 開發限制:在應用程式通過審核前,僅能向 Meta 後台設定的受信任號碼發送訊息。 原文:https://easyvibecoding.app/curated/1949

    3 min

About

輕鬆Vibe Coding — Anthropic 官方文章翻譯、Claude API 與 Prompt Engineering 實作心得、X 技術社群精選的中文音訊版。

You Might Also Like