Web Worker-AI程序员都爱听

Web Worker

Web Worker 播客是几个AI程序员闲聊的中文音频播客节目。节目将围绕程序员领域来瞎聊,聊资讯、聊职场、聊技术选型...... 只要是和 Web 开发有关的都可以聊。

  1. May 29

    No.96 两个主播第一次写书:关于 TRAE、AI Agent 和出版

    评论赠书如果你正在关注 AI 编程、AI Agent、多智能体协作,或者想知道 TRAE 这类 AI IDE 到底能怎样改变真实开发流程,这本书值得买来系统读一读。它不是只讲概念的趋势介绍,而是把工具安装、核心功能、MCP、Skills、自主协作模式和多个完整项目串在一起,帮助读者从“听说 AI 能写代码”,走到“知道如何把 AI 放进自己的开发流程里”。 尤其推荐给几类朋友:想入门 AI 编程的新手、正在尝试用 AI 提效的一线开发者、希望理解新一代研发工作流的技术管理者,以及身边正在学习编程、需要一本实体书建立完整认知的学生或技术爱好者。可以在京东、当当等购书平台搜索 “TRAE” 和 “AI Agent” 找到这本书。 小宇宙评论言之有理和节目相关,赠书一本。两周后由 agent 读取评论选择 节目介绍这期 Web Worker 播客,我们请来辛宝和 Smart,聊他们的新书《TRAE与AI AGENT协作实战 多智能体AI编程全栈指南》从选题、写作、审稿到出版上线的全过程。节目里不仅复盘了两位程序员第一次出技术书时遇到的真实难题,也聊到面对高速迭代的 AI 编程工具,如何设计大纲、补充新概念、打磨实战案例,以及 AI 在写作、资料检索、代码实现和结构编排中扮演的角色。最后也聊了新书适合哪些读者、实体书宣发和赠书活动。 书籍介绍《TRAE与AI AGENT协作实战 多智能体AI编程全栈指南》是一本全面、深入的 TRAE 与 AI Agent 协作实战指南,系统阐释 AI 驱动的新一代编程范式。全书从 TRAE 的核心理念与安装、设置入手,深入讲解 CUE 这一智能代码提示工具及 SOLO 这一自主协作方式,并进一步剖析 MCP 的原理与 Skills 定制化开发方法。 书中还通过六大实战项目,手把手引导读者掌握从需求分析到部署上线的全流程 AI 协作开发方法:搭建播客网站、开发古籍识别项目、在现有项目中快速构建业务模块、多智能体协作开发桌面笔记应用、从零构建本地知识库系统,以及开发小程序和移动端应用。本书适合希望借助 AI 提升研发效能的开发者阅读和参考。无论你是编程新手、资深工程师还是技术架构师,都可以通过这本书建立与 AI Agent 高效协作的思维模式,掌握面向未来的软件开发新技能。 时间轴00:00 开场,介绍本期嘉宾辛宝、Smart 和主持人小白菜 00:26 为什么会写《TRAE与AI AGENT协作实战》这本书 01:25 从最初意向到正式发售:这本书的时间线 03:47 给高速迭代中的 AI 编程工具写一本实时更新的操作指南 04:21 两位作者如何分工,以及写作过程中的异步协作 06:17 第一次出书:从选题、大纲到出版社流程 07:39 书号、出版社和实体书出版背后的商业逻辑 14:31 电子工业出版社、博文视点,以及技术书出版系列 16:40 程序员表达和书面表达的差异:为什么技术书要写得更细 20:47 编辑老师如何参与选题、打样、反馈和反复修改 23:51 专业名词、中文英文、前后文一致性带来的写作挑战 25:25 技术书如何处理专业审校和专家评审 28:39 新手作者第一次出书踩过的坑,以及下一本会更顺的地方 30:08 目录和大纲是怎么定下来的,又为什么会边写边改 32:19 Skills 等新概念快速爆发,为什么必须临时补进书里 35:55 从最初三个案例扩展到六个实战项目 37:59 覆盖不同读者:新手、老手、前端、后端、跨端和 AI 应用 40:43 定稿、等待出版、样书上架前后的心态变化 43:18 书出版之后,两个程序员如何面对实体书宣发 46:29 找推荐人、写推荐语,以及让不同圈层读者理解这本书 49:02 上线后的销量统计为什么比互联网产品更复杂 50:40 本期节目赠书活动预告 51:06 实体书的成本、渠道和不可随时修改的压力 53:21 AI 主播写 AI 书:AI 在创意、结构、检索和代码实现中的作用 56:29 和 AI 协作越多,越能理解它擅长什么、不擅长什么 58:23 重新介绍书名、购买渠道和封面信息 01:00:38 这本书推荐给谁:开发者、学生、技术爱好者和非程序员 01:03:25 京东、当当等渠道销售情况,以及线上线下渠道差异 01:04:00 如何参与评论赠书:聊节目感受或 AI / TRAE 使用经验 01:05:25 节目收尾 在小宇宙查看该单集文稿

    1h 6m
  2. May 11

    No.95 主播现场做 S&BTI测试、八卦小白菜的一次面经

    介绍下辛宝和 Smart 最近折腾的事情,讲讲《TRAE与AI AGENT协作实战 -- 多智能体AI编程全栈指南》背后的一些故事,希望大家冲动支持! 这是这本书背后的故事 https://mp.weixin.qq.com/s/aYT1qR4fFiypd31Kjl8eQg 节目介绍本期《Web Worker》是一期闲聊节目。几位程序员主播/嘉宾围绕近期流行的“xxTI”人格测试展开,从测试结果、自我认知、亲密关系和社交边界聊起,逐渐延展到程序员工作年限、职场经验变化、AI 对开发岗位的冲击、前后端边界消失、AI Coding 实践,以及当下求职市场的真实体感。 整体气质比较轻松、吐槽感强,但后半段讨论逐渐深入,尤其集中在: AI 时代程序员岗位正在发生什么变化 前端/后端/产品/设计之间的边界是否会被打散 传统面试与 AI Coding 新工作方式之间的错位 当前技术人求职环境变差,以及远程、社区、接单等替代路径 时间轴00:00 开场00:53 xxTI 人格测试成为话题入口05:23 围观辛宝现场做题15:23 辛宝测试结果出炉17:53 从测试结果聊到自我认同和自信20:31 辛宝分析 xxTI 的几个维度26:51 转向 AI 和工作年限30:04 工作多年后的心态变化37:45 面试中对xx的反感39:28 大家讨论面试风格差异42:33 AI 是否正在改变岗位和职能43:10 AI Coding、岗位融合与工程兜底45:40 今年以来大家使用 AI 工具的变化46:24 小白菜讲述从前端转 AI 开发的经历49:42 小白菜准备三份简历:AI 全站、传统前端、视觉识别51:47 当前求职市场体感:投递多、面试少、外包多54:38 AI 与整体环境对岗位减少的影响55:45 伊娃建议关注远程社区和非传统招聘渠道56:29 信息差:传统招聘平台之外的小团队机会59:05 传统行业、远程等备选思路01:01:18 结尾:祝小白菜求职顺利 在小宇宙查看该单集文稿

    1h 2m
  3. Apr 20

    No.94 不服跑个分,AI Benchmark 指标如何解读?

    节目介绍本期播客聚焦"AI 模型跑分榜单"这件事。 借 Claude Opus 4.7 发布放出的那张跑分表为切入点,三位主播辛宝、smart、还老师一起把 SWE-bench(含 Verified 与 Pro 三代演进)、Terminal-Bench、Humanity's Last Exam、GPQA、MMLU、OSWorld、ARC-AGI 等主流榜单挨个做了一轮"查漏补缺式"的科普,讲清楚每个榜单在考什么、为什么分数有高有低、以及厂商为何爱针对性刷分。横向对比了 GPT-5.4、Gemini 3.1 Pro,以及国产御三家 GLM-5.1、MiniMax-2.7、Kimi-2.5、千问 3.6 的发布榜单,并回看一年前 DeepSeek V3 的分数作为参照。最后从 OpenRouter 用量榜看 token 消耗格局——从"程序员才能用多少"到"Agent才能用多少"的演进。适合想快速补齐榜单常识、又不想看长篇 benchmark 文章的听友。 参考 www.anthropic.com 时间轴  00:00:00  开场 / 三人介绍,引出话题   00:01:40  Claude Opus 4.7 发布,跑分表结构说明   00:05:00  SWE-bench 三代演进:普通 / Verified / Pro   00:12:30  Terminal-Bench 2.0:AI 会不会用终端   00:13:30  跑分水分讨论:针对题库做定向训练   00:16:00  Humanity's Last Exam:博士级无答案考题   00:21:30  BrowseComp、MCP 工具调用、OSWorld 电脑操作   00:23:30  Finance 金融分析榜   00:25:40  骇客 / 红蓝对抗测试   00:27:30  GPQA 硕博理工、视觉推理、MMLU 通识   00:29:30  GPT-5.4 发布榜单速览   00:31:30  Gemini 3.1 Pro 榜单 & GDP 国家模拟游戏   00:33:00  ARC-AGI 抽象推理(类行测找规律)   00:35:30  国产模型:GLM-5.1 长任务 NL2Repo   00:37:30  MiniMax-2.7、Kimi-2.5 多模态榜   00:39:30  千问 3.6 开源版 / 闭源版对比   00:42:30  回看一年前 DeepSeek V3:对比今昔分数   00:45:00  编程榜快刷到头,下一步卷哪里?   00:48:30  体感与榜单不匹配:场景切合度决定   00:50:30  OpenRouter 用量榜介绍   00:53:00  Token 消耗一年翻数倍:谁在真正消耗   00:56:00  智能 / 编程 / UI / SVG 等细分跑分   00:59:30  吞吐速度、上下文长度、中文能力榜   01:02:30  爱马仕 Agent 崛起 & 工具调用占比   01:03:30  结束语 在小宇宙查看该单集文稿

    1h 5m
  4. Apr 10

    No.93 听完上期播客,辛宝跳槽去 AI Agent 创业公司了

    内容简介AI时代,程序员还叫程序员吗?面试还问八股文吗?代码还需要人写吗? 这期节目聊了很多程序员当下最关心的问题: 新公司100%用AI写代码是什么体验? Builder和程序员有什么区别? 非前端背景的人用AI也能干前端的活吗? AI 搞不定的时候谁来兜底? 面试从考算法变成考什么了? Token管够是标配还是奢侈? 古法编程会不会被淘汰? AI创业浪潮像不像十年前的互联网? 用Cursor还是Claude Code? 什么时候该跳槽? 程序员的差异化竞争力还剩什么?两位全栈程序员从各自真实经历出发,坦诚聊了AI对工作方式、职业路径、面试逻辑、团队协作的全面冲击。 时间轴 00:00:00 开场,介绍本期两位嘉宾辛宝和Smart 00:00:35 AI要替代程序员了,为什么还要出来找工作 00:01:39 前端程序员这个称谓要消亡了,以后都叫Builder 00:02:36 半年前和现在对程序员的认知天差地别 00:03:17 回顾8-9年职业经历,从toC到toG到toB到toD 00:05:53 在DCloud做uni-app框架层是什么体验 00:07:19 新工作做AI Agent,属于toAI方向 00:07:53 新公司鼓励不要手写代码,100%交给AI 00:09:17 VS Code只用来看改了哪些文件,主战场在终端 00:10:15 古法编程和AI辅助,两种工作方式的对比 00:14:55 AI太强了,过往的最佳实践变得唾手可得 00:15:25 面试不再考八股文和算法,更看重经历和人的特质 00:18:21 技术面宽容度变高,个人经历占比更重 00:19:52 未来面试会问"如何与AI协作"和"遇到了什么问题" 00:21:31 什么叫"懂AI"?进了公司才真正理解 00:22:01 入职一周感受:写工作日记、快速熟悉上下文 00:25:01 AI创业浪潮像回到十年前互联网时代 00:27:01 朋友圈刷屏AI创业,勃勃生机万物竞发 00:29:17 前AI时代公司转型 vs AI原生创业公司有什么不同 00:31:47 Token管够是标配吗?很多公司其实还没意识到 00:34:06 维新派、半维新、保守派——你属于哪一派 00:35:29 不必焦虑,半年后大家状态会趋同 00:37:19 AI写的代码如何保证质量,工程化仍不可少 00:40:43 AI native公司如何统一模型和代码规范 00:43:40 当下是换工作的好时机吗 00:48:37 AI方向顶级大厂博士实习日薪5000+,风口的薪资超乎想象 00:52:26 非前端背景用AI干前端的活,95%场景可行 00:54:56 AI搞不定的时候谁来兜底?这就是差异化竞争力 00:57:50 推翻旧架构,用AI搭一套对AI友好的新架构 00:59:22 钉钉飞书开始面向AI设计CLI,软件形态在变 01:00:04 Manus让AI从IDE里释放出来,普通人也能用 01:02:25 QQ宠物该复活了,AI coding像开心农场收菜 01:05:36 收尾,期待后续持续复盘这段AI时代的工作经历在小宇宙查看该单集文稿

    1h 6m
  5. Apr 1

    No.92 迟到的节目盘点

    节目简介嗨,大家好!欢迎来到新一期的《Web Worker》播客 。这期我们不讲枯燥的代码,纯闲聊——这是一场属于咱们前端程序员的年度回顾局 。主播辛宝和“坐了两个小时”的 Smart 在现场,带大家一起翻翻2025年的“旧账” 。过去这一年,我们聊了前端技术的跌宕起伏,见证了 AI 带来的行业震撼,也走出去做了不少线下的跨界串台交流 。这不仅是节目的盘点,也是咱们打工人的年度记忆 。当然,面对已经到来的2026年,我们也有了新的期待,特别是如何深度融合 AI 工具流来彻底解放生产力 。 另外,从第90期节目开始,我们WebWorker要启动一个「100期专属子线程任务」每期藏一条「指令字符」,就像Worker后台线程一样,悄悄运行,不影响正常收听。等100期集齐所有字符,拼出完整的「核心指令码」,前N位私信给我的听友,就能解锁我们100期的限定奖励。做个细心的Worker,找到所有指令吧! 时间轴 00:02 开场,辛宝和Smart准备一起盘点2025年录过的节目,顺便翻翻年初的那些预测 02:12 年初的大联欢,几个人围坐在一起总结过去一年,也聊了聊对新一年的期待 05:30 Kaiyi 从加拿大远程连线,聊了国内外生活的不同,也正好赶上DeepSeek突然火起来 08:39 围绕Vue 3.6的前瞻,聊了Alien Signals的集成和性能上的变化 13:55 和晓宇在线下录了一期,聊职场里的挣扎、裸辞,还有之后怎么慢慢找回状态 17:27 跟infra团队聊模块联邦2.0,技术细节比较多,聊得很深 21:31 邀请Vue核心成员聊Vapor Mode,聊这个新方向的性能表现和未来可能性 28:11 跨到医疗行业,跟三甲医院的医生聊人脑和AI在工作方式上的不同 30:56 年底跟另一位播客主播闲聊,话题慢慢落到AI对程序员职业路径的影响上 36:54 展望2026年,想怎么用AI把播客的制作流程变得更轻便、更高效在小宇宙查看该单集文稿

    46 min
  6. Mar 16

    No.91 Kaiyi几十场AI面试后的总结:怎么成为懂 AI 的人

    节目简介本期节目在中关村创业大街线下录制,迎来时隔一年多的重磅嘉宾开翼——刚从加拿大微软归来,带着 GitHub Copilot 团队的一线实战经验。四位技术人深度拆解大模型的工作原理:从 Temperature 参数如何影响创造力,到 Cache 机制为何能让 API 便宜这么多;从 RAG 的完整最佳实践,到为什么大公司做不好大模型;从 AI 时代"2000 行单文件"的新开发范式,到程序员未来 1-5 年的动荡期预判。这不是科普向的入门课,而是一线工程师用真金白银试出来的实战经验分享。 本期要闻1. Temperature 参数的真相:创造力与稳定性的博弈开翼从大模型的基本原理讲起:模型本质是"下一个词预测器",每次生成时会输出多个候选词及其概率。Temperature 参数决定了选词策略——设为 0 时模型会 100% 选择概率最高的词,输出稳定但呆板;设得越大,模型越可能选择低概率词,创造力提升但不确定性增加。 "如果你的 temperature 设成 0,它百分之百会选择概率最大的词。所以它表现出来给我们的感觉就它变得呆板,创造力低,但是非常的稳定。" —— Kaiyi实战经验表明:翻译、数学题等需要精确输出的场景应将 temperature 设到最低;而写小说、创意文案等需要发散思维的场景则应调高。这个参数揭示了 AI 应用的核心权衡:没有万能配置,只有场景适配。 2. Cache 机制:为什么击中缓存能便宜这么多大模型的生成是迭代过程:每生成一个词,都要把已生成的所有词重新送回模型预测下一个。这就是为什么早期 ChatGPT 是"一个词一个词蹦出来"。Cache 机制缓存了已处理的 token,下次请求时可以复用前面的计算结果,大幅降低算力消耗。 "你会发现我所有大模型 API 都会告诉你,如果你击中了 cache 是多少钱,如果你没有击中缓存是多少钱。" —— Kaiyi"它缓存的就是我们'今天早上吃'这四个词,它就缓存在里边了。你下次再来,你是在后面又加了词,那就可以把之前那些结果拿出来去复用。" —— Kaiyi这解释了为什么 DeepSeek 等模型的缓存价格能降低"非常多"——不是慈善,而是真实的成本节省。开发者应该主动设计对话流,最大化缓存命中率。 3. Top-k 与 Top-p:另一个影响创造力的旋钮除了 temperature,Top-k 参数同样影响模型的选词策略。Top-k=2 意味着只从概率最高的前 2 个词中选择,Top-k=10 则从前 10 个词中选。OpenAI 官方文档明确建议:不要同时调整 temperature 和 Top-k,因为它们本质上影响同一件事,同时调整会让效果变得不可预测。 "OpenAI 的官方文档会告诉你,不要同时调整 temperature 和 Top-k,因为这两个本质影响是一个事儿,所以它会让你的调整变得没有那么的正交。" —— Kaiyi"一般是固定好了某一个再去调另一个。" —— Kaiyi这是典型的工程实践智慧:当两个参数相互耦合时,应该采用控制变量法,而不是盲目调参。 4. "贵但好用"的 Codex 与"快但冒烟"的 Claude开翼分享了在加拿大微软的实战经验:团队同时使用 Codex、Claude 和 Kimi,发现各有千秋。Codex 响应慢但生成的代码"直接可用";Claude 在 plan mode 下快速输出大量代码,但常因"兢兢业业干得太快"导致不可用。这种取舍让工程师不得不混用工具——有朋友直接充值 200 刀 Codex。 "Codex 的问题是速度特别慢,但实际生成效果确实不错。" —— Kaiyi"Claude 有时候就是兢兢业业干活特别快,给你代码特别多,但是有时候不可用。" —— Kaiyi这场工具之争揭示了当前 AI 编程的核心矛盾:速度与可靠性的永恒博弈。没有银弹,只有权衡。 5. 哈利波特测试:上下文塞满后的智能崩塌开翼抛出一个经典测试:将整本《哈利波特与魔法石》塞进模型上下文,再询问细节问题。结果令人意外——尽管模型拥有全部答案,却因上下文过载导致"召回能力急剧下降"。这个实验直指当前技术痛点:token 成本不仅关乎金钱,更影响模型的核心智能表现。 "当上下文塞满了之后,它的召回能力有些可能就看不到,以及它的智能一定会下降。" —— Kaiyi"把整本哈利波特塞进模型里问细节,他肯定有所有答案,但有时候回答不对。" —— Kaiyi这个残酷测试提醒我们:在追求长上下文能力时,开发者需警惕"塞得越多,忘得越快"的隐性陷阱。真正的智能或许不在于吞吐量,而在于精准提取。 6. RAG 最佳实践:从 Query 重写到 Re-rank开翼系统讲解了当前 RAG 的标准流程:首先用 embedding 模型将文档转为向量存入数据库;针对代码场景,应该同时 embed 代码本身和 LLM 生成的代码解释,双向量索引提升召回率;用户 query 进来后先做重写,将"这个城市"补全为"北京",并生成 3-5 个同义改写;每个改写检索 3-5 条文档,共得到 15 条候选;最后用 re-rank 模型重新排序,选出最相关的 3-5 条喂给大模型生成回复。 "如果你在 embedding 代码的时候,我们会先用一个小模型去给这个代码解释这个代码是干什么的。我在 embed 代码的时候生成一个向量,我在 embed 解释这段代码的地方生成一个向量,这两个向量同时可以索引这段代码。" —— Kaiyi"Query 重写也可以,因为单词有多义性,一般我们会把它重写成 3 到 5 个同意但是写法不同的句子,然后再把这 3 到 5 个向量去数据库里检索。" —— Kaiyi这套流程已经是业界共识,但每个环节都有优化空间——关键是理解原理,而不是照搬代码。 7. 为什么大公司做不好大模型开翼以亲身经历解释:大公司的决策链路太长,一个刚毕业的博士研究员提出天才想法,需要 1000 万美元训练资金时,在大公司的审批体系里"是不可能的"——每一层都要背书,失败了要背锅。而 OpenAI 这种创业公司可以把巨大资金和算力直接投给几个天才,甚至是博士实习生,让十个人试,成一个就沿着这个方向走。 "当我有一个天才的想法,我说我现在要需要 1000 万美元的训练资金,我要去验证我这个想法,在大公司的决策链路里是不可能的。" —— Kaiyi"OpenAI 这种创业公司,他们可以去把巨大的资金、巨大的算力去投入给几个天才的人,甚至是博士的实习生。而且他们的算力和钱实在太多了,他可以让十个天才去试,就有一个事成了,那他们就沿着这个方向整个方向往走。" —— Kaiyi这就是为什么苹果、亚马逊、微软这些巨头都没有成功做出自己的大模型,基本都是创业公司做成的。组织结构决定创新能力。 8. AI 时代的新开发范式:2000 行单文件与即用即抛开翼观察到一个有趣现象:一些"很牛的人"现在喜欢写 2000-3000 行的单文件代码,所有工具函数放在一起,打破了传统"超过 100 行就应该拆分"的规范。原因很简单:现在是 AI 在干活,你要服务于 AI。代码复用的成本收益比已经改变——高质量代码的生成成本极低,那就不复用了,随便改,甚至"即用即抛"都可以。 "我发现一个很有意思的风格,就是他们现在喜欢写一个文件,2000-3000 行的代码甚至更长。我们之前有个说法是超过 100 行或 150 行代码就应该被拆了。" —— Kaiyi"现在代码,特别是高质量代码的成本变得极低了,那我就不复用了。我如果要修改这个工具函数,我就随便改。因为我知道你不会影响到任何其他的地方,那甚至即用即抛都可以。" —— Kaiyi这是范式转换的信号:从"为人类可读性优化"转向"为 AI 协作优化"。复制三次以下的代码不再抽取,因为 AI 能轻松处理重复。 9. 软件工程的复兴:瀑布式开发在 AI 时代的回归开翼提出一个大胆观点:本科学的软件工程(需求-架构-开发-测试的瀑布式流程)曾被认为"非常繁琐、非常死板",但如果换成 AI 来执行呢?当 AI 强到我们要把自己看作老板时,就需要思考如何让"员工"以某种死板的形式一步步做,产出的文档和结果可以快速 review。 "如果 AI 已经强到我们要把自己看作老板,那么就需要思考如何让我们的员工以某种非常死板的形式去一步一步做。但是这个死板形式产出的文档或者产出的结果,我可以非常快速的 review。" —— Kaiyi"我如果带一个团队,我不会去一行行代码 review。我只是去看你的测试表,你的架构文档我能看懂,你的架构文档我觉得合不合适,有问题我再改。" —— Kaiyi未来的开发方式可能就是这样:像 CEO 一样只关注目标能否完成,而不在意代码里有多少 bug。验收标准从"代码质量"转向"功能达成"。 10. AI 会带来大失业吗:1-5 年动荡期后的新平衡讨论到 AI 对就业的影响,开翼给出判断:未来 1-5 年是动荡期,AI 不断侵蚀岗位,开发者不断发明新范式提高效率。但 5 年后,程序员的平均工资可能不会降甚至会升,但岗位数量一定会越来越少。原因是 AI 这波革命"没有创造新的技术岗位,只减少了"——客服、前台等岗位已经在被取代。 "我觉得五年之后,程序员的整体的工作岗位平均工资可能不会降,甚至可能会升。但是工作岗位的量一定会越来越少。" —— Kaiyi"AI 这一波革命很有意思,一波新的技术革命它没有创造新的技术岗位,它只减少了。" —— Kaiyi

    3 min
  7. Mar 10

    No.90 第一次聊 OpenClaw 龙虾

    节目简介2025年春节后第一期正式录制,辛宝、小白菜、瑞丰三位主播深度聊了聊最近火爆出圈的 OpenClaw(龙虾)。从技术产品到大众消费品,从国外一天9000个 star 到国内线下聚会遍地开花,甚至深圳政府都发文规范了。这个 AI Agent 到底有什么魔力?三位主播从爆火时间线、技术实现、实际使用体验、未来展望等多个角度,带你全面了解龙虾现象。 大纲内容1. 龙虾是什么?为什么叫龙虾?OpenClaw 是一个开源的 AI Agent,具备自主性能,能够自主完成任务。它可以接入 Telegram、Discord、飞书等即时通讯平台,24小时在线待命,随时听从指令帮你完成任务。 "他现在的名字叫做 OpenClaw,其实就是一个开源的具备自主性能,能够自主完成一些任务的 AI agent。它可以接入各种即时通讯平台,例如 Telegram、Discord 以及飞书等,你可以在手机上操作它。" —— 瑞丰为什么叫龙虾?因为 OpenClaw 的 logo 上有一个龙虾的标志,而且"OpenClaw"这个英文名发音音节较多,在国内不易传播。小龙虾的红色 logo 非常醒目,又是动物形象,很容易制作成表情包。现在很多线下活动都会点小龙虾,一边吃蒜蓉小龙虾、麻辣小龙虾,一边聊 OpenClaw,氛围感直接拉满。 2. 从0到15万 star:龙虾的爆火时间线2025年1月24-25日:创始人 Peter 参加播客,项目在国外开始爆火,一天内获得9000多个 star。 1月27日:Anthropic 向 Peter 发出侵权函,指出项目原名"ClawdBot"中的"Claude"与自家产品名称过于相似。这是第一次改名事件。 1月28日:项目改名为"MoltBot"。同日,有人创建了一个名为 MoltBook 的社区平台(类似 Reddit 的论坛),规定只能通过 AI 在上面交流,让你的 OpenClaw 在上面发帖。 1月29-30日:两天时间内,MoltBook 平台的帖子数量疯狂增长至3万多个,涌现大量有趣内容,推动 OpenClaw 持续爆火。项目 star 数在72小时内涨到6万多个。 1月30日左右:项目再次改名,更名为如今的最终名称"OpenClaw"。这是第二次改名。 2月上旬:话题在中国社区迅速引爆,几乎涵盖了中文推特、微博、知乎等所有平台。各地开始出现线下聚会。 2月中下旬至3月:热度不降反升,北京、深圳、成都等地龙虾聚会遍地开花。深圳政府甚至发文规范 AI Agent 应用。项目 star 数涨到15万。 "我本来以为最开始爆火后,过完年热度就会慢慢下去了,但没想到过完年之后热度还是越来越高。包括北京的、深圳的、成都的,看到好多个龙虾聚会,感觉热度还在持续。" —— 瑞丰3. 技术上并不新,但为什么火了?从技术角度看,OpenClaw 并不算新东西,它是已有知识和工具的组合。但它踩中了几个关键风口: 时机恰好:AI Agent 概念正热,大模型能力足够强,正好到了可以实用化的临界点。 易用性强:可以在手机上通过 IM 平台操作,门槛极低。不需要懂代码,不需要配置复杂环境,普通用户也能用。 人格化设计:具备独特的性格和表达方式,不像冷冰冰的工具。这让 AI Agent 从工具变成了"伙伴"。 社区氛围好:线下聚会、表情包、小龙虾宴,社交属性强。技术产品成功社交化,大大降低了传播门槛。 "从一个技术产品变成一个大众消费的一个产品。现在火出圈也看来也不并不一定非得是技术上的先进性,它可能踩中了很多风口。" —— 辛宝4. 实际使用体验:从安装到运行三位主播都尝试了安装和使用龙虾,分享了一些实际体验: 安装门槛:需要配置 API key、数据库、即时通讯平台等,对普通用户来说还是有一定门槛。但社区提供了大量教程和一键部署方案,降低了难度。 运行成本:如果使用 Claude 等付费模型,成本会比较高。但可以选择开源模型或国产模型降低成本。 实际效果:龙虾的自主性确实很强,可以自己规划任务、调用工具、完成复杂流程。但也会出现"幻觉"、理解偏差等问题,需要人工介入纠正。 使用场景:适合处理重复性任务、信息收集、内容生成等场景。比如定时抓取新闻、生成报告、管理待办事项等。 "相当于是一个24小时在线待命的,然后随时听从你指令,帮你完成任务的一个 AI 纯的机器人。" —— 瑞丰5. 龙虾的技术架构和核心能力瑞丰详细介绍了龙虾的技术实现: 核心架构:基于大模型(如 Claude、GPT-4)+ 工具调用(Function Calling)+ 记忆系统 + 任务规划。 记忆系统:龙虾可以记住之前的对话和任务,形成长期记忆。这让它能够理解上下文,处理跨时间的任务。 工具调用:龙虾可以调用各种外部工具,如搜索引擎、代码执行器、文件系统、API 接口等。这是它能够完成复杂任务的关键。 任务规划:龙虾可以自己拆解任务、制定计划、执行步骤、检查结果。这种自主性是传统 Chatbot 不具备的。 多平台接入:通过适配器模式,龙虾可以接入 Telegram、Discord、飞书等多个平台,实现跨平台统一管理。 6. 龙虾生态:插件、社区和商业化龙虾的生态发展非常迅速: 插件系统:社区开发了大量插件,扩展龙虾的能力。比如天气查询、股票监控、代码审查、文档生成等。 社区活跃:GitHub 上有大量 fork 和 PR,Discord 社区每天都有新的讨论和分享。线下聚会也越来越多。 商业化探索:已经有团队在探索龙虾的商业化应用,比如企业内部助手、客服机器人、内容生成工具等。 监管关注:深圳政府发文规范 AI Agent 应用,说明龙虾已经进入主流视野,开始受到监管关注。 7. 龙虾的局限性和挑战三位主播也讨论了龙虾目前存在的问题: 成本问题:使用付费模型成本较高,长时间运行可能产生不小的费用。 可靠性问题:AI 会出现幻觉、理解偏差、执行错误等问题,不能完全信任。 安全性问题:龙虾有很高的权限,如果被恶意利用或出现bug,可能造成严重后果。 隐私问题:龙虾需要访问大量个人数据和系统权限,如何保护隐私是个挑战。 监管风险:随着政府开始关注和规范,未来可能面临更严格的监管要求。 8. 未来展望:AI Agent 的下一步三位主播对 AI Agent 的未来进行了展望: 多 Agent 协作:未来可能出现多个 Agent 协同工作的场景,就像一个虚拟团队。辛宝提到了"唐僧团队"的概念:唐僧负责需求拆解,悟空负责代码实现,八戒负责审查,沙僧负责文档核查。 更强的自主性:随着模型能力提升,Agent 的自主性会越来越强,能够处理更复杂的任务。 更低的成本:开源模型和国产模型的发展,会大大降低 AI Agent 的使用成本。 更广的应用场景:从个人助手到企业应用,从内容生成到代码开发,AI Agent 会渗透到各个领域。 生产力革命:AI Agent 可能带来10倍、100倍甚至更高的生产力提升,彻底改变工作方式。 "我们开始考虑十倍以上如何解放百倍的生产力,200倍的生产力可能这可能就是其中的关键之一。""慢点解放,我怕我失业了。"金句摘录"相当于是一个24小时在线待命的,然后随时听从你指令,帮你完成任务的一个 AI 纯的机器人。" —— 瑞丰"从一个技术产品变成一个大众消费的一个产品。" —— 辛宝"小龙虾的红色 logo 非常醒目,又因为是一个动物形象,很容易制作成各种表情包或 logo。" —— 辛宝"我本来以为最开始爆火后,过完年热度就会慢慢下去了,但没想到过完年之后热度还是越来越高。" —— 瑞丰"现在火出圈也看来也不并不一定非得是技术上的先进性,它可能踩中了很多风口。" —— 辛宝"我们开始考虑十倍以上如何解放百倍的生产力,200倍的生产力可能这可能就是其中的关键之一。" —— 辛宝"慢点解放,我怕我失业了。"延伸思考: 当一个技术产品开始被政府关注和规范时,这意味着什么?是机遇还是挑战? AI Agent 会取代程序员吗?还是会成为程序员的"超级助手"? 如果 AI Agent 真的能带来100倍的生产力提升,我们的工作和生活会发生什么变化? 多个 AI Agent 协同工作时,如何协调它们的行为?如何避免冲突和混乱? AI Agent 的"人格化"是好事还是坏事?会不会让人过度依赖甚至产生情感依赖?在小宇宙查看该单集文稿

    1h 9m

Ratings & Reviews

4.5
out of 5
2 Ratings

About

Web Worker 播客是几个AI程序员闲聊的中文音频播客节目。节目将围绕程序员领域来瞎聊,聊资讯、聊职场、聊技术选型...... 只要是和 Web 开发有关的都可以聊。

You Might Also Like