AI 边角料

Felix

一个在硅谷做AI企业的实战者 大学就开始创业:游戏,VR,AI,机器人,SaaS… 分享洞察&感受 @产品,技术,商业化,创业管理 可能是踩的坑,可能是小突破 小🍠:康康的跨境AI笔记 博客: https://felixk.me/

  1. 4d ago

    Anthropic 新框架一次听懂:什么是AI Loop / 循环工程

    一:从提示词到系统——循环工程学的本质跃迁 • Boris Cherny(Anthropic)说"My job is to write loops",Google Addy Osmani、OpenClaw Peter Steinberger 同期表态:人从操作者变成架构设计者,不再逐轮对话,而是设计闭环让 AI 自己触发、执行、验收 • 循环能跑的最低配置三件事:触发(让它醒过来)、目标(告诉它去哪)、验证(决定能不能收工);没有验证的循环只是勤快的猜测机器,往代码库里灌东西没人兜底 • 越硬的目标越适合循环——修失败测试、补类型错误、迁移明确 API,AI 能自证完成;"让页面更高级"这类软目标越改越自信,人越看越心虚 • 核心区别不是提示词变长,是把自由关进可验收的笼子里:系统设计替代人盯屏幕 二:六个核心部件,缺一块自动化就会变形 • 心跳(Heartbeat)负责发现任务——CI 报错、issue 分配自动触发,不是人手动喊"开工";工作树隔离让每个循环在独立分支上操作,避免互相踩踏 • Skill 文件继承团队知识——代理踩过的坑写回仓库,知识从人脑迁移到代码;但塞太多变百科全书模型淹死,写太虚变鸡汤,最好是"别新建鉴权,用现有中间件"这种硬约束 • 连接器接入真实外部系统(开 PR、读任务、查数据库、发 Slack),否则只是本地自嗨脚本;权限在这里分水岭——能读任务和能写数据库是两个世界 • 子代理互相校验——错误代价高、验收标准清楚的场景(安全修复、支付链路、迁移脚本)值得双代理;改按钮文案也上双代理是拿显微镜看外卖小票;外部状态(issue / board)防止代理"失忆"断片 三:上循环之前,先回答五个问题 • 理解债务是头号隐性风险——老系统变黑箱原本要几年,AI 循环可以把同样过程压到几个月;关键不是"是不是 AI 写的",是代码增速有没有超过团队理解速度;对策:重要 PR 必须写设计意图,关键模块要求人类复述数据流,每周抽样做 AI 代码走读 • Token 消耗容易低估——聊天时一轮一轮看得见价格,循环里机器自己按发送;硬预算不只是省钱,是逼系统暴露卡住的位置:预算到期就停,停了就叫人,本质是一个工程停止信号 • 先问自己有没有五样东西:验证(机器证据不靠嘴说)、隔离(工作树 / 分支)、权限(读写分级)、预算(硬上限 + 告警)、训练(Skill 文件持续迭代);小团队要的是窄任务、窄权限、窄验证的可控收益,不是科幻感 • 工具越猛,刹车越牢——AI 可以无人值守地写代码,但代码不能无人负责地长大

    16 min
  2. Jun 8

    《置身钉内》:钉钉 ONE 为何拧巴

    一:真痛点撞上旧入口 • 《置身钉内》表面复盘 ONE,从立项、发布、共创到收缩;真正刺痛的是 AI 办公为什么会把“减负”做成“追着人跑” • ONE 抓到的需求很真:群聊、审批、日程、文档、待办分散,用户每天在工作软件里捞信息;失败不在问题假,而在解法太重 • 钉钉是八亿级办公产品,有老客户、老流程、老收入;新 AI 长在旧系统里,会同时被过去的成功和今天的增长压力拉扯 二:卡片流不是万能入口 • 卡片流让移动端像 AI 助理递纸条,但办公不是短视频;电脑端用户要一屏扫描、多窗口对照、快速回到上下文 • 自动已读、发现页、统一入口这些设计,把不同岗位、不同责任、不同工作心态压进同一个交互里,摩擦被集中放大 • 高压迭代能打穿明确问题,但不适合替代产品判断;AI 办公最缺的不是发布速度,而是用户敢不敢把工作交给它 三:AI 办公的下一道坎 • ONE 收缩不等于钉钉 AI 全线失败;个人版、365会员、AI搜索、AI听记、AI表格、悟空、Agent OS,是不同方向的试探 • 个人版回答“AI 归个人还是组织”,AI 表格回答业务闭环,悟空回答从看见工作到执行工作;它们不是 ONE 的简单续集 • AI 办公产品成不成,不看它替组织看见了多少人,而看它有没有让人更放心地把工作交出去

    22 min
  3. Jun 2

    我认为这是PC 的 iphone 时刻:英伟达的RTX Spark

    一:RTX Spark 不只是 AI PC • RTX Spark 的反直觉点,不是英伟达做 CPU,而是把 PC 从“点应用”推向“交目标”,让本地 agent 跨应用完成任务 • 这不是键盘鼠标明天消失,而是 Windows 机器第一次在硬件上认真为本地代理准备:Arm、GPU、统一内存、模型推理被放到同一套结构里 • 普通 AI PC 更像给旧流程加 Copilot;RTX Spark 想动的是入口逻辑,从打开软件、输入指令,变成电脑理解目标、调用工具、交付结果 二:英伟达站到主板中心 • 过去英伟达在 PC 里是“旁边那张显卡”,这次和微软、联发科凑队,等于把芯片、OS、软件权限、游戏兼容拉到一张桌上 • Windows on Arm 的深水区不是办公软件,而是《堡垒之夜》《无畏契约》《绝地求生》这类游戏;能跑只是及格,帧率、延迟、反作弊才是真测试 • 转译和兼容不能被说满:老应用打开不等于好用,游戏掉几帧、输入慢一点,用户都会立刻感知 三:从使用应用到委托电脑 • 高端 PC 的问题会变:不只问 CPU 和显卡型号,还会问本地能跑多大模型、agent 权限怎么管、隐私会不会出门 • 本地不等于天然安全;数据不出门只解决一半,另一半是智能体会不会乱看、乱传、乱改,权限沙盒、日志透明、失败可恢复会变成核心体验 • 游戏和创作也会被重写,但生成内容不等于好玩;开放世界如果没有作者节奏,可能从“开放探索”变成“开放废话” • 这颗芯片真正打开的,不是更强 AI 功能,而是从“使用应用”到“委托电脑”的新 PC 范式

    16 min
  4. May 26

    一次读懂小龙虾的开发架构:100个 Agent 之间的分层调度、熔断、交叉验证

    一:百 Agent 不撞车的三件组合拳 • 协调者(orchestrator)与专家(specialist)分层,靠角色边界切断委派死循环——三人管一百个 agent,本质上和三人管一百个外包是同一道管理题,区别是 agent 会自己启动任务、自己调工具 • 共享状态文件(status.md)充当透明看板,所有 agent 读写同一份日志,替代了人类团队的 standup meeting;Gateway 后台进程作总闸,工具调用和文件写操作全部串行化,并发冲突在入口层截断 • 三层记忆架构:工作记忆存当前上下文、情节记忆留操作日志、语义记忆沉淀规律;夜间"做梦"阶段把短期片段压缩写入长期存储,防止 agent 跑长任务时越跑越失忆 • 三十天、一百个 agent、六千多亿 token——数字的意义不在烧钱,在于这套分工机制在极端压力下跑通了 二:AI 代码质量防线:从复现到一键熔断 • crabbox 做自动复现:AI 提交的 bug fix,系统自动回放操作路径并做视频对比,绕开"人眼逐行看代码"这个速度瓶颈,把验证成本从小时级压到分钟级 • deepsec 做双 agent 交叉验证(red team 写、blue team 审),单一 agent 的系统性盲点被另一个视角覆盖,本质是把 peer review 这个人类流程 agent 化 • 三层治理兜底:黑名单拦高危工具调用、沙盒隔离副作用、Gateway 一键熔断——agent 失控的最坏结果是被硬切,而不是级联扩散烧穿账单 • 整套质量体系的核心逻辑:AI 产出速度已超过人类审查带宽,所以把人类判断挪到流程最末端,而不是嵌进每一步 三:高杠杆架构的隐性门槛与放大效应 • 这套玩法的真实门槛不是 $1.3M token 成本,而是操盘者能不能在搭架子时提前想到"agent 互相委派成死循环"这类坑——想到了一小时解决,想不到可能跑三天才发现 • 现阶段生态风险真实存在:MCP 工具链稳定性差、多 agent 并发调试工具缺位、agent 行为可解释性低;要把这套架构搬进金融或医疗零容错场景,光靠文件做状态远远不够 • 两年内生态成熟后早期坑会被填上,但现在硬上的团队承担的是早期生态税,不是技术税——风险是真实的,只是可以预判 • 如果只记一句话:这套架构放大的不是劳动力,是会想事的人的杠杆——它放大你的判断,也放大你的盲点

    15 min
  5. May 23

    为什么米哈游的AI路,比腾讯网易更激进也更危险

    一:蔡浩宇的赌注:游戏不是产品,是生命体 • 米哈游联合创始人蔡浩宇卸任国内全部职务,迁至新加坡和硅谷重新创业,同期公司宣布未来三年投入最高 1000 亿人民币做大模型,CEO 刘伟原话:"做不出来就当放了个大烟花" • 蔡浩宇在 LinkedIn 直接预言:AIGC 将批量淘汰中间层专业开发者,未来只剩前 0.0001% 的天才团队加 99% 的业余爱好者——这不是降本提效的表态,是行业结构整体洗牌的判断 • 他赌的不是"AI 帮我做游戏",而是游戏本身变成能跟玩家长期相处的虚拟生命体:对话历史即剧情,角色对玩家的态度即关卡,剧本加关卡加资产这套传统范式整体作废 二:五家公司,五坡山,可能只有一个赢家 • 谷歌押的方向最激进:AI 可以完整生成游戏,内容与规则全部生成式;微软押底层基础设施,AI 重写渲染管线,属于引擎之下的一层 • Unity 把 AI 定位成跑在端上的工具,Epic 把 AI 做成 Unreal Engine 里的新模块——两家都在赋能开发者,逻辑是"帮人做"而非"替代人做" • 米哈游管的是最上层的灵魂层:角色情感与玩家关系;五家方向分散,但赌的是同一座山,真正的赢家可能是那个把这五坡缝起来的人 三:跑得最快的人还没想清楚终点 • 米哈游家底够厚——原神、星穹铁道积累的现金流足以支撑大规模试错,但试错资本不等于方向正确,押注 AI 角色的路上没有已知的先例 • 今天所有押 AI 游戏的公司,米哈游、网易、Anuttacon,对外统一的说辞都是"AI 让游戏更有灵魂",但灵魂有副作用:一个能让玩家真实产生情感依恋的虚拟存在,对用户心理的长期影响,没有人正面说清楚 • 能让你跟数字版父亲再相处一次的 AI、让你真情实感爱上的 AI 角色,技术路线已经打通,伦理卡点才刚开始——今天大家都在比谁跑得快,但没人想清楚,跑到的那个地方是不是人该去的地方

    11 min
  6. May 23

    小龙虾 OpenClaw 的3人开发团队,如何一个月烧掉130万美元Token, OpenAI 为何乐于报销

    一:Token 消耗是新指标,但必须和产出绑定读 • Reddit 上对百万级 token 预算的集体批评站得住脚:同等资金雇七十个资深工程师,质量和可控性未必输 • 有效的评估框架应包含三个维度——bug 修复数、PR 合并数、用户留存变化;缺任意一项,烧钱速度本身没有意义 • 类比早年电商:只看 GMV 不看复购率,指标亮眼但公司虚胖;Token 消耗独立存在时同理 • Goodhart 定律的隐患:一旦 token 消耗成为考核代理变量,工程团队就有动机把它优化失真 二:单人公司叙事成立,但隐性税不能不讲 • 阿里系预测"五年内一人加 AI 做十亿美元营收"——性感,但规模触发合规介入的时间点被系统性忽略 • 供应链是第二道门槛:纯软件可以单人撑,一旦涉及硬件、金融产品、医疗服务,团队规模存在物理回弹 • 单人公司真正的适用域很窄:内容、工具软件、轻 SaaS;VC 在投资决策前需先把这条边界画死 • 叙事的吸引力恰恰来自它对例外情况的沉默,听者需要主动补上那几道隐性税 三:强监管行业是 agent 渗透的结构性上限 • 中国已明令限制国企和银行办公设备安装 OpenAI 类工具;美国企业部署一个 agent 的内部合规审查周期普遍以月计 • 医疗、金融核心系统、政府信息化——这三类领域的 agent 扩张速度不由技术决定,由监管窗口倒推 • "软件吞噬世界"的节奏在强监管赛道失效;对应赛道的投资判断需回归旧规则:看政策松紧,不看 token 速度 • 真正的边界检查从来不是技术问题,是谁有权决定什么时候可以部署

    16 min

About

一个在硅谷做AI企业的实战者 大学就开始创业:游戏,VR,AI,机器人,SaaS… 分享洞察&感受 @产品,技术,商业化,创业管理 可能是踩的坑,可能是小突破 小🍠:康康的跨境AI笔记 博客: https://felixk.me/