BearTalk AI 每日简讯

Bear Liu

《BearTalk AI 每日简讯》是一档每天更新的 AI 科技播客,由 AI 制作,人类把关。每天更新,每期约 15 分钟。 每天早上,BearTalk Agent 编辑部从 25 个经过精选的信源中采集内容:包括 Anthropic、OpenAI、Google DeepMind、Meta AI 等一线实验室的官方发布,Simon Willison、Ethan Mollick 等独立研究者的深度分析,以及 Hacker News、Reddit 等社区的一线讨论。候选内容经过多轮 AI 筛选、撰写和校对,最终提炼为 5 个值得认真对待的话题。 这档节目不追热点,不堆资讯。它只做一件事:在 AI 领域每天产出的海量内容里,找出真正影响你工作方式和思维方式的那几个信号。 音频由 Bear 的克隆音色朗读,每期约 15 分钟,适合通勤或晨间收听。 --- BearTalk AI Daily Notes is an AI and technology podcast, published every day. It is produced by the BearTalk Agent team and overseen by Bear Liu. Each morning, the system collects content from 25 curated sources: official releases from leading labs including Anthropic, OpenAI, Google DeepMind and Meta AI; in-depth analysis from independent researchers like Simon Willison and Ethan Mollick; and first-hand community discussion from Hacker News and Reddit. The candidates go through multiple rounds of AI selection, writing and review, and are distilled into five topics worth your attention. This show does not chase headlines or pile up information. It does one thing: find the signals that actually matter to how you work and think, from the flood of AI content published every day. Each episode runs around 15 minutes, narrated in Bear's cloned voice. Good for commutes and morning routines.

  1. 6h ago

    6月28日 | Claude 住进你的 Slack,AI 同事时代开始了

    本期内容 AI 从工具变成基础设施的过程,正在你的日常工作流里安静发生。本期从 Anthropic 把 Claude 做成 Slack 团队成员、OpenAI 披露 Agent 使用量翻转数据,到一个开发者公开招募两千人攻击自己的 AI、GPT-5.6 以产品家族形式登场,再到 Jack Clark 提出"超级说服"的深层警示。听完这期,你会对"委托"和"在场"这两个词有新的理解。 本期要点 - GPT-5.6 是三个模型的家族:旗舰 Sol、中端 Terra、轻量 Luna,OpenAI 开始向平台型定价逻辑转型 - Claude Tag 以团队成员身份进入 Slack 频道,持续读取上下文、接受委托,AI 从个人工具变成组织基础设施 - 独立开发者 Fernando 公开招募两千人尝试攻破自己的 AI 助手,六千封邮件无一成功,但也暴露了真实攻击向量的多样性 - OpenAI 内部数据显示 Agent 工具使用时长已在工程类任务中超越 ChatGPT,知识工作的最小单位从对话变成可委托的长期任务 - Jack Clark 提出"超级说服"概念:AI 的实时说服能力可能已超过大多数人类,而这种影响在决策完成后才会被察觉 参考资料 Previewing GPT-5.6 Sol: a next-generation model — https://openai.com/index/previewing-gpt-5-6-sol/ GPT-5.6 Preview System Card — https://deploymentsafety.openai.com/gpt-5-6-preview How agents are transforming work — https://openai.com/index/how-agents-are-transforming-work/ Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tag What happened after 2,000 people tried to hack my AI assistant — https://hackmyclaw.com(Hacker News 讨论帖) Import AI 462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.com/p/import-ai-462 --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    14 min
  2. 7h ago

    6月29日 | 两千人攻击一个 AI 助手,零次成功

    本期内容 GPT-5.6 家族发布,但旗舰模型 Sol 受政府审查影响暂未全量开放,模型分层策略开始成为行业标配。工程师用 Claude Code 产能翻三倍之后,产品判断成了新瓶颈,公司反而更需要会想清楚"做什么"的人。Agent 记忆成本一直是落地的隐性门槛,MRAgent 框架把 token 消耗砍了二十七倍,让更多场景重新变得可行。一个公开邀请两千人来攻击的 AI 邮件助手,零次被攻破,提供了一套值得参考的防御思路。最后,Benedict Evans 提醒我们:那些告诉你哪些职业会消失的图表基本不可靠,真正值得追踪的是具体任务在怎么变化。 本期要点 - GPT-5.6 推出 Sol、Terra、Luna 三级模型,旗舰 Sol 因政府审查暂限访问,模型分层是成本控制的开始 - Claude Code 让工程产出相当于原来三倍,瓶颈从"怎么做"移到了"做什么",产品判断能力正在升值 - MRAgent 通过动态重建记忆替代一次性检索,token 消耗降至 LangMem 的二十七分之一,Agent 落地成本大幅下降 - 两千名攻击者发出六千封邮件,无人攻破 AI 邮件助手 Fiu,安全来自多层叠加的设计决策而非单一功能 - Benedict Evans 指出 AI 职业暴露度研究普遍不可靠,应该追踪具体任务怎么变,而不是职业标签会不会消失 参考资料 Previewing GPT-5.6 Sol — https://openai.com/index/previewing-gpt-5-6-sol/ GPT-5.6 Preview System Card — https://deploymentsafety.openai.com/gpt-5-6-preview How agents are transforming work — https://openai.com/index/how-agents-are-transforming-work/ Statement on the US government directive to suspend access to Fable 5 and Mythos 5 — https://www.anthropic.com/news/fable-mythos-access Claude Code turned every engineer into three. Now companies need more product thinkers — https://venturebeat.com AI agent memory: MRAgent cuts token use up to 27x — https://venturebeat.com Hackmyclaw experiment (Fernando Irarrázaval) — https://fernandoi.cl Predicting AI job exposure (Benedict Evans) — https://www.ben-evans.com --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    15 min
  3. 1d ago

    6月27日 | 政府五点发令,Anthropic 当晚关掉两款旗舰模型

    本期内容 这期节目有一条贯穿始终的主题:谁来决定 AI 能做什么、不能做什么。政府可以在五点多发一封信,让两款旗舰模型当晚消失;AI 可以悄悄加入你的 Slack,变成一个有记忆的团队成员;研究人员发现 AI 的说服力已经超过世界辩论冠军;而一个蜜罐实验则证明,真正的 AI 安全靠的是权限设计,不是模型聪明。这期节目适合所有在工作流里依赖 AI 工具的人听,你会重新想一想:你的工具,究竟有多稳? 本期要点 - 美国政府以国家安全为由向 Anthropic 发出出口管制指令,Fable 5 和 Mythos 5 当晚全面下线,覆盖范围甚至包括公司内部外籍员工 - Anthropic 推出 Claude Tag,让 Claude 直接作为成员加入 Slack 频道,具备持续记忆和工具调用能力,无需切换任何 AI 产品 - 牛津、斯坦福等机构联合研究发现,AI 在近两万次对话实验中,说服力全面超过世界辩论冠军和专业游说人员 - 开发者 Fernando 公开邀请全球两千余人攻击其 AI 助手蜜罐,六千封攻击邮件无一成功,核心原因是架构权限设计,而非模型识别能力 - Product Hunt 热门产品 Cloud World Model 可在零费用环境中模拟 AWS、GCP 和 DigitalOcean,解决云架构学习中的账单压力问题 参考资料 美国政府出口管制声明 — https://www.anthropic.com/news/fable-mythos-access Claude Tag 官方介绍 — https://www.anthropic.com/news/introducing-claude-tag AI 说服力研究(Import AI 462 期引用,arXiv) — https://importai.substack.com AI 蜜罐实验完整记录 — https://hackmyclaw.com(Fernando Irarrázaval 个人博客,由 Simon Willison 推荐) Cloud World Model — https://www.producthunt.com(搜索 Cloud World Model) --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    13 min
  4. 1d ago

    6月28日 | Google 搜索框二十五年没动过,今天它变了

    本期内容 AI 和你协作的方式正在从四面八方同时改变。Claude Tag 让 AI 直接加入团队 Slack 频道,记忆从私人变成了集体的;Google 二十五年来第一次重新设计搜索框,信息和人的关系正式换了逻辑;开源模型 GLM-5.2 在 Agent 能力上越过了一个关键门槛;同时,AI 记忆管理有了更聪明的解法,GPT-5.6 家族也带着政府审查的印记悄悄来了。本期帮你把这五件事放在一起看,理解它们共同指向的方向。 本期要点 - Claude Tag 正式让 AI 以团队成员身份加入 Slack,共享上下文、接受委托、主动完成任务,AI 的记忆从个人变成团队共有 - OpenAI 发布 GPT-5.6 三款型号 Sol、Terra、Luna,目前仅向预览合作伙伴开放,政府提前介入审查是这次发布最值得关注的信号 - 新加坡国立大学 MRAgent 框架用边推理边检索的方式,将 token 消耗压缩至主流方案的二十七分之一,为 AI 代理的记忆管理提供了可参考的设计思路 - Google 宣布二十五年来首次重新设计搜索框,原生支持语音、图像、视频多模态输入,直接给答案取代蓝色链接,内容创作者的 SEO 逻辑面临根本性挑战 - 清华 KEG 团队发布的开源模型 GLM-5.2 在 Agent 任务上首次进入顶级闭源模型的能力区间,AI 研究者 Nathan Lambert 将其定性为开源代理能力的真正分水岭 参考资料 Introducing Claude Tag — https://www.anthropic.com/news/claude-tag OpenAI Unveils GPT-5.6 Sol, Terra and Luna Models — https://venturebeat.com GPT-5.6 系统卡 — https://openai.com/deployment-safety-hub New Agentic Memory Framework Uses 118K Tokens Per Query — https://venturebeat.com MRAgent 论文 — https://arxiv.org/abs/2606.06036 Google Just Redesigned the Search Box for the First Time in 25 Years — https://venturebeat.com GLM-5.2 Is the Step Change for Open Agents — https://www.interconnects.ai --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    16 min
  5. 2d ago

    6月26日 | 两千人黑不掉这个 AI 助手,他们都用了什么方法

    本期内容 今天五件事,从黑客实验到说服力研究,从团队协作到政府禁令,勾勒出 AI 正在快速嵌入权力结构、组织结构和认知结构的轮廓。你会听到一个两千人参与、零人成功的安全实验,一项让人发凉的说服力研究结论,以及 Claude 以「团队成员」身份进入 Slack 这件小事背后的大转变。听完这期,你对「AI 能不能用、谁可以用、用了之后发生什么」这三个问题,会有更清晰的认知框架。 本期要点 - OpenAI 发布 GPT-5.6 三件套 Sol、Terra、Luna,按复杂度分层定位,但目前仅限预览合作伙伴访问,政府参与了发布节奏的管理 - Anthropic 收到美国政府指令,紧急暂停所有外国公民访问 Fable 5 和 Mythos 5,包括持签证的外籍员工,无具体理由说明 - Claude Tag 正式推出,可作为真实团队成员加入 Slack 频道,记住上下文、主动规划任务、响应 @ 召唤,不只是一个问答插件 - 博主 Fernando 公开邀请两千人攻击他的 AI 法律助手,超过六千封攻击邮件无一成功,文章详细记录了各类攻击模式 - 牛津、斯坦福等机构联合研究证实,AI 的说服效果已决定性地超过人类专家,且无需造假,只需更好的框架和更准确的认知切入点 参考资料 OpenAI GPT-5.6 发布报道 — https://openaifoundation.org/ Anthropic 官方声明:暂停 Fable 5 和 Mythos 5 访问 — https://www.anthropic.com/news/fable-mythos-access Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tag What happened after 2,000 people tried to hack my AI assistant — https://hackmyclaw.com Import AI 第462期:超级说服力与通往 AGI 的路径 — https://importai.substack.com --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    15 min
  6. 2d ago

    6月27日 | AI 的说服力已经超过人类专家了

    本期内容 AI 正在同时从多个方向往前推:模型更强、说服力超人类专家、开源管控争论持续、Adobe 重构设计工作流、而那些告诉你"哪些职业要消失"的图表,其实掩盖的是最深的不确定性。今天这五件事,帮你看清 AI 和你自己工作之间的具体关系,而不是宏观的恐慌或乐观。 本期要点 - OpenAI 一次发布 Sol、Terra、Luna 三款 GPT-5.6 模型,分层定价成平台标配,但受美国政府要求暂时限制访问 - 牛津、斯坦福等机构联合研究证实:AI 的说服效果已系统性超过人类专家,谁在决定 AI 向哪个方向说服人,是产品设计必须正视的问题 - 一篇反对禁止开源 AI 的观点文章被各大主流媒体拒稿后发在 Substack,作者认为禁令在技术上无效、在政策上适得其反 - Adobe 将代理式工作流嵌入整个 Creative Cloud,从生成单张内容升级为跨工具任务编排,设计师角色从操作者变为流程设计者 - Benedict Evans 指出预测 AI 对工作的冲击几乎不可能,因为工作本身在持续变形,与其看替代率图表,不如自己梳理任务清单 参考资料 Previewing GPT-5.6 Sol — https://openai.com/index/previewing-gpt-5-6-sol/ GPT-5.6 Preview System Card — https://deploymentsafety.openai.com/gpt-5-6-preview Import AI 462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.com Banning Open Source AI Would Be A Mistake — https://interconnects.ai Adobe embeds agentic AI workflows across Creative Cloud — https://venturebeat.com Predicting AI job exposure — https://www.ben-evans.com --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    13 min
  7. 3d ago

    6月26日 | AI 进了你的 Slack 频道,团队工作要怎么重新分工

    本期内容 AI 正在从个人工具变成组织基础设施。本期五个话题围绕同一条主线展开:agent 如何重新定义知识工作的基本单位,Claude 如何以团队成员而非工具的身份进入协作流,开源模型在 agent 能力上完成质变,以及提示词注入为何是架构层面的系统性问题而非可以打补丁修掉的漏洞。听完这期,你会对"AI 融入团队"这件事有更清醒的判断:能力是真实的,责任边界也需要重新划定。 本期要点 - OpenAI 内部数据显示,员工已将复杂多步任务大量委托给 agent,知识工作的单位正从单次交互变为可被委托的长程任务 - Anthropic 推出 Claude Tag,让 @Claude 以团队成员身份进驻 Slack 频道,积累上下文、执行任务,对整个团队透明 - GLM-5.2 被 Nathan Lambert 认定为开源 agent 的门槛时刻,agent 能力存在离散的阈值效应,越过临界点后效用出现非线性跳升 - Lambert 与 Kevin Xu 联合撰文反对禁止开源 AI,指出真正的风险是少数机构垄断 AI 决策权,而非开源本身 - 牛津大学等机构研究者提出新框架:提示词注入的根源是 LLM 无法区分自己的指令与外部输入内容,是架构层面的身份认知问题 参考资料 How agents are transforming work — https://openai.com/index/how-agents-are-transforming-work/ Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tag GLM-5.2 is the step change for open agents — https://www.interconnects.ai(Nathan Lambert, Interconnects) Banning Open Source AI Would Be A Mistake — https://www.interconnects.ai(Nathan Lambert & Kevin Xu, Interconnects) Prompt Injection as Role Confusion: A Theory of Prompt Injection — https://role-confusion.github.io --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    14 min
  8. 3d ago

    6月25日 | AI 说服力已经超过世界辩论冠军

    本期内容 这期节目围绕一个核心问题展开:当 AI 能力足够强,我们和它协作的瓶颈到底在哪里?五篇内容从不同角度切入同一个答案:不是工具不够用,是信任边界还没想清楚。从 OpenAI 内部数据揭示的使用习惯门槛,到 Claude 进入 Slack 团队频道,再到一项证明 AI 说服力超越世界辩论冠军的大规模实验,听完这期你会对"委托给 AI"这件事有更具体的感受,也会对它的风险边界有更清醒的认识。 本期要点 - OpenAI 内部数据显示,员工花了数月才从聊天模式转向委托模式,代理的真正门槛是使用习惯而非技术 - Claude Tag 让 Claude 以团队成员身份常驻 Slack 频道,有上下文记忆,可随时被 @ 处理任务 - GLM-5.2 在自主多步工具调用能力上出现质变,本地部署的代理方案开始真正可用 - 牛津、斯坦福等机构联合研究发现,AI 个性化说服成功率在每一轮对比中都高于人类专家,包括世界辩论冠军 - AI 代理最大的失败模式是跑错方向却一直跑下去,写指令时加上"什么情况下停下来问我"是当前最实用的应对方式 参考资料 How Agents Are Transforming Work — https://openai.com/index/how-agents-are-transforming-work/ Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tag GLM-5.2 is the step change for open agents — https://www.interconnects.ai/ AI systems out-persuade expert humans — https://arxiv.org/ Can AI Learn Good Judgment — https://every.to/context-window --- BearTalk 狗熊有话说播客,始于 2012 年。 订阅地址:https://beartalking.com/page/podcast

    15 min

About

《BearTalk AI 每日简讯》是一档每天更新的 AI 科技播客,由 AI 制作,人类把关。每天更新,每期约 15 分钟。 每天早上,BearTalk Agent 编辑部从 25 个经过精选的信源中采集内容:包括 Anthropic、OpenAI、Google DeepMind、Meta AI 等一线实验室的官方发布,Simon Willison、Ethan Mollick 等独立研究者的深度分析,以及 Hacker News、Reddit 等社区的一线讨论。候选内容经过多轮 AI 筛选、撰写和校对,最终提炼为 5 个值得认真对待的话题。 这档节目不追热点,不堆资讯。它只做一件事:在 AI 领域每天产出的海量内容里,找出真正影响你工作方式和思维方式的那几个信号。 音频由 Bear 的克隆音色朗读,每期约 15 分钟,适合通勤或晨间收听。 --- BearTalk AI Daily Notes is an AI and technology podcast, published every day. It is produced by the BearTalk Agent team and overseen by Bear Liu. Each morning, the system collects content from 25 curated sources: official releases from leading labs including Anthropic, OpenAI, Google DeepMind and Meta AI; in-depth analysis from independent researchers like Simon Willison and Ethan Mollick; and first-hand community discussion from Hacker News and Reddit. The candidates go through multiple rounds of AI selection, writing and review, and are distilled into five topics worth your attention. This show does not chase headlines or pile up information. It does one thing: find the signals that actually matter to how you work and think, from the flood of AI content published every day. Each episode runs around 15 minutes, narrated in Bear's cloned voice. Good for commutes and morning routines.