三杯过后

Xiaowen Zhang

一个写了将近20年的博客,突然开始有趣起来了……

Episodes

  1. Ep 002. 人类的终极考试 HLE 究竟是什么?我们离 AGI 还有多远?

    MAR 1

    Ep 002. 人类的终极考试 HLE 究竟是什么?我们离 AGI 还有多远?

    HLE 论文地址 https://www.research-collection.ethz.ch/server/api/core/bitstreams/1902b5a9-4209-4529-b278-c258aad557ba/content 提到的例题 原始题目(英文): "Which of the following have Raphidiopterans been recorded feeding on as adults? A. Nectar B. Māhoe pollen C. Fungus D. Karamū leaf tissue E. Totara Aphids F. A and E G. D and E" 中文翻译: "以下哪些是蛇蛉目(Raphidioptera)成虫被记录过的食物? A. 花蜜 B. Māhoe(新西兰本土植物)花粉 C. 真菌 D. Karamū(新西兰本土植物)叶片组织 E. Totara(新西兰罗汉松)上的蚜虫 F. A 和 E G. D 和 E" 学科背景: 蛇蛉(Raphidioptera,蛇蛉目):一类古老的捕食性昆虫,俗称"蛇蝇"(snakeflies),属于脉翅总目 食性:传统认为蛇蛉成虫和幼虫都是肉食性,捕食小型昆虫和蚜虫 选项分析: Māhoe、Karamū、Totara 都是新西兰特有植物(endemic to New Zealand) 关键陷阱:蛇蛉在新西兰根本没有分布(地理隔离)!因此 B、D、E 都不可能 尽管有零星记录称某些蛇蛉可能访花(nectar feeding),但这在学术界存在争议 答案:A(或存在争议,取决于文献来源) 难度解析: 这是一道"陷阱题"(gotcha question): 需要知道蛇蛉的地理分布(不在新西兰) 需要了解昆虫食性记录的稀缺性(Raphidioptera的成虫食性数据极少) 涉及生物地理学知识(新西兰昆虫区系的独特性) 属于昆虫分类学与生物地理学的交叉领域,模型如果没有准确的相关训练数据,很容易基于一般性推理错误选择包含新西兰植物的选项。

    17 min
  2. Ep 001. 叙事与数字:关于“AI 降本增效”泡沫的量化研究报告

    FEB 25

    Ep 001. 叙事与数字:关于“AI 降本增效”泡沫的量化研究报告

    概要 听一些 AI 热情的世界反面的声音,想一点泼冷水的事儿吧。 参考资料汇总 资料1 英文标题:Narratives vs. Numbers: A Textual and Quasi-Experimental Analysis of AI’s Early Impact on Tech Layoffs 作者: Manhal Ali 原文地址:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5987016 资料2 英文标题:Canaries in the Coal Mine?: Six Facts about the Recent Employment Effects of Artificial Intelligence(《煤矿里的金丝雀:关于人工智能近期就业影响的六个事实》) 作者:Erik Brynjolfsson、Balaji Chandar、Rex Chen 发表年份:2025年 机构:斯坦福大学数字经济实验室(Stanford Digital Economy Lab) 原文地址: PDF直链 https://digitaleconomy.stanford.edu/app/uploads/2025/12/CanariesintheCoalMine_Nov25.pdf 实验室官网页面:https://digitaleconomy.stanford.edu/publications/canaries-in-the-coal-mine/ 这篇论文研究了AI对不同职业和人群就业影响的异质性,发现某些群体(如"煤矿里的金丝雀")正率先感受到AI对劳动力市场的冲击,预示着更广泛的影响即将到来。论文已被引用97次。 资料3 英文标题:AI-Generated "Workslop" Is Destroying Productivity 中文意译:《AI生成的"工作废料"正在摧毁生产力》 原文链接: https://hbr.org/2025/09/ai-generated-workslop-is-destroying-productivity 发布时间:2025年9月22日 研究机构: BetterUp Labs(职场心理健康与绩效平台BetterUp的研究部门) Stanford Social Media Lab(斯坦福社交媒体实验室,主任为Jeff Hancock教授) 播客和专栏地址 三杯过后

    12 min

About

一个写了将近20年的博客,突然开始有趣起来了……