欢迎收看 Hacker News 每日播报,今天我们聊聊如何用 AI 复活 25 年前的内核驱动、NPM 供应链再响警报、GPT-5 惊人的搜索能力、代码格式化的存废之争、能效百倍于 GPU 的模拟光计算机、开源照片管理神器 Immich、日本为何坚持自研浮点加速器、声霸卡 Sound Blaster 的传奇故事,以及那些挑战编程思维极限的深奥语言。
用 AI 复活 25 年前的内核驱动
一位开发者上演了一场“技术考古”与“未来科技”的奇妙碰撞。为了从 90 年代的老式 QIC-80 磁带中恢复数据,他必须使用一个名为 ftape 的 Linux 内核驱动。然而,这个驱动自 2000 年以来就停止了维护,只能在古老的内核 2.4 版本上运行。这意味着每次恢复数据,都得启动一台尘封的老旧 PC。
为了摆脱这种不便,他大胆地向 AI 编码助手 Claude Code 求助,希望将这个“活化石”般的驱动程序现代化。出人意料的是,Claude 像一位勤奋的初级工程师,通过分析编译器错误并进行多轮迭代,成功地将所有过时的内核 API 和数据结构替换为现代版本。接着,在开发者的指导下,Claude 还为这个驱动创建了独立的构建系统,使其能作为一个可加载的内核模块(.ko 文件)在最新的 Linux 系统上运行。
整个调试过程充满了人机协作的智慧。开发者将新驱动的日志输出与之前成功运行时的“标准答案”进行对比,并将差异反馈给 Claude。AI 最终精准地定位到问题在于模块参数的默认值错误,导致 I/O 端口配置失败。经过短短两个晚上的奋战,这个沉睡了 25 年的驱动程序在现代 Linux 内核 6.8+ 上被成功唤醒,顺利完成了磁带数据的读取。
这个案例生动地展示了 AI 在现代化遗留系统方面的巨大潜力。AI 在处理代码翻译、API 升级和模式识别等规则明确的任务时表现出色,能极大地提高效率。然而,这并非意味着人类专家的退场。在内核驱动这样对稳定性、安全性和性能要求极高的领域,AI 生成的代码仍需人类的严格审查和专业指导。AI 更像是一个强大的技能倍增器,它能显著降低学习新技术的门槛,让开发者专注于更高层次的架构设计和创造性工作,但核心的编程思维、系统设计和调试技巧,依然是人类工程师不可替代的价值所在。
NPM 热门包 debug 和 chalk 遭供应链攻击
开源软件世界再次响起安全警报。NPM 生态系统中两个极其热门的包——debug 和 chalk,连同其他 16 个相关包,遭遇了严重的供应链攻击。这些包每周的总下载量超过 20 亿次,影响范围之广,令人咋舌。
攻击者通过网络钓鱼邮件获取了维护者的账户权限,并向这些包的新版本中注入了恶意代码。这段恶意代码专门针对用户的浏览器环境,其目标是静默拦截加密货币和 Web3 相关的活动。它通过“钩住”(hooking)浏览器核心的网络请求函数(如 fetch)和主流钱包接口(如 window.ethereum),在用户毫不知情的情况下,篡改交易中的收款地址。
为了增加隐蔽性,恶意代码甚至会使用与原始地址看起来相似的地址进行替换,使得普通用户极难察觉。这意味着,即使用户界面上显示的是正确的收款方,实际签名的交易也会将资金导向攻击者控制的账户。
这起事件再次凸显了开源供应链的脆弱性。它提醒所有开发者和组织,依赖管理和安全审计至关重要。在享受开源带来的便利的同时,必须时刻保持警惕,采取必要的安全措施,例如锁定依赖版本、使用代码签名和多因素认证等,以保护自己的项目免受此类攻击的侵害。
ChatGPT 中的 GPT-5 思维模式在搜索方面表现惊人
以往我们常说“不要把聊天机器人当搜索引擎用”,但随着 GPT-5 的出现,这条建议可能已经过时了。技术作家 Simon Willison 发现,ChatGPT 中新的“GPT-5 Thinking”模式展现出了堪称“研究小妖精”(Research Goblin)的强大搜索与信息综合能力。
这个“小妖精”似乎对任何问题都抱有无穷的好奇心和探索欲,愿意投入“不合理”的精力去互联网上挖掘答案。Willison 通过一系列生动的例子展示了它的威力:
- 识别建筑:仅凭一张火车上随手拍的模糊照片,它就能准确识别出英国雷丁的“The Blade”大厦。
- 调查产品:当发现英国星巴克没有蛋糕棒时,它不仅查明了产品历史,还通过“阅读”官网的 PDF 过敏原指南,确认了其不在特定门店销售。
- 挖掘历史:为了探究一家餐厅内部洞穴的来历,它不仅找到了 19 世纪的建筑历史,还翻阅了城市规划文件和租赁手册的 PDF,甚至在发现关键考古报告可能未在线公开后,主动草拟了一封信息索取邮件。
这种能力的背后,是“工具调用”(tool calling)和“思维链”(chain-of-thought)技术的深度结合。模型能够执行搜索、推理结果,然后根据推理进行下一步搜索,形成一个高效的“交错思维”循环。
这一进步无疑极大地提升了信息获取的效率,将从“好奇”到“获得答案”的时间大大缩短。然而,这也引发了新的思考。尽管 GPT-5 表现“胜任”,但 AI 的“幻觉”问题依然存在,验证信息来源变得尤为重要。它更像一个强大的研究助理,而非简单的搜索引擎,擅长综合信息和理解复杂意图。未来,搜索的范式或许将从关键词匹配转向与 AI 助手的深度对话,而如何在这种协作中保持批判性思维,将是每个用户都需要学习的课题。
代码格式化本应是不必要的
我们今天还在为代码是用制表符还是空格、括号是否换行而争论不休,这在一些资深程序员看来,简直是一种“历史的倒退”。文章作者 Max Leiter 回忆起上世纪 80 年代 Ada 语言的开发环境,那时,代码格式化根本不是问题。
当时,Ada 的开发系统并不存储纯文本源代码,而是使用一种名为 DIANA 的中间表示(IR)。这意味着源代码本身只是这棵抽象语法树的一种“漂亮打印”(pretty-printing)。每个开发者都可以根据自己的偏好,设置不同的显示风格,而不会影响底层代码的存储。这种被称为“投影编辑”(projectional editing)的方式,从根本上消除了所有关于代码格式的争论。
理想与现实的碰撞
这种基于 IR 的开发模式在理论上优势明显:它不仅能解决格式问题,还能带来更强大的 IDE 功能,如增量编译、语义感知的重构和更智能的代码补全。然而,为什么最终是纯文本代码成为了事实上的标准呢?
答案在于简单性和通用性。纯文本是人类可读的,可以用任何简单的文本编辑器打开。更重要的是,它与 Unix 哲学中的“小工具组合”完美契合。像 grep, diff, sed 这样的命令行工具在处理纯文本时威力无穷。尤其是在版本控制方面,git diff 和 git merge 对纯文本的强大支持是其成功的关键。如果代码以复杂的 IR 形式存储,版本对比和合并将变得异常困难,极大地增加了协作的门槛。
此外,早期 Ada 开发系统的高昂成本和封闭生态也限制了其普及。相比之下,纯文本的低门槛和开放性使其迅速传播,并形成了庞大的生态系统。
如今,像 Prettier、Black 这样的自动化格式化工具,虽然只是“治标不治本”的补丁,但它们通过强制执行一致的风格,已经极大地减少了团队内部的无谓争论。这场关于代码存储方式的讨论,反映了软件开发中理想主义与实用主义的持续张力。未来,或许能在保留纯文本便利性的同时,更好地融入 IR 的优势。
用于 AI 推理和组合优化的模拟光计算机
《自然》杂志上的一篇论文,为我们揭示了计算领域的下一个可能突破口:模拟光计算机(AOC)。面对 AI 模型日益增长的能耗和延迟挑战,传统的数字计算正逐渐逼近极限,而 AOC 有望在效率和速度上实现数量级的飞跃。
这台计算机的精妙之处在于,它将模拟电子元件与三维光学技术在一个反馈回路中结合,实现了完全在模拟域内的计算。光学部分负责高效的矩阵-向量乘法,而电子部分则处理非线性操作。整个过程避免了耗能的数字-模拟转换,从而实现了惊人的能效。研究人员预测,在 8 位精度下,AOC 的能效可达到每瓦 500 万亿次操作(500 TOPS/watt),比当前顶级的 Nvidia H100 GPU 高出 100 倍以上。
AOC 不仅擅长加速 AI 推理,尤其是在深度平衡网络这类需要迭代计算的模型上,还能高效解决组合优化问题,例如在金融交易结算、医学图像重建等领域展现了巨大潜力。更重要的是,它采用消费级的光学和电子元件构建,为未来的大规模商业化铺平了道路。
当然
Informationen
- Sendung
- HäufigkeitTäglich
- Veröffentlicht8. September 2025 um 23:45 UTC
- BewertungUnbedenklich