Hacker News 每日播报

Hacker News 每日播报 2025-10-16

欢迎收看 Hacker News 每日播报,今天我们将探讨 Windows 11 引发的隐私担忧、从零开始训练 LLM 的激动人心时刻、TurboTax 如何阻碍免费报税、Zed 编辑器登陆 Windows 的得与失,以及食蚜蝇的迁徙如何引发了关于星际旅行的遐想。

告别 Windows 10:微软正走向“监控国家”吗?

随着 Windows 10 即将退役,一篇措辞严厉的文章指出,微软正通过 Windows 11 将用户推向一个“监控国家”。文章作者认为,Windows 11 在设计上对数据隐私构成了前所未有的威胁,现在是个人和企业用户认真考虑转向 Linux 的时候了。

文章列举了 Windows 11 的几大“罪状”:

  • 强制硬件升级:通过 TPM 和安全启动等要求,迫使用户购买新硬件,从而将用户锁定在其生态系统中。
  • 误导性安装选项:默认设置诱导用户将数据同步到 OneDrive,且难以撤销。
  • 强制安装 AI 工具:AI 工具 Co-pilot 在未经用户同意的情况下被安装并启用,且难以移除。
  • 侵入性“Recall”功能:即将推出的“Recall”功能会将用户活动快照保存到云端,进一步加剧了监控担忧。
  • 强制使用 Edge 浏览器:通过各种“暗模式”设计,强迫用户使用自家的 Edge 浏览器。

鉴于这些问题,作者强烈建议客户转向 Linux,并推荐了 Zorin OS、PopOS、Ubuntu 等多个发行版。

围绕这一话题,技术社区展开了热烈讨论。许多人对作者的观点表示赞同,认为 Windows 11 的隐私问题和强制性功能确实令人不安。大家积极分享转向 Linux 的经验和建议,其中 Linux Mint 因其与 Windows 相似的用户体验而被誉为最平稳的过渡选择,而 Debian Stable 与 Cinnamon 桌面环境的组合也备受推崇。

对于游戏玩家这一特殊群体,大家指出,得益于 Valve 的 Proton 技术和 Steam Flatpak,如今在 Linux 上玩游戏已不再是难题,大多数非内核级反作弊的游戏都能良好运行。

不过,讨论也触及了 Linux 推广的现实挑战。有人提醒,普通用户可能并不像技术爱好者那样关心隐私问题,因此在推广时应更关注用户的实际需求,如速度、无广告和成本节约。此外,硬件兼容性仍是一个不容忽视的障碍,例如有用户就遇到了 AMD 显卡在 Linux 下的随机闪烁问题。

有趣的是,关于 TPM 和安全启动的看法也出现了分歧。一些人认为,这些技术本身具有安全价值,许多 Linux 发行版也能很好地支持它们;问题在于微软将其作为“强制性”的最低要求,限制了用户的选择自由。

从零编写 LLM(二十二):亲手训练自己的大语言模型

Giles Thomas 的“从零开始编写 LLM”系列迎来了激动人心的第 22 部分——模型训练。经过漫长的铺垫,作者终于将所有组件整合,亲眼见证了自己搭建的 LLM 开始生成文本。

文章的亮点在于,在一个仅有 2 万字符的小数据集上,模型在 RTX 3090 上训练短短十秒,就能生成初步连贯的文本。更令人振奋的是,当加载 OpenAI 原始 GPT-2 模型的权重后,模型立刻展现出惊人的能力,这直观地展示了预训练模型的强大威力。

在技术细节上,作者分享了实践中的挑战。例如,由于代码中存在大量随机性,完全复现书中的结果变得异常困难。他还介绍了超越传统 SGD 的 AdamW 优化器,并形象地将其比喻为给梯度下降的“球”赋予动量,使其能越过局部最优解。为了避免模型简单地“鹦鹉学舌”般重复训练数据,文章还介绍了温度(temperature)和 Top-K 采样等技术,以增加生成文本的多样性和质量。

这篇文章在社区中引发了对学习方法和实践成本的深入探讨。许多人将这个系列与 Andrej Karpathy 的 nanogpt 等项目相提并论,认为这种从底层构建 AI 的方式极具教育意义。

关于如何更好地学习 LLM,社区出现了有趣的观点碰撞。有人认为,像 Sebastian Raschka 的《从零开始构建大型语言模型》这类书籍虽然代码详尽,但在“建立直觉”方面有所欠缺。另一些人则反驳称,在机器学习领域,理解背后的数学原理比模糊的“直觉”更重要。不过,Karpathy 的“Zero to Hero”系列视频因其在构建直觉方面的出色表现而备受推崇。

此外,关于训练成本的讨论也从理论走向了实践。有经验的开发者指出,在比较本地 GPU 与云端集群的成本时,绝不能只看硬件费用,还必须考虑数据传输、环境调试等“隐藏开销”,这些因素在实际项目中可能显著影响总成本和效率。

TurboTax 如何在 20 年间阻止美国人免费报税 (2019)

这篇来自 ProPublica 在 2019 年的深度调查报道,至今仍在技术社区中反复被提及。它揭露了 TurboTax 的母公司 Intuit 如何通过长达二十年的游说和商业策略,成功阻止美国政府为公民提供免费、简化的报税服务——而这种服务在许多发达国家早已是标配。

报道的核心观点是,Intuit 的商业帝国建立在美国税收制度的复杂性之上。为了维护这一模式,该公司采取了多种手段:

  • 强大的游说攻势:投入巨资游说国会,甚至推动立法,明确禁止美国国税局(IRS)开发自己的免费报税系统。
  • 操纵“Free File”计划:作为与政府协议的一部分,Intuit 承诺为低收入人群提供免费报税服务,以换取 IRS 不与自己竞争。然而,他们却通过技术手段(如在网页中添加代码阻止搜索引擎收录)来限制该计划的可见性。
  • “免费”的陷阱:Intuit 推出的商业“免费版”充满了欺骗性的设计(即“暗模式”),诱导用户在报税流程的最后一步才发现需要付费,让数百万本应符合免费条件的用户最终支付了费用。

这篇报道的影响深远,每次报税季来临或有相关新闻出现时,它都会在 Hacker News 等社区被重新分享和讨论。这表明,大型科技公司如何利用其影响力操纵市场、阻止公共服务以及通过欺骗性营销牟利,是科技从业者持续关注的伦理焦点。这种反复的讨论也反映出社区对企业不当行为的普遍不满,以及对更公平、透明系统的持续呼吁。

美国国税局(IRS)开源其“事实图谱”项目

美国国税局(IRS)最近开源了一个名为“事实图谱”(Fact Graph)的项目,这是一个用于建模美国税法的知识图谱。该项目源自已被取消的 IRS Direct File(免费直接报税)计划,旨在提供一个标准化的工具来以声明方式处理复杂的税法逻辑。

这个项目一经发布,便引发了社区的热烈讨论。首先,大家很快澄清了一个误解:这个 GitHub 仓库本身是知识图谱的引擎和工具,而实际的税法数据则存放在另一个相关的仓库中。

然而,讨论的焦点迅速转向了 Direct File 项目被取消一事。许多人对此表示极度失望和愤怒,认为这是 TurboTax 等商业报税软件公司游说成功的恶果,直接损害了普通纳税人的利益。这种“愚蠢的政治操作”让大家对现有体系感到不满。

在对商业软件的声讨中,许多用户开始积极推荐替代方案,其中 FreeTaxUSA 和 Cash App Taxes 因其更低廉的费用和更友好的用户体验而备受推崇。

此外,这个开源项目也激发了人们对 AI 应用的想象。有人提出,将 Fact Graph 与大型语言模型(LLM)结合,或许能提供有趣的税务建议。但大家普遍认为,虽然 LLM 可以帮助发现潜在的抵扣项,但鉴于税法的复杂性和 LLM 的“幻觉”风险,所有建议都必须经过人工核实并参考官方说明,否则可能带来严重的法律后果。

高性能代码编辑器 Zed 现已登陆 Windows 平台

以高性能和原生体验著称的代码编辑器 Zed,在万众期待下终于正式登陆 Windows 平台。Zed 团队强调,其 Windows 版本并非简单的跨平台封装,而是通过直接调用 DirectX 和 DirectWrite 等底层 API 实现,旨在提供最原生的外观和性能。此外,它还深度集成了 WSL 和 SSH 远程开发功能,所有 AI 和扩展功能也已完全支持。

然而,Zed 的 Windows 首秀在社区中引发了复杂而激烈的讨论,主要集中在以下几个方面:

安装包体积之谜

许多用户对 Zed 超过 400MB 的安装包大小感到震惊,这与大家对“高性能、轻量级”的期待相去甚远。深入探究后发现,这主要是由于 Rust 默认的静态链接方式以及庞大的依赖树(超过 2000 个 crate)所致,其中用于协作功能的 webrtc-sys 和 tree-sitter 语法解析器是主要的“重量级”组件。有人认为,与 Sublime Text(约 52MB)相比,这个体积“令人尴尬”;但也有人辩护称,考虑到 Zed 提供的丰富功能,应将其视为一个准 IDE,400MB 在当今环境下并非不可接受。

性能与用户体验