Seventy3

任雨山

5.0 (1)
TECHNOLOGY

73播客，名字取材于Sheldon最喜欢的数字，内容由NotebookLM生成，每天跟随AI读AI业界论文。

4H AGO

【第502期】Polymarket无风险套利

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets Summary Polymarket 是一个预测市场平台，用户可以通过交易与特定结果挂钩的份额来对未来事件进行投机，这些结果被称为条件（conditions）。每个市场都对应一组一个或多个这样的条件。为了确保市场能够正确结算，条件集合必须是完备的——即整体上涵盖所有可能结果——并且是互斥的——即最终只能有一个条件被判定为真。因此，所有相关结果的价格之和应当等于 1 美元，代表任一结果发生的总概率为 1。尽管有这样的设计，Polymarket 仍然存在相关资产被错误定价的情况，使得某一确定结果可以以低于（或高于）1 美元的价格被买入（或卖出），从而保证获利。这种现象被称为套利（arbitrage），可能使具备一定复杂策略能力的参与者利用这些不一致性牟利。在本文中，我们基于 Polymarket 的数据开展了一项经验性套利分析，以回答三个核心问题：(Q1) 什么条件会导致套利机会的产生？(Q2) Polymarket 上是否实际发生了套利行为？(Q3) 是否有人利用了这些套利机会？在分析相关市场之间的套利时，一个主要挑战在于需要在大量市场和条件之间进行可扩展的比较；朴素的方法需要进行 O(2n+m) 级别的比较，计算成本极高。为此，我们采用了一种由启发式方法驱动的降维策略，基于时间相关性、主题相似性以及组合关系来缩小比较范围，并通过专家意见进一步验证。我们的研究揭示了 Polymarket 上两种不同形式的套利行为：市场再平衡套利（Market Rebalancing Arbitrage），其发生于单一市场或单一条件之内；以及组合套利（Combinatorial Arbitrage），其跨越多个市场。我们利用链上历史订单簿数据，分析了这些套利机会在何时存在，以及在何时被用户实际执行。研究结果显示，被成功利用并实现的套利利润总额约为 4000 万美元。原文链接：https://arxiv.org/abs/2508.03474

17 min
1D AGO

【第501期】基于可验证奖励强化学习的未来事件预测

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Outcome-based Reinforcement Learning to Predict the Future Summary 带有可验证奖励的强化学习（Reinforcement Learning with Verifiable Rewards，RLVR）已被证明是一种有效方法，可提升大语言模型在编程和数学等领域中的推理能力。在本文中，我们将 RLVR 方法应用于现实世界未来事件的预测这一任务——由于结果高度噪声化且存在显著延迟，这对强化学习而言尤具挑战性。我们使用了一个新构建的数据集，其中包含来自预测市场的最新问题以及与之相关的新闻标题。实验表明，一个相对紧凑的（140 亿参数）推理模型，经过训练后，其预测准确率可以达到甚至超过 o1 等前沿模型，同时在概率校准方面有显著提升。该模型的性能在实践中也具有现实意义：在一项 Polymarket 的交易仿真中，我们估计该模型在测试集所有问题上的下注将带来超过 10% 的投资回报率（ROI）。此外，我们还详细介绍并比较了模型训练中采用的多种方法，包括：利用合成预测问题扩充训练数据、用于保障学习稳定性的防护机制（guardrails），以及在推理阶段采用的中位数预测采样策略。原文链接：https://arxiv.org/abs/2505.17989

16 min
2D AGO

【第500期】平衡工作证明：多重哈希关联挖矿理论

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Proof of Balanced Work: The Theory of Mining Hash Products Summary 我们提出了一种新的方法，用于将不同的 PoW（工作量证明）挖矿算法以乘法方式组合成一种新的、类似 PoW 的挖矿算法，使得各个单独算法的算力提升都会对组合后的最终算力产生影响。这意味着，要实现高效挖矿，所有被组合的算法都必须以一种均衡且高效的方式同时进行挖掘。因此，我们提出的方法可以作为一种新工具，用于针对特定硬件需求精心设计新的挖矿算法，并提升对 ASIC 的抗性。例如，将 CPU 算法与 GPU 算法进行组合，就会要求矿工必须同时使用 CPU 和 GPU 硬件，才能实现高效挖矿。原文链接：https://raw.githubusercontent.com/CoinFuMasterShifu/ProofOfBalancedWork/main/PoBW.pdf

15 min
3D AGO

【第499期】ZAMA：可编程自举助力深层神经网络全同态推理

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Programmable Bootstrapping Enables Eﬃcient Homomorphic Inference of Deep Neural Networks Summary 在许多情况下，机器学习与隐私常被认为是相互矛盾的，尤其当所涉及的数据具有敏感性时，隐私问题显得尤为突出。本文研究的是深度神经网络的隐私保护推理问题。我们报告了基于一个新型库的初步实验结果，该库实现了 TFHE 全同态加密方案的一种变体。其核心关键技术是可编程自举（programmable bootstrapping），该技术能够在可控噪声水平下，对密文上的任意函数进行同态求值。我们的实验结果首次表明，深度神经网络已经进入全同态加密可实际支持的范围。尤为重要的是，与以往相关工作不同，我们的框架并不需要对模型进行重新训练。原文链接：https://whitepaper.zama.org

17 min
4D AGO

【第498期】CryptoNote v2.0 - Monero 白皮书

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：CryptoNote v2.0 -- monero whitepaper Summary “比特币”（Bitcoin）[1] 是点对点（P2P）电子现金概念的一项成功实现。专业人士和普通公众都逐渐认可了以公开交易和工作量证明（Proof-of-Work）相结合的信任模型。如今，电子现金的用户群正在稳步增长；用户被其低手续费和所提供的匿名性所吸引，而商家则看重其可预测且去中心化的发行机制。比特币已经有效地证明，电子现金既可以像纸币一样简单，又可以像信用卡一样便捷。然而，比特币也存在若干缺陷。例如，其分布式架构缺乏灵活性，在几乎所有网络用户都更新客户端之前，难以引入新功能。一些无法迅速修复的关键缺陷，阻碍了比特币的广泛传播。在这种缺乏灵活性的模型下，与其不断修补原有项目，不如推出一个全新的项目来得更为高效。本文中，我们分析并提出了针对比特币主要缺陷的解决方案。我们相信，一个充分考虑这些解决方案的系统，将促进不同电子现金系统之间的良性竞争。同时，我们还提出了我们自己的电子现金系统——“CryptoNote”，这一名称旨在强调电子现金领域的下一次重大突破。原文链接：https://github.com/monero-project/research-lab/blob/master/whitepaper/whitepaper.pdf

19 min
5D AGO

【第497期】Tornado Cash：隐私解决方案白皮书

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Tornado Cash Privacy Solution Version 1.4 Summary Tornado.Cash 实现了一种以太坊上的零知识隐私解决方案：这是一个智能合约，可接收以太币交易（未来也将支持 ERC-20 代币），使得之后可以在不引用原始交易的情况下提取相应金额。协议说明该协议具有以下功能：插入/存款（Deposit）：将资金存入智能合约。该操作可通过一笔交易完成，存入固定数量（记为 N）的以太币。该 N ETH 的凭证被称为一个 coin。移除/提现（Withdraw）：从智能合约中提取资金可以通过以下两种方式完成：N ETH 通过中继者（Relayer）提现，其中 f ETH 作为手续费发送至中继者地址 t，其余 (N − f) ETH 发送至指定的接收方。f 和 t 的取值由发送方选择。在这种情况下，提现交易由中继者发起，并由中继者支付 Gas 费用，该费用应由 f 覆盖。N ETH 直接提现至指定的接收方，交易由接收方自行发起。接收方需要拥有足够的 ETH 来支付交易的 Gas 费用。在这种情况下，手续费 f 被视为等于 0。原文链接：https://berkeley-defi.github.io/assets/material/Tornado%20Cash%20Whitepaper.pdf

17 min
6D AGO

【第496期】Zerocash：基于zk-SNARKs的分散式匿名支付方案

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Zerocash: Decentralized Anonymous Payments from Bitcoin (extended version) Summary 比特币是第一种得到广泛采用的数字货币。虽然支付是在化名之间进行的，但比特币无法提供强隐私保障：支付交易记录在公开的去中心化账本中，从中可以推导出大量信息。Zerocoin（Miers 等，IEEE S&P 2013）解决了部分隐私问题，通过将交易与支付来源解关联来增强隐私。然而，它仍然会暴露支付的接收方和金额，并且功能有限。本文构建了一种具有强隐私保障的完整账本型数字货币。我们的设计利用了零知识简洁非交互式知识论证（zk-SNARKs）的最新进展。我们提出并构建了去中心化匿名支付方案（Decentralized Anonymous Payment, DAP）。DAP 方案允许用户直接且私密地进行支付：对应的交易隐藏了支付的来源、接收方以及金额。我们提供了形式化定义并给出了构造的安全性证明。在此基础上，我们实现了 Zerocash，作为 DAP 构造的实际实例。在 Zerocash 中，每笔交易小于 1 KB，验证时间低于 6 毫秒——比匿名性较低的 Zerocoin 高出数个数量级，同时在效率上与普通比特币相当。原文链接：http://zerocash-project.org/media/pdf/zerocash-extended-20140518.pdf

18 min
FEB 6

【第495期】Self-play SWE-RL：基于自我博弈的软件工程智能体强化学习

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。今天的主题是：Toward Training Superintelligent Software Agents through Self-Play SWE-RL Summary 尽管当前基于大语言模型（LLMs）和智能体强化学习（agentic RL）的软件智能体能够提升程序员的生产力，但它们的训练数据（如 GitHub Issues 与 Pull Requests）和环境（如 pass-to-pass 与 fail-to-pass 测试）高度依赖人工知识或人工维护，这构成了迈向超级智能的根本障碍。本文提出 Self-play SWE-RL（SSR），作为面向超级智能软件智能体训练范式的第一步。该方法对数据几乎没有假设，仅需要访问带有源代码和已安装依赖的沙箱仓库，无需人工标注的 Issues 或测试用例。基于这些真实代码库，我们在**自我对弈（self-play）的设置下，通过强化学习训练单智能体 LLM，迭代地注入并修复日益复杂的软件缺陷，每个缺陷由测试补丁（test patch）**形式的正式规范定义，而非自然语言描述的 Issue。在 SWE-Bench Verified 与 SWE-Bench Pro 基准上，SSR 展现出显著的自我提升（分别为 +10.4 和 +7.8 分），并在整个训练过程中始终超越依赖人工数据的基线，即便评测使用的是自我对弈中未见的自然语言 Issues。尽管仍处于早期阶段，这些结果表明了一条可行路径：智能体能够自主从真实软件仓库中获取大量学习经验，从而最终实现超越人类能力的系统，包括理解系统构建方式、解决新颖挑战，以及自主从零创建新软件。原文链接：https://arxiv.org/abs/2512.18552

13 min

73播客，名字取材于Sheldon最喜欢的数字，内容由NotebookLM生成，每天跟随AI读AI业界论文。

Creator

任雨山
Years Active

2024 - 2026
Episodes

507
Rating

Clean
Copyright

© 任雨山@小宇宙App
Show Website

Seventy3