Seventy3

任雨山

73播客,名字取材于Sheldon最喜欢的数字,内容由NotebookLM生成,每天跟随AI读AI业界论文。

  1. 【第502期】Polymarket无风险套利

    4H AGO

    【第502期】Polymarket无风险套利

    Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。 今天的主题是:Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets Summary Polymarket 是一个预测市场平台,用户可以通过交易与特定结果挂钩的份额来对未来事件进行投机,这些结果被称为条件(conditions)。每个市场都对应一组一个或多个这样的条件。为了确保市场能够正确结算,条件集合必须是完备的——即整体上涵盖所有可能结果——并且是互斥的——即最终只能有一个条件被判定为真。因此,所有相关结果的价格之和应当等于 1 美元,代表任一结果发生的总概率为 1。 尽管有这样的设计,Polymarket 仍然存在相关资产被错误定价的情况,使得某一确定结果可以以低于(或高于)1 美元的价格被买入(或卖出),从而保证获利。这种现象被称为套利(arbitrage),可能使具备一定复杂策略能力的参与者利用这些不一致性牟利。 在本文中,我们基于 Polymarket 的数据开展了一项经验性套利分析,以回答三个核心问题:(Q1) 什么条件会导致套利机会的产生?(Q2) Polymarket 上是否实际发生了套利行为?(Q3) 是否有人利用了这些套利机会?在分析相关市场之间的套利时,一个主要挑战在于需要在大量市场和条件之间进行可扩展的比较;朴素的方法需要进行 O(2n+m) 级别的比较,计算成本极高。为此,我们采用了一种由启发式方法驱动的降维策略,基于时间相关性、主题相似性以及组合关系来缩小比较范围,并通过专家意见进一步验证。 我们的研究揭示了 Polymarket 上两种不同形式的套利行为:市场再平衡套利(Market Rebalancing Arbitrage),其发生于单一市场或单一条件之内;以及组合套利(Combinatorial Arbitrage),其跨越多个市场。我们利用链上历史订单簿数据,分析了这些套利机会在何时存在,以及在何时被用户实际执行。研究结果显示,被成功利用并实现的套利利润总额约为 4000 万美元。 原文链接:https://arxiv.org/abs/2508.03474

    17 min
  2. 1D AGO

    【第501期】基于可验证奖励强化学习的未来事件预测

    Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。 今天的主题是:Outcome-based Reinforcement Learning to Predict the Future Summary 带有可验证奖励的强化学习(Reinforcement Learning with Verifiable Rewards,RLVR)已被证明是一种有效方法,可提升大语言模型在编程和数学等领域中的推理能力。在本文中,我们将 RLVR 方法应用于现实世界未来事件的预测这一任务——由于结果高度噪声化且存在显著延迟,这对强化学习而言尤具挑战性。 我们使用了一个新构建的数据集,其中包含来自预测市场的最新问题以及与之相关的新闻标题。实验表明,一个相对紧凑的(140 亿参数)推理模型,经过训练后,其预测准确率可以达到甚至超过 o1 等前沿模型,同时在概率校准方面有显著提升。 该模型的性能在实践中也具有现实意义:在一项 Polymarket 的交易仿真中,我们估计该模型在测试集所有问题上的下注将带来超过 10% 的投资回报率(ROI)。此外,我们还详细介绍并比较了模型训练中采用的多种方法,包括:利用合成预测问题扩充训练数据、用于保障学习稳定性的防护机制(guardrails),以及在推理阶段采用的中位数预测采样策略。 原文链接:https://arxiv.org/abs/2505.17989

    16 min
  3. 【第498期】CryptoNote v2.0 - Monero 白皮书

    4D AGO

    【第498期】CryptoNote v2.0 - Monero 白皮书

    Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。 今天的主题是:CryptoNote v2.0 -- monero whitepaper Summary “比特币”(Bitcoin)[1] 是点对点(P2P)电子现金概念的一项成功实现。专业人士和普通公众都逐渐认可了以公开交易和工作量证明(Proof-of-Work)相结合的信任模型。如今,电子现金的用户群正在稳步增长;用户被其低手续费和所提供的匿名性所吸引,而商家则看重其可预测且去中心化的发行机制。比特币已经有效地证明,电子现金既可以像纸币一样简单,又可以像信用卡一样便捷。 然而,比特币也存在若干缺陷。例如,其分布式架构缺乏灵活性,在几乎所有网络用户都更新客户端之前,难以引入新功能。一些无法迅速修复的关键缺陷,阻碍了比特币的广泛传播。在这种缺乏灵活性的模型下,与其不断修补原有项目,不如推出一个全新的项目来得更为高效。 本文中,我们分析并提出了针对比特币主要缺陷的解决方案。我们相信,一个充分考虑这些解决方案的系统,将促进不同电子现金系统之间的良性竞争。同时,我们还提出了我们自己的电子现金系统——“CryptoNote”,这一名称旨在强调电子现金领域的下一次重大突破。 原文链接:https://github.com/monero-project/research-lab/blob/master/whitepaper/whitepaper.pdf

    19 min
  4. 6D AGO

    【第496期】Zerocash:基于zk-SNARKs的分散式匿名支付方案

    Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。 今天的主题是:Zerocash: Decentralized Anonymous Payments from Bitcoin (extended version) Summary 比特币是第一种得到广泛采用的数字货币。虽然支付是在化名之间进行的,但比特币无法提供强隐私保障:支付交易记录在公开的去中心化账本中,从中可以推导出大量信息。Zerocoin(Miers 等,IEEE S&P 2013)解决了部分隐私问题,通过将交易与支付来源解关联来增强隐私。然而,它仍然会暴露支付的接收方和金额,并且功能有限。 本文构建了一种具有强隐私保障的完整账本型数字货币。我们的设计利用了零知识简洁非交互式知识论证(zk-SNARKs)的最新进展。 我们提出并构建了去中心化匿名支付方案(Decentralized Anonymous Payment, DAP)。DAP 方案允许用户直接且私密地进行支付:对应的交易隐藏了支付的来源、接收方以及金额。我们提供了形式化定义并给出了构造的安全性证明。 在此基础上,我们实现了 Zerocash,作为 DAP 构造的实际实例。在 Zerocash 中,每笔交易小于 1 KB,验证时间低于 6 毫秒——比匿名性较低的 Zerocoin 高出数个数量级,同时在效率上与普通比特币相当。 原文链接:http://zerocash-project.org/media/pdf/zerocash-extended-20140518.pdf

    18 min
  5. FEB 6

    【第495期】Self-play SWE-RL:基于自我博弈的软件工程智能体强化学习

    Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。 今天的主题是:Toward Training Superintelligent Software Agents through Self-Play SWE-RL Summary 尽管当前基于大语言模型(LLMs)和智能体强化学习(agentic RL)的软件智能体能够提升程序员的生产力,但它们的训练数据(如 GitHub Issues 与 Pull Requests)和环境(如 pass-to-pass 与 fail-to-pass 测试)高度依赖人工知识或人工维护,这构成了迈向超级智能的根本障碍。 本文提出 Self-play SWE-RL(SSR),作为面向超级智能软件智能体训练范式的第一步。该方法对数据几乎没有假设,仅需要访问带有源代码和已安装依赖的沙箱仓库,无需人工标注的 Issues 或测试用例。基于这些真实代码库,我们在**自我对弈(self-play)的设置下,通过强化学习训练单智能体 LLM,迭代地注入并修复日益复杂的软件缺陷,每个缺陷由测试补丁(test patch)**形式的正式规范定义,而非自然语言描述的 Issue。 在 SWE-Bench Verified 与 SWE-Bench Pro 基准上,SSR 展现出显著的自我提升(分别为 +10.4 和 +7.8 分),并在整个训练过程中始终超越依赖人工数据的基线,即便评测使用的是自我对弈中未见的自然语言 Issues。 尽管仍处于早期阶段,这些结果表明了一条可行路径:智能体能够自主从真实软件仓库中获取大量学习经验,从而最终实现超越人类能力的系统,包括理解系统构建方式、解决新颖挑战,以及自主从零创建新软件。 原文链接:https://arxiv.org/abs/2512.18552

    13 min

About

73播客,名字取材于Sheldon最喜欢的数字,内容由NotebookLM生成,每天跟随AI读AI业界论文。