本期的 5 篇论文如下:
[00:36] TOP1(🔥118) | 🎯 GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding(GUI-G$^2$: 基于高斯奖励模型的GUI定位)
[02:14] TOP2(🔥108) | 🧮 MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization(MiroMind-M1:通过上下文感知多阶段策略优化实现数学推理的开源进展)
[05:19] TOP3(🔥96) | ♾ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning(超越上下文限制:用于长程推理的潜意识线索)
[08:51] TOP4(🔥85) | ⚡ $\nabla$NABLA: Neighborhood Adaptive Block-Level Attention(邻域自适应块级注意力)
[11:59] TOP5(🔥73) | ⛓ The Invisible Leash: Why RLVR May Not Escape Its Origin(隐形束缚:RLVR为何难以摆脱其起源)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
정보
- 프로그램
- 주기매일 업데이트
- 발행일2025년 7월 26일 오전 7:45 UTC
- 길이16분
- 등급전체 연령 사용가