量化不掉发

Hugo_Ahgp

欢迎来到《量化不掉发》。本节目致力于用最易懂的方式,为您深入浅出地拆解一线券商的金融工程研报与前沿的量化金融论文。我们助您剥离复杂的数学公式,直击模型背后的核心思想与实战价值,轻松跟上量化领域的技术迭代。在这里,知识增长与保住发际线可以兼得。

  1. May 25

    寻找股市“预言家”:为什么分析师的预测往往不如数学模型?

    寻找股市“预言家”:为什么分析师的预测往往不如数学模型?1. 引言:投资中的“信息差”与业绩预期的魔力在投资的世界里,最令人向往的莫过于拥有一双洞察未来的“天眼”。想象一下,如果你能提前知道上市公司下一季度的净利润增速,你的投资收益将达到什么水平? 招商证券曾做过一项震撼的实证研究:假设我们处于“上帝视角”,预知下一期净利润增速并构建未来成长组合。在 2010 年至 2025 年的长周期回测中,该组合的年化收益率接近 17%。这 17% 实际上揭示了业绩预期的“理论收益天花板”,也正是净利润断层策略和 PEG 策略能够捕捉认知红利的核心逻辑。 然而,凡人并非“上帝”。为了弥补这种信息缺失,市场演化出了三类主要的业绩预测手段:分析师预期、简单预期模型以及横截面预期模型。究竟谁才是股市中最精准的“预言家”? 2. 惊人的“乐观偏差”:分析师预期并非绝对真理在大多数投资者看来,深度跟踪公司的行业分析师无疑是最权威的。但作为量化研究者,我们必须用数据说话。研究发现,分析师预期存在两个天然的“软肋”: 覆盖盲区:目前 A 股市场的分析师覆盖率仅约 54%。这意味着近一半的股票处于研究真空地带,分析师模型在此完全失效。 系统性乐观:分析师群体并非完全客观,其预测值普遍存在“通胀”现象。 分析师预期模型在多数时期相对市值偏差大于 0,真实验证了分析师群体对公司业绩普遍存在乐观估计的现象。 这种误差在不同行业间表现迥异。在银行、食品饮料等业绩高度稳健的行业,分析师的研判往往非常精准。但在钢铁、煤炭、石油石化等强周期行业,由于盈利波动剧烈(增速标准差大)且分析师人均覆盖度低,预测误差显著放大。此外,受第四季度盈余管理(企业财务跨期调节)的影响,所有分析师模型在年报季的误差都会集体走高。 3. 简单即正义?被低估的“简单预期模型”如果分析师的“深度研判”会受到主观情绪干扰,那么简单的数学推演表现如何?所谓“简单预期模型”,其逻辑非常朴素:基于公司过去 8 个季度的平均增长量来推算未来。 令人意外的是,这个“笨办法”在数据表现上竟多次击败了精英分析师: 预测相对市值误差:简单模型的均值约为 78,而分析师预期模型高达 103(该指标衡量预测误差相对于公司市值的程度,数值越小越精准)。 平均绝对误差 (MAE):简单模型(5.55)也略优于分析师预期(5.63)。 除了银行等极少数盈利极其稳定的行业,分析师在绝大多数行业的“相对市值误差”都输给了这个简单的公式。这说明在面对海量样本和复杂情绪时,人类直觉往往不如历史规律稳健。 4. 跨越“盲点”的算法:横截面模型的降维打击为了打破精度瓶颈,量化领域祭出了大杀器——横截面预期模型。如果说简单模型是“看过去”,分析师是“凭直觉”,那么横截面模型就是通过全市场的特征规律进行“降维打击”。 该模型参考了经典的 Fama-Macbeth 架构(先在截面回归,再在时序取均值),整合了 9 大核心基本面指标: 公告前相对行业超额收益(反映市场定价信息); 市值对数; 上季度总资产; 过去 12 个月现金分红总额; 去年同期单季度净利润; 负净利润交叉项(捕捉扭亏为盈的持续性); 上季度单季度净利润; 上季度净利润同比变化值; 应计盈余偏差 (ACC):这是一个极具实战价值的指标。应计盈余小于现金流通常意味着企业可能“藏了利润”,未来账面盈余增加的概率极大。 在建模算法上,横截面模型采用了 Huber 稳健回归。其精妙之处在于采用了分段损失函数:对正常数据使用平方损失 (L2) 以保证效率,对极端异常值则切换为线性损失 (L1)。这种设计完美处理了金融数据中常见的“肥尾”现象(即极端波动),使其预测的平均绝对误差仅为 3.2,远胜前两类模型。 5. “虚假”与“真实”的超预期:识别投资陷阱预测精度不是枯燥的数字,它直接关乎盈亏。 “虚假”的超预期(游侠网络 002174):2023 年一季报,其实际利润 4285 万元,远超分析师预期的 -1.27 亿元。看似大超预期,股价却在 60 天内大跌 40%。原因在于:横截面模型预判其利润应为 9433 万元,实际表现其实是“低于预期”的。 “真实”的超预期(博源化工 000683):2021 年一季报,实际利润 3.32 亿元远超横截面模型预期的 1.22 亿元。由于算法精准识别了真实的业绩拐点,该股随后 60 个交易日暴涨 179%。 6. 从理论到金钱:超预期策略的硬核表现回归实战,基于横截面预期模型构建的投资组合,展现出了量化策略的极致稳定性: 收益表现:策略组合实现年化收益 26.46%,年化超额收益 11.34%。 稳定性指标:因子的 IC 均值为 3.46%,年化 ICIR 为 2.3,t 值高达 7.65,且十组分组收益呈现完美的单调性。 回撤控制:在近年复杂的市场环境下,超额收益的最大回撤仅为 6.79%。 这意味着,通过数学模型修正分析师的“乐观偏差”,我们可以更稳定地捕捉到那些真正具有爆发力的“业绩黑马”。 7. 结语:在不确定的市场中寻找确定性业绩预期能力本质上是投资者从市场认知差中赚取超额收益的能力。虽然分析师在特定稳健行业(如银行)拥有主观深度的优势,但在大样本、全市场的覆盖上,横截面模型展现出了统治级的力量。 它通过多维度指标与 Huber 稳健回归,不仅修正了人类的偏见,更洞察了如“应计盈余偏差”等隐秘的财务信号。 最后思考: 当传统的基本面研判遇到更精准的数学模型,作为投资者,你更倾向于相信人类的直觉,还是数据的逻辑? -------------------------------------------------------------------------------- 20260518-招商证券-业绩预期模型新探索:除了分析师预期,我们还有什么预期? 前往小宇宙评论区与主播互动

    17 min
  2. Apr 14

    现金流实现率的波动惩罚

    20260413-天风证券-因子选股系列之一:现金流实现率因子因子逻辑全解析:现金流实现率及其增强模型在量化投资领域,盈余质量(Earnings Quality)的研究始终是核心课题。尽管利润表上的数字引人注目,但从学术界到实战派都深知一个市场真相:利润的“含金量”远比数字本身重要。本指南将带你从应计异象(Accrual Anomaly)出发,拆解现金流实现率(CRR)因子的构建逻辑及其进化路径。 1. 核心矛盾:为什么传统的“应计利润”因子会失效?量化研究的基石之一是 Sloan (1996) 的经典发现:会计盈余可分解为应计利润和现金流量,且现金流量的持续性(Persistence)显著高于应计利润。但在 A 股市场,传统的“应计利润”因子(营业利润与经营现金流之差)往往表现不佳。 权责发生制 vs. 现金收付制传统因子的局限与误判 传统的应计利润因子在 A 股失效主要源于两个逻辑偏误: 1. 成长性陷阱:对于高成长的公司,营收增加自然带动应收账款扩大。若机械地剔除高应计利润公司,会产生“应计异象”误判,错杀优质成长股。 2. 静态对比的偏误:传统的“同期对比”忽视了商业逻辑中利润转化为现金的天然滞后性。 核心洞察:盈利质量的本质不是利润与现金的“差额”,而是利润向现金转化的“效率”。我们必须摒弃同期视角,拥抱时间序列视角。 -------------------------------------------------------------------------------- 2. 构建 CRR 因子:从“利润”到“现金”的转化效率为解决利润确认与现金回收的时滞问题,并参考 Dechow & Dichev (2002) 的应计质量模型,我们构建了现金流实现率因子(Cash Flow Realization Rate, CRR)。 公式推导 基于过去 16 个季度(约 4 年)的长周期视角,进行一元线性回归: beta(CRR):因子的核心物理意义。它代表了滞后项转化效率——即上一期利润每增加 1 个单位,本期能实打实换回多少单位的现金流。 **16 个季度视角:** 旨在捕捉公司盈利质量的长期稳定性和真实持续性,剥离短期季节性干扰。“第 10 组陷阱”与市场真相在回测中我们发现一个关键现象:在十分组测试中,**第 10 组(CRR 最高的股票)的表现往往次于第 9 组**。 这揭示了一个深层市场真相:**极端的效率往往伴随着极端的波动。** 短期内现金流实现率虚高,可能是由非持续性的异常现金回笼导致的,这种高效不可持续,反而预示着未来的业绩变脸。 -------------------------------------------------------------------------------- 3. 辅助变量介入:现金流残差波动率的“除噪”作用为了剔除“第 10 组陷阱”中的不可持续标的,我们需要引入稳定性指标进行“去噪”。 概念定义:CFOOE 与市场回归 原理剖析:残差波动率 STD(\varepsilon) 剥离宏观噪声: 通过与全市场回归,剩下的残差 \varepsilon 代表了公司特有的经营结果。 衡量内生稳定性: 计算残差的标准差 STD(\varepsilon),即得到现金流残差波动率。如果波动率过高,说明该公司的现金流回收极不稳定。价值点总结: 对于周期性行业而言,这一步是过滤伪高质量标的的“杀手锏”。它能识别出那些因行业周期或偶然因素导致现金流暴增、但缺乏经营内生稳健性的公司。 4. 模型进化:CRR_MOD 组合逻辑的两种方案 我们将“转化效率(CRR)”与“稳定性(STD(\varepsilon))”合二为一,构建增强模型以应对多头失效风险。 性能解读CRR_MOD2 展现了极强的选股能力,其核心优势在于通过“组内再排序”的精细化操作,有效规避了因单次异常值导致 CRR 虚高的个股。回测数据显示,改进后的因子 RankIC 达 2.82%,ICIR 达 2.08,显著优于原始 CRR 因子。 5. 市场实战:因子的有效域与风格暴露有效域识别:大盘股的利器研究发现,该因子在成熟市场的有效性更高:  沪深 300 表现:RankIC 达到 3.85%,ICIR 为1.43,多头组合年化收益率高达10.70%。这说明大中盘股的财务逻辑更符合时间序列的转化规律。 优势行业:在钢铁、电子、医药、建材、基础化工等涉及重资产或长账期管理的行业中效果尤为显著。  失效行业:该逻辑在综合金融、银行、房地产等行业基本失效,需谨慎应用。风格关联与 Barra 暴露 风格独特性: 与规模(Size)、动量(Momentum)等常见 Barra 风格因子相关性极低。 负相关杠杆: 因子与杠杆率(Leverage)呈明显负相关。这意味着该模型偏好那些不依赖过度负债、能够通过内生经营实现资金良性循环的标的。总结 构建高质量盈利因子的核心逻辑在于:从“同期差额”转向“时间序列转化效率”,并利用“内生稳定性”进行过滤。通过 CRR_MOD2 模型,投资者可以有效识别出那些既能高效将利润转化为现金、又能保持经营稳健的真正优质企业。 前往小宇宙评论区与主播互动

    13 min
  3. Apr 3

    MPC大幅降低交易执行滑点

    Model Predictive Control For Trade Execution交易执行的“自动驾驶”:深度解析模型预测控制(MPC)如何改写算法交易游戏规则1. 引言:大单执行的“大象进瓷器店”困境在现代高频波动的数字市场中,执行一笔巨额机构订单(Parent Order)就像是让一只大象走进一家精美的瓷器店。交易员面临着一个经典且痛苦的权衡:如果你追求执行速度,大规模的扫单动作会像大象摔跤一样产生巨大的市场冲击(Market Impact),打碎“价格瓷器”;如果你为了隐藏踪迹而过度被动地挂单,缓慢的执行进度又会让你面临巨大的机会成本和滑点(Slippage)风险。 托马斯·P·麦考利夫(Thomas P. McAuliffe)及其团队近期提出了一种基于模型预测控制(MPC)的创新框架。这一框架的核心价值在于,它不仅仅是机械地完成任务,而是像一套精密的“自动驾驶系统”,在订单完成、成本最小化和风险控制的“不可能三角”中,通过数学手段寻找动态的最优解。 2. 惊人的决策速度:1毫秒内的二次规划在量化交易领域,状态信息的时效性就是生命线。如果决策逻辑过于沉重,算法所依赖的订单簿微观结构(Microstructure)信息在动作发出前就会变为“陈旧信息(Stale Information)”,导致阿尔法(Alpha)的严重侵蚀。 该MPC算法展示了令人惊叹的工业级性能:在包含11个候选订单模板(Action Space of d=11)1毫秒。通过使用如Clarabel这样的高性能二阶锥求解器,系统确保了在毫秒级瞬息万变的市场中,依然能以近乎实时的频率进行轨迹修正。这种高速响应能力,是量化交易从“规则引擎”向“智能控制”跨越的技术基石。 3. 效率的飞跃:将计划缺口降低40%-50%评估一个执行算法的终极维度是成本节约。基于长达六个月的纳斯达克“三级数据”(Level 3 ITCH Message Data)实测结果证明了MPC框架的统治力。 “实验结果显示,相对于传统的‘穿越价差(Spread-crossing)’基准,MPC方法在减少时间表短缺(Schedule Shortfall)方面取得了40-50%的显著提升,并显著降低了全市场的执行滑点。” —— 摘自研究摘要 这种提升对于管理大规模头寸的机构而言是决定性的。在纳斯达克高流动性环境下,40%-50%的效率提升直接等同于每年数百万美元的成本节约,它让“大象”在瓷器店中行走时变得如猫科动物般轻盈。 4. 风险的精准刻度:通过 \gamma 与 eta 掌控偏差该模型最反直觉的创新点在于:它并不追求对预设交易时间表的“完美贴合”,而是通过参数化的手段在风险与收益的“有效前沿(Efficient Frontier)”上起舞。 超参数 \gamma(纪律控制): 这是在静态基准(如VWAP/TWAP时间表)动态市场机会之间进行权衡的权重。\gamma 决定了算法对偏差的容忍度。当当前价格极其有利时,较低的 \gamma 允许算法适度冲出“时间表管道”,提前锁定利润。 超参数 eta(风险预算): 这是一个硬核的方差约束。它限制了由于成交不确定性而允许产生的最大风险量。深度洞察: 为什么允许偏差反而能获得更好的执行价格?在量化实战中,承担适度的风险(增加 eta)是为了利用那些低概率但高回报的价格层级。MPC赋予了算法这种“盘感”:当预测到当前执行比未来更“便宜”时,它会主动通过超前执行来对冲未来的不确定性。 5. 模块化设计的魅力:像乐高一样构建交易系统该系统的架构设计极具前瞻性,体现了工程学中“关注点分离”的原则。它将复杂的执行任务拆解为数个可独立迭代的“乐高积木”: 调度器(Scheduler): 负责宏观战略,设定VWAP/TWAP等基准。 成交概率与协方差模型: 预测不同价格层级的填充可能性。这里有一个极具启发性的逻辑:在不填充浅层价格的情况下,不可能填充更深的价格层级。因此,协方差矩阵通过 \min(\pi_i, \pi_j) 建模了层级间的包含关系,而非简单的线性独立。 快速取消模块(Fast-cancel): 这是系统的“护城河”。在现实生产环境中,该模块通常通过**FPGA(超低延迟硬件)**独立实现。它在纳秒级监控订单簿失衡,一旦感知到逆向选择风险(Adverse Selection),会瞬间撤回所有休眠订单。这种“重算法(MPC)+重工程(FPGA)”的结合,才是现代顶级量化柜台的完全体。6. “预言机”的启示:短期预测的巨大潜力博文中不得不提的最具冲击力的实验结果是“Oracle(预言机)”策略。当研究者给予系统未来价格信息进行回测时,性能提升出现了指数级跃升。 根据实验数据,相较于基准策略(Crossing),普通MPC提升了约45%的效率,而MPC-Oracle在VWAP等指标下的提升甚至超过了90%。虽然现实中不存在真正的预言机,但这一数据揭示了一个核心趋势:MPC框架是一个强大的“容器”,它能够完美集成基于神经网络生成的短期价格预测(Alpha)。只要预测信号能提供微弱的胜率,MPC就能通过其精密的控制逻辑,将预测转化为确定的经济收益。 7. 结语:迈向算法交易的下一个十年MPC框架的出现,将交易执行从传统的路径跟随(Path-following)提升到了主动控制(Optimal Control)的新高度。它向我们展示了一个由数据驱动、毫秒级响应、模块化协作构建的未来。 随着神经网络对短期价格轨迹预测的精度日益提高,这种能够动态管理偏差、在风险与收益的刀尖上跳舞的MPC算法,将逐渐抹去人工交易员最后的一点生存空间。 算法交易的下一个十年,将不再是关于谁的订单隐藏得更深,而是关于谁能更智能地利用偏差,在充满噪音的市场微观结构中,完成那场精密的“自动驾驶”。 前往小宇宙评论区与主播互动

    16 min
  4. Mar 13

    大模型赋能投研:主观思维链验证与个股决策智能体

    20260311-国金证券-大模型赋能投研之十九:主观投资框架验证与个股决策AgentAI 正在“偷学”顶级分析师的脑回路:17% 超额收益背后的投研革命 1. 引言:当人类分析师遇上“快进键”的 A 股在当前的 A 股市场,行业轮动的速度已不仅仅是“快”,而是被按下了“快进键”。从卫星通信、脑机接口到层出不穷的 AI 应用,新兴赛道以周为单位快速切换,申万一级行业间的年度收益“极差”在 2025 年显著扩大。这种极端的结构性分化,让主动投研面临严峻挑战。 一方面,个人分析师的精力难以覆盖数百只个股及瞬息万变的赛道;另一方面,传统量化模型在“赛道拥挤”与“收益衰减”的压力下,往往只能捕捉表层的量价统计规律,却无法理解非结构化研报背后复杂的“因果推演逻辑”。市场定价的核心矛盾往往隐藏在产业链的深度传导中,而这种“信息-逻辑”的缺口,正是大模型(LLM)通过模拟人类专家“深度推理”来实现投研范式革命的切入点。 2. Takeaway 1:从“概率生成”到“慢思考”:推理模型统治力的崛起2024 年底至 2025 年,金融科技领域见证了推理类模型(Reasoning Models)的爆发。以 DeepSeek-R1 和 OpenAI o1 为代表的模型,将 AI 从单纯的“语义归纳”推向了真正的“逻辑推理”。 根据 OpenRouter 数据显示,短短一年内,推理类模型在总 Token 消耗中的占比攀升了 60%,在 2025 年末已逼近六成大关。这一变革的核心在于“思维链(CoT)”技术的成熟。与传统 AI 追求概率性的文本生成不同,CoT 赋予了模型“慢思考”的能力。在实际应用中,投研系统会根据任务复杂度进行分层:利用 deepseek-r1 处理高难度的复杂推理,而使用量化版 deepseek-distill-32b 兼顾计算效率。这种严密的逻辑闭环和自我纠错能力,使 AI 能够穿透表象数据,触达行业的底层驱动因素。 3. Takeaway 2:解构分析师的“黑盒”:从“因子驱动”转向“逻辑驱动”为了将分析师的“主观智慧”规模化,研究者利用 AI 对海量非结构化研报进行了“脱水重构”(Information Dehydration)。这并非简单的摘要,而是将混乱的文本信息提取并标准化为结构化的投资思维链。 AI 提取的每一条思维链都由三个固定部分组成,构成了一个完整的因果推演闭环: 驱动因素(Trigger): 推理逻辑的起点,用于识别影响市场的核心核心变量(如新药获批、产能释放)。 推理环节(CoT): 负责将驱动因素逐步推导至结论的传导路径,确保逻辑的严密性。 信号强度(Signal): 对逻辑有效性进行评估,用于自动剔除过时或失效的信号。这种“脱水”过程让量化库的维度得到了质的飞跃,实现了从单纯的“统计因子驱动”向深度“基本面逻辑驱动”的进化。 4. Takeaway 3:17.16% 年化超额:被滚动回测验证的“逻辑动量”如果 AI 只是“读懂”逻辑,那只是完成了第一步。真正的革命在于“滚动单链回测”(Rolling Single-Chain Backtest)机制的引入。AI 在提取逻辑后,会立即接入公开市场数据,对每一条逻辑在当前市场环境下的有效性进行定量测试,动态捕捉“逻辑动量”。 这种机制成功地将主观逻辑转化为具备定价能力的策略信号。回测数据(2021-2026 年)显示: 优质 CoT 联合投票策略: 通过筛选 TOP 1/3 的优质思维链(约 7 条)进行联合投票,该策略相较于分析师等权基准实现了 17.16% 的年化超额收益,信息比率(IR)为 0.48。 加权选股策略: 进一步引入信息比率分位数进行赋权,该策略展现了更强的风险控制能力,信息比率(IR)提升至 0.51,有效缓解了市场下行区间的超额回撤。这种验证机制剔除了失效的陈旧逻辑,保留了具备实战价值的优质链条,使策略在风格剧烈切换的环境中依然保有稳健的 Alpha 来源。 5. Takeaway 4:你的下一任投研助理,可能是一个个股决策 Agent基于这一验证框架,金融投研正在从“静态看报告”进化为“动态 Agent 交互”。目前已开发的个股投研顾问 Agent,能够将碎片化逻辑重构为高可读性的“投研全景图”。 这些 Agent 的核心竞争力在于其严苛的筛选标准。根据实际运行数据,Agent 对个股的符合程度判断具有极高的区分度: “完全符合”(Completely Consistent) 的标的平均仅占 4.13%,体现了极高的置信度要求。 “不符合”(Inconsistent) 的标的占比达 44.75%,有效剔除了逻辑噪音。通过输入最新的研报与新闻,Agent 能直接输出“看涨/中性/看跌”的诊断建议。 “大模型输出的结果具有一定的随机性和幻觉风险,仅供参考。” 这种 Agent 模式不仅提升了投研的覆盖广度,更通过“置信度打分”为主动投资者提供了差异化的决策补充。 6. Takeaway 5:未来已来:多模态融合与特征降维AI 投研的下一步演进方向是从“静态逻辑挖掘”跨越到“动态事件响应”。未来,系统将实时处理政策变动、业绩预告等突发事件对行业逻辑的瞬间冲击。 技术层面,非结构化观点将通过预训练模型转化为 Embedding 向量。为了应对“维数灾难”(Curse of Dimensionality),系统将实施有效的特征降维,将处理后的低维语义向量作为正交于传统量价因子的新 Alpha 源。当“基本面逻辑表征”与“市场量价数据”共同进入机器学习池,这种多模态融合将极大地拓展因子的信息边界,提升模型在非线性市场环境下的预测效能。 7. 结语:逻辑,才是市场的最终答案AI 在投研领域的深度应用,核心目的并非取代分析师,而是将分析师最宝贵的“逻辑财富”进行规模化、定量化与实时化。当 AI 能够系统性地理解因果,量化交易就从单纯的指标刻画,进化到了对深层语意的精准执行。 最后,留下一个思考题:当市场上所有的投资人都拥有了能实时理解逻辑、捕捉动态 Alpha 的 AI 助手,市场的 Alpha 将会去往何处?是向更微观的特质型机会转移,还是会引发新一轮的逻辑对撞? 前往小宇宙评论区与主播互动

    17 min
  5. Mar 10

    DTW算法捕捉大小盘轮动

    20260310-招商证券-市场风格轮动系列:基于相似性算法的风格轮动策略历史会重演吗?利用相似性算法破解风格轮动的“财富密码”面对大小盘切换的迅猛、成长与价值风格的剧烈轮动,投资者常陷入一种“西西弗斯式”的困境:刚踏入小盘股的红利期,市场便转向蓝筹;刚切换至价值防御,成长股便拔地而起。我们常有一种直觉——当下的行情走势,似乎在历史的某个镜像时刻上演过。 这种“以史为鉴”的朴素直觉,在量化金融领域正被转化为可实证的精密武器。通过相似性算法(Similarity Algorithms),我们可以从浩如烟海的历史数据中,精准定位那些与当下走势高度重合的“路径”,将模糊的感性判断提炼为具有高胜算的交易信号。 视角之争:为什么“相对收益”才是配置的真理?在构建相似性匹配模型时,首要的底层逻辑选择是:我们应该观察风格指数的绝对收益,还是它们之间的相对收益? 量化实证给出了明确答案:相对收益视角(Relative Net Value)显著优于绝对收益视角。 避开“信号错位”的陷阱:在绝对收益视角下,大、小盘指数各自对应的“历史最相似时点”往往是离散且不对称的。这会导致模型在试图捕捉风格差时,产生逻辑上的“时空错位”。 拒绝“在模糊结果上做精确比较”:绝对收益视角本质上是先对单一风格进行模糊估计,再进行二次比较,这会引入双倍的噪音。相对收益视角通过直接锁定风格之间的相对强弱状态(如大盘-小盘相对收益率),形成单一条线的“风格相对净值”,直接定位风格所处的历史阶段,从而避免了在模糊估计结果上做精确比较。 算法的平衡术:DTW 如何在灵活性与扭曲之间取舍在衡量序列相似度时,传统的欧氏距离如同“刻舟求剑”,要求时间点一一对齐。但在波动的市场中,相似的走势往往伴随着节奏的快慢。为此,我们引入了 DTW(动态时间规整) 算法。 如果把 DTW 比作给算法戴上了一副**“弹性眼镜”,让它能看透那些被拉伸或压缩的走势,那么  就是防止视力扭曲的“固定镜框”**。 防止过度规整:无约束的 DTW 会为了最小化累积距离,将一个时间点强行映射到过多的历史点,导致时序逻辑的崩溃。引入 Sakoe-Chiba 约束后,我们强制路径在对角线附近移动。 主观逻辑的胜利(DTW-S-2D):在对比了 SBD(全局轮廓强但局部识别弱)和 MSM(对代价参数 c 过度敏感)后,DTW-S-2D 脱颖而出。其设定允许当日行情在 3 日内(w=2)完成相似走势,这比宽泛的 5 日约束(DTW-S-4D)更符合 A 股市场高频多变的特性。市场的“记忆”:为什么 2017 是分水岭,而 2019 是“老师”?历史会重演,但并非所有的历史都有同等的参考价值。2006 年的走势与 2025 年相似,其指导意义是否等同于 2019 年? 2017 年的底层逻辑切换:作为一个资深观察者,必须指出 2017 年 是小盘股逻辑的“断点”。随着监管强化和市场生态演变,“壳资源”价值逐渐坍塌。这意味着 2017 年之前的许多小盘股走势,在当下的退市常态化环境下,参考权重必须打折扣。 时间衰减函数(n=20):为了让模型具备“厚今薄古”的智慧,我们引入了半衰期为 20 年的时间衰减权重。数据证明,引入该函数后,大小盘策略的边际改善最为显著,这正是因为模型学会了优先向“近现代”的市场交易环境取经。 统计显著性的门槛:模型并非在历史中随意抓取前 50 个匹配项。我们设定了 Mean + 2 Standard Deviations(均值+2倍标准差) 的滚动 5 年阈值。只有相似度超越这个高门槛的历史片段,才被认为具有统计学意义上的“参考价值”,而非随机的巧合。1+1 > 2:相似性信号与“胜率”框架的化学反应为了验证策略的严谨性,在处理数据时,由于中证 2000 指数发布较晚,我们使用了中证 1000 指数的收益率进行历史数据回填(Backfill)。这一细节确保了大小盘策略能回溯至 2005 年,跨越多个完整牛熊周期。 当我们将这一相似性指标作为“胜率”变量,纳入现有的**“赔率胜率”复合框架**(基于凯利公式配置)时,业绩展现出了极佳的边际改善: 大小盘轮动策略:年化超额收益:从 16.76% 提升至 18.13%信息比率(IR):从 1.85 跨越至 2.01 的高度。 成长价值轮动策略:年化超额收益:从 13.79% 提升至 15.27%信息比率(IR):从 1.11 稳步升至 1.23。结论:向量化投资的深度回归虽然历史不会简单地重复,但“相似的节奏”蕴含着巨大的确定性。相似性算法并非要取代传统的量化因子,而是为配置提供了一层可解释、直观且具有深度逻辑支持的增量信息。 在 AI 与深度学习大行其道的今天,这种基于路径匹配的算法因其“所见即所得”的逻辑支撑,依然是量化工具箱中不可或缺的长青工具。它告诉我们:即便身处 AI 时代,理解市场曾经走过的路,依然是预判未来的最短路径。 前往小宇宙评论区与主播互动

    15 min
  6. 12/22/2025

    傅里叶变换听懂机构交易心跳

    20251216-方正证券-多因子选股系列研究之二十四:个股日内成交量周期性节奏刻画与“滴水穿石”因子构建顶尖量化报告揭秘:为什么“沉闷”的交易节奏,反而预示着股票的惊人回报?引言:我们是否看错了成交量? 当您看到某只股票的成交量在盘中突然暴增,K线图上拔地而起一根巨大的量柱时,您的第一反应是什么?是觉得“有大事发生”,认为这是一个不容错过的买入信号吗?这几乎是所有投资者的本能反应——成交量的“爆发”似乎总是与机会划上等号。 但我们是否有可能看错了重点?我们对“爆发”的关注,会不会让我们忽略了那些更微妙、但可能更具价值的信号?一份来自方正证券研究所的专业量化报告提出了一个颠覆性的观点:真正预示着长期回报的,可能不是成交量的“爆发”,而是其背后隐藏的“节奏”。 本文将为您提炼这份深度报告的核心发现,揭示一个隐藏在市场噪音之下的秘密:为什么说“滴水穿石”般的稳定交易,远比“一鸣惊人”的瞬间放量更值得我们关注。 1. 交易的“节奏”胜过“爆发”:机构投资者的秘密信号 报告首先将个股的日内交易量分布特征,划分为两种截然不同的类型:瞬时脉冲和周期性脉冲。前者是我们熟悉的,由一次性大单或市场跟风情绪驱动的突然放量;而后者则是一种持续且有节奏的交易行为。 研究中一个反直觉的发现是:以往的分析表明,那些在瞬时脉冲放量后,跟随效应越明显的股票,其长期的最终表现反而越差。这或许意味着,这种吸引眼球的“爆发”更多是短期情绪或噪音的体现,容易导致投资者追高并遭遇后续的回落,而非价值的真实反映。 相比之下,一种周期性、稳定的交易节奏,就像“滴水穿石”一样,可能蕴含着完全不同的信息。这种行为模式很可能代表着机构投资者正在行动——他们为了避免对市场造成过大冲击,选择以分批、定频的方式悄然建仓。这种稳健的买入行为,比一次性的脉冲更能维持价格的上涨趋势。 反之,如果某些股票的交易节奏持续而稳定,其有可能是部分机构在发现价值或信息后,选择分批、定频率买入以减少成本和冲击,相比一次性脉冲更能维持价格趋势。从长期表现来看,这些股票后续表现可能更有吸引力。 2. “滴水穿石”:一个纯交易量指标的惊人威力 基于上述逻辑,报告的研究人员构建了一个全新的选股因子,并形象地将其命名为——“滴水穿石”因子。 这个因子的核心逻辑,是利用名为“频谱分析”的数学方法——可以将其想象成一种能将复杂的市场总成交量“声音”,分解成高低不同“音符”的技术——从而精确识别并量化个股成交量中是否存在2-5分钟周期的、规律性的交易节奏。 最关键的一点是:“滴水穿石”因子是一个纯粹的交易量因子,其构建过程完全不涉及任何价格信息。 这意味着它从一个全新的维度来审视市场。而就是这样一个不看价格的指标,其独立的选股能力却十分惊人。根据报告回测(回测区间:2013年1月至2025年11月),其表现如下: • 多空组合年化收益率: 32.69% • Rank IC 均值: 8.69% • Rank ICIR: 4.63 这些数据显示,仅仅通过倾听市场的交易“节奏”,就能够挖掘出显著的超额收益。在一个充斥着价格信号和复杂基本面分析的市场中,一个纯粹、未被充分挖掘的交易行为维度能够提供如此强大的独立预测能力,这本身就凸显了其巨大的策略价值。 3. 真正的价值在于“与众不同”:低相关性的魔力 在量化投资的多因子模型中,一个新因子的价值不仅在于其自身的预测能力,更在于它能否提供“与众不同”的信息。如果一个因子只是重复了现有因子的功能,那它的价值就非常有限。而“滴水穿石”因子最大的魅力之一,就在于其极低的“相关性”。 报告数据显示,该因子与其他常见风格因子(如波动率、流动性)的相关性非常低,与波动率和流动性因子的相关性分别为-34.13%和-29.65%。 更重要的是,当把它与方正金工已经构建的其他15个优秀的量价因子进行比较时,其相关性同样很低,平均相关系数仅为27.20%。这意味着,“滴水穿石”因子捕捉到的是一种独特的、其他因子难以发现的市场信号。它不是现有策略的简单重复,而是一个能够带来全新视角的、强大的策略补充。 4. 强强联合:当“滴水穿石”融入因子大家庭 那么,当这个独特的因子与一个已经很强大的因子库结合时,会发生什么?报告将“滴水穿石”因子与原有的15个量价因子等权合并,形成了一个新的“综合量价”因子。其表现堪称惊艳: • 多空组合年化收益率: 47.51% • Rank IC 均值: -12.39% • 月度胜率: 85.71% • Rank ICIR: -5.09 此处的Rank IC与ICIR为负值,是因为在因子合成时,为保持方向一致性,因子值被统一调整为负向因子(即因子值越小,预期收益越高),其绝对值的大小才真正代表了因子的预测能力。 报告得出的结论非常明确:与不包含“滴水穿石”因子的版本相比,加入该因子后,综合因子的Rank IC均值、多空组合年化收益率、月度胜率以及最大回撤等指标均有改善。这充分证明了“滴水穿石”因子不仅自身表现优异,更能为一个成熟且强大的策略组合带来切实的增量贡献,真正起到了“1+1>2”的效果。 结语:在市场的噪音中倾听节奏 这份研究告诉我们,市场的有效信息,有时并不在最喧嚣、最引人注目的地方。它可能隐藏在那些看似平淡无奇、日复一日的稳定节奏之中。那些被市场情绪忽略的“沉闷”交易,或许才是聪明资金留下的最真实的足迹。 那么,下一次当你审视市场时,你会选择追逐喧嚣的噪音,还是静心倾听那背后隐藏的、预示未来的节奏? 前往小宇宙评论区与主播互动

    17 min

About

欢迎来到《量化不掉发》。本节目致力于用最易懂的方式,为您深入浅出地拆解一线券商的金融工程研报与前沿的量化金融论文。我们助您剥离复杂的数学公式,直击模型背后的核心思想与实战价值,轻松跟上量化领域的技术迭代。在这里,知识增长与保住发际线可以兼得。

You Might Also Like