因子挖掘 - 古法信息流

CTA因子两条路

微信公众号 - 随机森林之外原文链接

这篇文章讨论 CTA 因子挖掘中最常见的一组方法论选择：到底更适合做时序因子，还是做截面因子。

文章先把两者的核心差异讲得很清楚：时序因子是拿品种自己的历史和自己比较，关注的是价格相对历史分布的位置，典型逻辑是趋势跟踪或均值回复；截面因子则是把同一时刻的不同品种放在一起比较，关注的是相对强弱，典型逻辑是多空对冲或横截面排序。

在收益来源上，文章认为两类因子依赖的市场结构不同。时序因子更依赖价格序列的自相关性，趋势行情越明显，越容易赚钱，但在震荡市里会不断被假信号消耗。截面因子更依赖品种之间的相对关系和分化程度，在波动率较低、品种间相关性较稳定时更容易发挥作用；一旦遇到系统性冲击或相关性突然升高，多空结构就可能失效，出现“两头受伤”的问题。

文章特别强调了波动率对两类策略的不同影响：时序因子往往是波动率的受益者，波动越大，趋势幅度越容易被放大；截面因子则更像波动率的空头，低波动、强分化更适合它，高波动、强相关则不利于它。作者据此引出一个很实用的判断：选择时序还是截面，本质上也是在判断自己对未来波动率环境的看法。

在应用层面，文章还讨论了频率问题。低频截面更依赖板块内部的逻辑一致性，比如黑色系、化工、农产品、有色等；而在更高频的层面，微观结构因素会让更广泛的品种池具备可比性。相对地，时序因子在频率变化上更像是参数周期的调整，逻辑框架本身没有那么大的范式切换。

最后，文章给出的结论不是“谁更强”，而是“谁更适合你的约束条件”。时序策略要接受收益不均匀、参数敏感和震荡磨损；截面策略要接受品种池局限、多空双杀和交易成本。作者认为，更重要的是理解每类策略的适用环境和边界，而不是试图寻找一个能包打天下的万能因子。

整体来看，这是一篇偏方法论和实战框架的文章，适合做 CTA 因子研究时作为选型参考：如果你更看重趋势、容忍波动和长等待，时序可能更合适；如果你更看重相对强弱、组合平滑和对冲结构，截面可能更合适。

CTA 因子挖掘时序截面量化2026-04-21

从“优化指标参数”到“自主发现因子”：一套量化策略工程系统的落地路径

微信公众号 - 四方茶院原文链接

这篇文章讨论的是量化策略研发范式的升级：不要只停留在对 BB、MACD、ATR、RSI 这类指标做参数寻优，而要转向一套能持续发现因子、验证因子、淘汰因子并不断迭代的研究系统。
文章认为，传统“调参数”方法的瓶颈主要有三个：因子来源过度依赖人工经验、参数优化容易过拟合历史、策略缺少持续自我更新能力。
因此，更值得建设的不是单纯的策略脚本，而是一个完整的研究闭环：自动生成候选因子、验证其有效性、在新窗口中滚动重训、将通过验证的因子进入信号层。
作者强调，模型第一阶段不应直接学习买卖点，而应先输出可解释、可验证的候选因子，因为交易动作本身还受到风控、成本、仓位和流动性等多重因素影响。
在标签设计上，文章建议先从未来 5 日、10 日、20 日的超额收益入手，观察因子在短、中、长周期上的稳定性。
在模型结构上，可用时序编码器先把行情数据压缩为潜在表征，再通过瓶颈层映射成候选因子，而不是让模型直接输出价格预测。
衡量因子是否有效，文章把 IC、RankIC、分层收益、多窗口稳定性、衰减曲线、换手率和与已有因子的相关性都纳入验证框架，强调单期收益并不可靠。
为了避免“历史有效、未来失效”，文章主张使用 Walk-Forward 滚动验证，让因子在不断前移的时间窗口中被重新发现、重新筛选。
在工程实现上，作者建议核心研究逻辑由 Python 服务承担，Agent 只做外层编排和自动化调度，不直接接管核心算法或高风险交易权限。
文章最后给出的结论很明确：真正的竞争力不是某个神奇指标，也不是一次漂亮的回测曲线，而是一台能持续生产研究结论、不断进化的因子研究机器。

量化投资因子挖掘策略工程机器学习 Walk-Forward2026-04-18

# 因子挖掘

CTA因子两条路

从“优化指标参数”到“自主发现因子”：一套量化策略工程系统的落地路径