← 所有标签

# 因子挖掘

CTA因子两条路

这篇文章讨论 CTA 因子挖掘中最常见的一组方法论选择:到底更适合做时序因子,还是做截面因子。

文章先把两者的核心差异讲得很清楚:时序因子是拿品种自己的历史和自己比较,关注的是价格相对历史分布的位置,典型逻辑是趋势跟踪或均值回复;截面因子则是把同一时刻的不同品种放在一起比较,关注的是相对强弱,典型逻辑是多空对冲或横截面排序。

在收益来源上,文章认为两类因子依赖的市场结构不同。时序因子更依赖价格序列的自相关性,趋势行情越明显,越容易赚钱,但在震荡市里会不断被假信号消耗。截面因子更依赖品种之间的相对关系和分化程度,在波动率较低、品种间相关性较稳定时更容易发挥作用;一旦遇到系统性冲击或相关性突然升高,多空结构就可能失效,出现“两头受伤”的问题。

文章特别强调了波动率对两类策略的不同影响:时序因子往往是波动率的受益者,波动越大,趋势幅度越容易被放大;截面因子则更像波动率的空头,低波动、强分化更适合它,高波动、强相关则不利于它。作者据此引出一个很实用的判断:选择时序还是截面,本质上也是在判断自己对未来波动率环境的看法。

在应用层面,文章还讨论了频率问题。低频截面更依赖板块内部的逻辑一致性,比如黑色系、化工、农产品、有色等;而在更高频的层面,微观结构因素会让更广泛的品种池具备可比性。相对地,时序因子在频率变化上更像是参数周期的调整,逻辑框架本身没有那么大的范式切换。

最后,文章给出的结论不是“谁更强”,而是“谁更适合你的约束条件”。时序策略要接受收益不均匀、参数敏感和震荡磨损;截面策略要接受品种池局限、多空双杀和交易成本。作者认为,更重要的是理解每类策略的适用环境和边界,而不是试图寻找一个能包打天下的万能因子。

整体来看,这是一篇偏方法论和实战框架的文章,适合做 CTA 因子研究时作为选型参考:如果你更看重趋势、容忍波动和长等待,时序可能更合适;如果你更看重相对强弱、组合平滑和对冲结构,截面可能更合适。

从“优化指标参数”到“自主发现因子”:一套量化策略工程系统的落地路径

这篇文章讨论的是量化策略研发范式的升级:不要只停留在对 BB、MACD、ATR、RSI 这类指标做参数寻优,而要转向一套能持续发现因子、验证因子、淘汰因子并不断迭代的研究系统。
文章认为,传统“调参数”方法的瓶颈主要有三个:因子来源过度依赖人工经验、参数优化容易过拟合历史、策略缺少持续自我更新能力。
因此,更值得建设的不是单纯的策略脚本,而是一个完整的研究闭环:自动生成候选因子、验证其有效性、在新窗口中滚动重训、将通过验证的因子进入信号层。
作者强调,模型第一阶段不应直接学习买卖点,而应先输出可解释、可验证的候选因子,因为交易动作本身还受到风控、成本、仓位和流动性等多重因素影响。
在标签设计上,文章建议先从未来 5 日、10 日、20 日的超额收益入手,观察因子在短、中、长周期上的稳定性。
在模型结构上,可用时序编码器先把行情数据压缩为潜在表征,再通过瓶颈层映射成候选因子,而不是让模型直接输出价格预测。
衡量因子是否有效,文章把 IC、RankIC、分层收益、多窗口稳定性、衰减曲线、换手率和与已有因子的相关性都纳入验证框架,强调单期收益并不可靠。
为了避免“历史有效、未来失效”,文章主张使用 Walk-Forward 滚动验证,让因子在不断前移的时间窗口中被重新发现、重新筛选。
在工程实现上,作者建议核心研究逻辑由 Python 服务承担,Agent 只做外层编排和自动化调度,不直接接管核心算法或高风险交易权限。
文章最后给出的结论很明确:真正的竞争力不是某个神奇指标,也不是一次漂亮的回测曲线,而是一台能持续生产研究结论、不断进化的因子研究机器。