← 所有标签

# 量化

LPPL模型应用指南

这篇文章围绕 对数周期幂律模型(LPPL) 展开,讨论它为什么在金融市场中“看起来很强、用起来却很脆弱”,以及量化投研里该如何更谨慎地理解它。

核心内容

1. LPPL 的吸引力

文章先从交易者的真实困境切入:当价格出现“加速上涨—短暂回调—再次加速”的形态时,很多人会本能地想判断这是不是泡沫、是不是接近临界点。LPPL 的吸引力就在于,它似乎可以从价格序列中直接推导出一个具体的临界时间,给出“崩盘何时发生”的答案。

2. 过参数化带来的万能拟合

LPPL 的标准形式包含 7 个参数,灵活性很高。文章指出,这种灵活性本身就是风险:
  • 在随机价格序列上,LPPL 也能拟合出“看起来很像”的曲线;
  • 即使样本内拟合优度很高,也不代表临界时间真的存在;
  • 参数空间中存在高度不稳定的方向,导致临界时间估计容易漂移。

换句话说,LPPL 往往能“解释”很多走势,但这不等于它真的“预测”到了什么。

3. 显著性的假象

文章进一步讨论了常见的事后检验,比如对残差做 ADF 单位根检验。作者认为,这类检验在 LPPL 场景下并不牢靠,因为:
  • ADF 的理论临界值基于较简单的自回归假设;
  • 金融数据往往存在小样本、非正态、结构断点等问题;
  • LPPL 残差和真实市场噪声之间可能发生混叠。

因此,检验“看起来显著”,不代表模型真的抓住了市场中的临界结构。

4. 参数极不稳定

文章用“平坦草坪找最高点”来形容 LPPL 参数估计的问题:
  • 不同参数方向的敏感度差异很大;
  • 微小扰动就可能让临界时间大幅跳变;
  • 滚动拟合时,临界时间今天是 30 天后,明天可能变成 50 天后,后天又变了。

这意味着,任何基于“具体多少天后崩盘”的决策都非常危险,因为那个数字可能只是噪声驱动的产物。

5. 金融市场与物理临界现象不同

LPPL 原本来自固体断裂、地震等物理临界系统。文章强调,金融市场与这些系统存在根本差异:
  • 物理实验可以重复、控制条件、积累样本;
  • 金融市场中的临界事件几乎不可重复;
  • 资金、预期、制度和行为反馈会不断改变市场结构。

因此,把物理临界模型直接移植到金融市场,往往会面临“理论漂亮、实盘脆弱”的问题。

文章结论

作者并不是说 LPPL 完全没有价值,而是强调它更适合被当作一种研究工具,而不是一个可以直接给出精确崩盘日期的预测机器。真正有价值的用法,是把它放进更严格的投研框架中,结合:
  • 稳健性检验
  • 替代模型对照
  • 样本外验证
  • 参数漂移监控

我的理解

这篇文章的重点不是否定 LPPL,而是提醒我们:当一个模型能对几乎任何走势都拟合得很好时,最该警惕的不是“它不够聪明”,而是“它可能太灵活了”。

在量化交易里,越是能给出具体时间点、具体结论的模型,越需要检查它的稳定性、外推能力和假阳性风险。LPPL 的价值,更多在于帮助我们识别“市场可能处于加速和脆弱状态”,而不是精确押注某一天的崩盘。

Jane Street赚钱逻辑

这篇文章介绍了全球最神秘、也最赚钱的交易机构之一 Jane Street,重点解释它为什么能在 2025 年创下极高的交易利润,以及它的赚钱方式为何让普通投资者既依赖又不安。

文章首先梳理了 Jane Street 的背景:它成立于 1999 年,总部在纽约,规模只有约 3500 名员工,却凭借做市与量化交易在 2025 年实现了 390 亿美元级别的交易利润。它低调到几乎不公开接受采访,也没有典型华尔街公司的强层级结构,而是强调扁平化组织和极强的技术文化。

作者指出,Jane Street 的核心业务是做市商:在买卖双方之间提供报价、撮合成交,并通过极小的价差盈利。单笔利润微薄,但在超高频、超大规模的交易中会被放大成惊人的收益。其优势主要来自两点:一是早早切入 ETF 做市,建立了长期技术壁垒;二是依赖数学建模与速度,在多个市场之间寻找瞬时价格偏差并完成套利。

文章还强调,Jane Street 的招聘与华尔街传统金融机构很不一样,更看重数学、逻辑和概率思维,甚至会通过扑克等方式测试候选人的决策能力。它的内部文化也与交易逻辑高度一致:重视在不完整信息下做概率判断,而不是传统意义上的金融经验。

与此同时,文章也讨论了监管和争议。2008 年金融危机后,传统银行受监管限制退出部分自营与做市空间,Jane Street 趁机扩张;但随着它在印度、欧洲乃至中国等市场的影响力扩大,围绕“做市与操纵的边界”也出现了更多质疑。文章认为,Jane Street 的成功说明市场需要流动性,但其盈利模式本身也建立在信息和速度优势之上,因此天然带有争议。

最后,作者总结,Jane Street 不只是一个赚钱很强的交易机构,更像是一套把数学、技术、资本和组织方式结合到极致的市场机器。它既是现代金融效率的代表,也折射出当代市场中普通投资者、机构与监管之间越来越复杂的关系。

一个散户自学量化

摘要

这篇文章记录了一位散户自学量化 20 个月的经历,核心不是“如何快速赚钱”,而是“量化如何重塑一个人理解市场的方式”。作者一开始也抱着很典型的散户幻想:学 Python、做机器学习、写策略,就能预测涨跌、稳定盈利。但在不断亏损和反复试错之后,他逐渐意识到,量化的重点不是写代码本身,而是从“猜涨跌”转向“算概率”,从绝对判断转向条件判断。

文章首先强调,散户常常只盯着单个信号、单只股票、某根 K 线,而量化思维要求先理解条件概率:一个现象在什么条件下才有意义?孤立事件本身通常没交易价值,真正有价值的是它背后的统计关系。作者认为,这种转变是量化学习中最重要的一步,因为它意味着你不再把“肯定”当成答案,而是开始接受市场中的不确定性。

接着,文章讨论了“写策略之前先学会怀疑自己”。作者发现,回测中的最优解并不一定能在实盘中兑现,原因包括滑点、手续费、执行问题、样本外失效等。量化并不是把公式算出来就结束,而是一个持续验证、不断修正、承认误差的过程。尤其到了期权和更复杂的衍生品阶段,变量更多,波动本身也会成为成本的一部分。

文章还提到,量化不仅仅是研究单只股票,而是要在更大的资产和组合维度上思考;同时,估算误差会越来越成为真正的瓶颈。也就是说,模型本身未必是最难的,难的是你如何正确估计参数、如何处理偏差、如何面对现实世界里的噪声和约束。

整体来看,这篇文章更像是一份普通投资者的量化学习笔记:它没有夸张的收益承诺,而是强调量化是一种认知升级——让人从凭感觉交易,转向用概率、验证和风险约束来理解市场。

体会

这篇文章最有价值的地方,是它把量化从“高薪职业幻想”拉回到“方法论训练”。对普通人来说,真正值得学的不是某个神奇策略,而是概率思维、怀疑精神、组合意识和对实盘约束的尊重。

GARCH模型漫谈:离捕捉市场波动,我们还差什么?

这篇文章围绕 GARCH 模型在量化风控中的局限展开,核心问题是:为什么很多时候模型在样本内表现正常,但一遇到剧烈波动,真实亏损仍会大幅超出预测?

文章首先从“波动率聚集”讲起:市场经常呈现大波动跟着大波动、平静跟着平静的特征,因此 ARCH/GARCH 这类条件异方差模型成为描述波动动态的重要工具。它们相比固定波动率模型更贴近现实,也因此长期被用于 VaR 估计和风险管理。但作者指出,GARCH 主要解决的是“波动随时间变化”的问题,并没有真正解决收益率的肥尾问题。即便把分布改成更厚尾的学生 t 分布,极端行情下的损失仍经常超出模型给出的风险边界。

接着文章把矛头对准“标准化残差”的隐含假设。理论上,标准化残差应该用真实波动率来除,但实际计算时只能用模型估计的波动率,这里面同时包含模型设定误差和参数估计误差。于是,当真实波动率快速上升或下降时,估计值往往滞后,导致标准化残差的分布被“污染”:在波动骤升时,普通下跌会被模型误判为极端事件;在波动骤降时,真正的风险又可能被低估成小波动。作者认为,这正是很多 VaR 回测失败的重要隐藏原因。

为了进一步刻画尾部风险,文章讨论了极值理论(EVT)的用法:先用 GARCH 过滤出标准化残差,再对尾部超额损失用广义帕累托分布(GPD)建模。然而,这套方法也有明显问题。首先是阈值怎么选:阈值太低会把非尾部样本混进来,太高又会让样本过少、估计不稳。其次,GPD 的形状参数在小样本滚动窗口里经常剧烈波动,难以判断究竟是尾巴变厚了,还是只是样本噪声。作者因此建议把极值理论更多当作稳健性检验,而不是唯一的精确答案。

文章随后讨论贝叶斯收缩。它可以把局部估计往长期均值上拉,降低参数抖动,但新的问题是先验怎么选、先验窗口多长、先验是否本身也是时变的。尤其在局部样本很短时,后验结果高度依赖人为设定,主观性并不比阈值选择更少。作者因此倾向于把贝叶斯收缩当作辅助检验,而不是最终结论,并建议与滚动历史分位数等更朴素的方法交叉验证。

在期权数据部分,文章引入了“波动率偏斜”这一视角。尾部风险升高时,价外看跌期权隐含波动率往往高于看涨期权,偏斜能反映市场对尾部风险的即时定价。但作者提醒,这个信号的回归关系很不稳定,日内噪声也很大,难以直接作为精确输入。更可行的方式是把它作为辅助预警:当偏斜超过历史高分位时,适当上调 ES 估计;若没有高质量期权数据,也可以用历史已实现波动率的偏度做交叉参考。

最后文章回到金融建模的根本限制:从巴舍利耶的正态随机漫步,到曼德勃罗的厚尾,再到 GARCH、极值理论和波动率微笑,模型一直在修正旧框架,却始终无法彻底预测极端状态。作者强调,所有基于历史数据的 VaR/ES 模型都有一个共同前提——历史会以某种连续方式重复。但当出现极端流动性枯竭或历史上未曾出现的新状态时,模型会整体失效。因此,除了统计模型,策略还应该设置一条不依赖回测证明的硬性风控线,确保在未知状态来临时仍能存活。

文章的落点也很明确:与其执着于寻找一个“终极更优”的风险模型,不如承认预测的边界,把更多精力放在准备与防守上。

CTA因子两条路

这篇文章讨论 CTA 因子挖掘中最常见的一组方法论选择:到底更适合做时序因子,还是做截面因子。

文章先把两者的核心差异讲得很清楚:时序因子是拿品种自己的历史和自己比较,关注的是价格相对历史分布的位置,典型逻辑是趋势跟踪或均值回复;截面因子则是把同一时刻的不同品种放在一起比较,关注的是相对强弱,典型逻辑是多空对冲或横截面排序。

在收益来源上,文章认为两类因子依赖的市场结构不同。时序因子更依赖价格序列的自相关性,趋势行情越明显,越容易赚钱,但在震荡市里会不断被假信号消耗。截面因子更依赖品种之间的相对关系和分化程度,在波动率较低、品种间相关性较稳定时更容易发挥作用;一旦遇到系统性冲击或相关性突然升高,多空结构就可能失效,出现“两头受伤”的问题。

文章特别强调了波动率对两类策略的不同影响:时序因子往往是波动率的受益者,波动越大,趋势幅度越容易被放大;截面因子则更像波动率的空头,低波动、强分化更适合它,高波动、强相关则不利于它。作者据此引出一个很实用的判断:选择时序还是截面,本质上也是在判断自己对未来波动率环境的看法。

在应用层面,文章还讨论了频率问题。低频截面更依赖板块内部的逻辑一致性,比如黑色系、化工、农产品、有色等;而在更高频的层面,微观结构因素会让更广泛的品种池具备可比性。相对地,时序因子在频率变化上更像是参数周期的调整,逻辑框架本身没有那么大的范式切换。

最后,文章给出的结论不是“谁更强”,而是“谁更适合你的约束条件”。时序策略要接受收益不均匀、参数敏感和震荡磨损;截面策略要接受品种池局限、多空双杀和交易成本。作者认为,更重要的是理解每类策略的适用环境和边界,而不是试图寻找一个能包打天下的万能因子。

整体来看,这是一篇偏方法论和实战框架的文章,适合做 CTA 因子研究时作为选型参考:如果你更看重趋势、容忍波动和长等待,时序可能更合适;如果你更看重相对强弱、组合平滑和对冲结构,截面可能更合适。

Barra模型困局

文章讨论的是一个很现实的问题:当 Barra 模型从单纯的风险管理工具,变成全行业普遍采用的“共同知识”之后,它是否会反过来放大市场波动。作者先从一个极端情景切入:一家机构把市值、流动性、波动率等因子都中性化,看起来组合很“干净”,但在极端行情里,多空两头却可能一起受损。文章认为,这不是模型算错了,而是模型被太多人同时使用后,开始影响参与者彼此的行为。

作者把这种现象拆成几个层次来解释。第一层是认知:Barra 里的很多因子,原本曾经是有效的 alpha,后来才逐渐演化成风险因子。第二层是博弈:当所有机构都知道别人也在用同一套模型时,个体理性的中性化选择,可能在集体层面变成一种非理性的拥挤操作。第三层是市场微观结构:当赎回、止损、强平、涨跌停和流动性枯竭叠加时,模型信号会被真实交易行为进一步放大。

文章特别强调 2024 年 2 月那轮极端波动,说明很多小微盘产品并不是单纯因为基本面变化而下跌,而是因为行业共用的风控框架、相似的持仓结构和相似的止损机制同时触发,形成了自我强化的负反馈链条。于是,原本被视为“风险对冲”的操作,反而在局部市场里制造了更强的共振。

在应对上,作者提出两条思路:一条是寻找还没被全行业定义的维度,比如利用大模型处理非结构化数据,去挖掘新的信号;另一条是用二阶思维去识别因集体抛售造成的短期错误定价,在流动性枯竭时寻找过度反应的机会。不过作者也提醒,这两条路都很难,前者会迅速被市场模仿并变成新共识,后者则受制于流动性、风控和时间维度的不确定性。

文章最后把 Barra 的位置重新定义为:它是个优秀工具,但一旦成为基础设施,就不再只是测量市场,而是在塑造市场。真正值得警惕的,不是模型本身,而是所有人都把它当成唯一正确答案之后,市场行为如何被共同塑造。

两大价值指数对比

文章对比了 A 股两只规模较大的价值风格指数:中证国信价值指数和国证价值100指数。作者先解释了价值指数的基本逻辑,即通过低市盈率、低市净率、高股息等标准寻找估值偏低、盈利相对稳定的股票,但不同指数在“价值”和“质量”的权重上并不相同。

中证国信价值指数更强调“价值 + 质量”的结合。它先筛掉流动性差、经营风险较高、盈利持续下滑的公司,再在高质量股票池里挑选低估值标的,因此更偏向于优质公司中的相对便宜者。该指数采用等权加权,行业和个股分散度较高,风格更平衡,也更偏中盘。

国证价值100指数则更接近“纯价值”思路。它的基础质量过滤相对简单,随后直接按照价值因子打分选出前 100 只股票,并采用自由流通市值加权,因此整体更偏大盘价值,行业集中度也更高。作者还指出,这类指数在调仓频率、权重上限、样本更换比例等规则上差异明显,会直接影响指数风格。

文章进一步比较了两者的收益表现。无论是回溯区间还是较新的实盘区间,国证价值100整体表现略优,收益率更高,回撤也略有优势;而国信价值则更像是质量约束更强、风格更稳的价值指数。两只指数对应的 ETF 也很容易让人混淆,作者特别提醒读者不要被名字误导。

最后,文章给出一个很实用的结论:如果更偏爱寻找“价值洼地”,可以关注国证价值100;如果更看重公司质量和 ROE 等指标,则国信价值更符合偏好。对于想做价值风格配置的投资者,这篇文章的价值在于帮助理解不同“价值指数”背后的规则差异,而不是把它们简单地看成同一种东西。

长期伴侣还是一夜情?每个品种都有性格:趋势策略视角下的商品期货分类

这篇文章从趋势策略的视角,对商品期货的不同品种做了分类。
作者用“长期伴侣还是一夜情”这种比喻,来说明不同品种在交易风格和持有特征上的差别。
标题里的“每个品种都有性格”意味着,商品期货不能一概而论,需要结合各自的波动、趋势持续性和交易习惯来理解。
文章的核心是帮助趋势交易者判断哪些品种更适合长线跟随,哪些更像短期机会。
“趋势流畅度全景图”说明作者可能在用系统化的方式评价各个品种的趋势特征。
从内容风格看,这是一篇典型的量化/趋势策略分析文章。
作者通过拟人化的表达,让原本很硬核的商品期货分类更容易被读者理解。
文章的目的并不只是讲趣味,而是为交易决策提供分层和分类框架。
整体上,它是在回答:哪些商品品种更适合成为“长期伴侣”,哪些更像“一夜情”式的短线交易对象。
如果一句话概括,就是:这是一篇用趋势策略视角给商品期货分性格、做分类的交易分析文章。