GARCH模型漫谈:离捕捉市场波动,我们还差什么?
这篇文章围绕 GARCH 模型在量化风控中的局限展开,核心问题是:为什么很多时候模型在样本内表现正常,但一遇到剧烈波动,真实亏损仍会大幅超出预测?
文章首先从“波动率聚集”讲起:市场经常呈现大波动跟着大波动、平静跟着平静的特征,因此 ARCH/GARCH 这类条件异方差模型成为描述波动动态的重要工具。它们相比固定波动率模型更贴近现实,也因此长期被用于 VaR 估计和风险管理。但作者指出,GARCH 主要解决的是“波动随时间变化”的问题,并没有真正解决收益率的肥尾问题。即便把分布改成更厚尾的学生 t 分布,极端行情下的损失仍经常超出模型给出的风险边界。
接着文章把矛头对准“标准化残差”的隐含假设。理论上,标准化残差应该用真实波动率来除,但实际计算时只能用模型估计的波动率,这里面同时包含模型设定误差和参数估计误差。于是,当真实波动率快速上升或下降时,估计值往往滞后,导致标准化残差的分布被“污染”:在波动骤升时,普通下跌会被模型误判为极端事件;在波动骤降时,真正的风险又可能被低估成小波动。作者认为,这正是很多 VaR 回测失败的重要隐藏原因。
为了进一步刻画尾部风险,文章讨论了极值理论(EVT)的用法:先用 GARCH 过滤出标准化残差,再对尾部超额损失用广义帕累托分布(GPD)建模。然而,这套方法也有明显问题。首先是阈值怎么选:阈值太低会把非尾部样本混进来,太高又会让样本过少、估计不稳。其次,GPD 的形状参数在小样本滚动窗口里经常剧烈波动,难以判断究竟是尾巴变厚了,还是只是样本噪声。作者因此建议把极值理论更多当作稳健性检验,而不是唯一的精确答案。
文章随后讨论贝叶斯收缩。它可以把局部估计往长期均值上拉,降低参数抖动,但新的问题是先验怎么选、先验窗口多长、先验是否本身也是时变的。尤其在局部样本很短时,后验结果高度依赖人为设定,主观性并不比阈值选择更少。作者因此倾向于把贝叶斯收缩当作辅助检验,而不是最终结论,并建议与滚动历史分位数等更朴素的方法交叉验证。
在期权数据部分,文章引入了“波动率偏斜”这一视角。尾部风险升高时,价外看跌期权隐含波动率往往高于看涨期权,偏斜能反映市场对尾部风险的即时定价。但作者提醒,这个信号的回归关系很不稳定,日内噪声也很大,难以直接作为精确输入。更可行的方式是把它作为辅助预警:当偏斜超过历史高分位时,适当上调 ES 估计;若没有高质量期权数据,也可以用历史已实现波动率的偏度做交叉参考。
最后文章回到金融建模的根本限制:从巴舍利耶的正态随机漫步,到曼德勃罗的厚尾,再到 GARCH、极值理论和波动率微笑,模型一直在修正旧框架,却始终无法彻底预测极端状态。作者强调,所有基于历史数据的 VaR/ES 模型都有一个共同前提——历史会以某种连续方式重复。但当出现极端流动性枯竭或历史上未曾出现的新状态时,模型会整体失效。因此,除了统计模型,策略还应该设置一条不依赖回测证明的硬性风控线,确保在未知状态来临时仍能存活。
文章的落点也很明确:与其执着于寻找一个“终极更优”的风险模型,不如承认预测的边界,把更多精力放在准备与防守上。