← 所有标签

# 生成模型

邓明扬访谈

这篇文章是对 MIT 博士生邓明扬的深度访谈,主题围绕他的成长经历、研究路径,以及他对生成模型和 AI 研究的看法展开。

文章先介绍了邓明扬的背景:他高中时期获得过 IMO 金牌和 IOI 金牌,本科在 MIT 同时学习数学与计算机科学,之后在 DeepMind 和 Meta 实习,最终回到 MIT 跟随何恺明读博,当前主要研究生成模型。文章也提到他在 2026 年以第一作者发表了《Drifting Models》,探索不同于传统路线的生成建模思路。

在成长经历上,邓明扬强调自己最早是因为喜欢写代码、喜欢让想法变成可以运行的系统,才自然走上编程和竞赛道路。他对竞赛的理解比较轻松,认为竞赛更多是一种兴趣驱动的活动,可以帮助训练抽象观察能力和从有限信息中归纳判断的能力,但不必把成绩看得过重。

文章很大篇幅讨论了竞赛、TCS、数学和 AI 之间的差异。邓明扬认为,TCS 更像“解一个定义明确的问题”,数学更像“发现真理”,而 AI 更像“押注未来路线、参与一场革命”。相比严格证明,他更喜欢 AI 这种通过实验和直觉理解世界的方式,因为它更贴近现实系统的迭代过程,也更有创造感。

在研究方法上,他强调一个核心习惯:多看不同人的第一直觉,把零散观察拼接起来形成自己的理解。很多看似复杂的问题,往往可以通过把不同人的观察融合后,找到更简单的解法。他还提到,在很多研究问题上,“试”比“辩论”更重要,尤其是在机器学习里,实验往往比纯讨论更能推进问题。

文章还比较了学术界和工业界研究风格。邓明扬认为工业界更接近前沿,更容易感受到 state-of-the-art 的推进,但个体贡献感可能较弱;学术界则更自由,研究者往往要从基础设施到具体问题都自己负责。他对未来 AI 研究的一个判断是:长期来看,噪声和黑天鹅可能比线性信号更重要,很多真正的突破未必来自最显眼的方向,因此学术界保持较高探索温度是有价值的。

在导师选择上,他谈到何恺明给自己的吸引力不仅在于技术能力,更在于对学生的关心和支持,这对博士阶段尤其重要。整体来看,这篇访谈不仅讲了一个天才研究者的成长路径,也体现了他对研究、创新和未来 AI 方向的一些较成熟的判断。

如果概括成一句话,这篇文章传达的是:竞赛训练的是观察和抽象能力,研究训练的是判断问题重要性的能力,而 AI 研究最重要的,是在不确定性中持续试验、持续学习,并敢于押注新的方向。

一个真正理解波动率的生成模型,夏普比率2.11(有代码)

这篇文章介绍了一项用于合成金融时间序列的新方法 SBBTS(Schrödinger-Bass Bridge for Time Series),核心目标是把薛定谔桥和 Bass 鞅传输统一到一个最优传输框架中。作者认为,传统的生成方法要么更擅长拟合漂移、但固定了波动率结构;要么更擅长刻画波动率、但忽略了时间依赖和预测结构,因此都不够完整。SBBTS 的思路是不再在“漂移”和“波动率”之间二选一,而是把两者同时纳入一个可学习的生成目标中。

文章给出的实验结果主要强调了这种统一建模带来的收益。在 433 只标普 500 成份股上,基于 SBBTS 合成数据训练的简单方向性策略取得了 2.11 的夏普比率,高于真实数据训练的 1.61,也明显优于零样本的 -0.25。除此之外,分类准确率提升到 53.2%,并且在对数损失和 ROC AUC 上也表现最好。作者据此认为,这种提升不是靠随机噪声增强获得的,而是模型结构本身更接近真实金融时间序列。

文章还提到,在 Heston 模型基准测试中,SBBTS 可以较好还原“波动率的波动率”和相关性参数,而标准薛定谔桥方法容易遗漏这些关键特征。整体上,这篇文章传达的结论是:如果想生成更接近真实市场的金融序列,就不能只拟合价格走势或边际分布,而要把漂移、随机波动率和相关性一起建模。