2026-04-23

共 7 篇

A8到A9有多难

这篇文章围绕“A8 到 A9要花多长时间”展开,A8、A9可以理解为个人资产从千万级继续迈向亿元级的过程。文章并没有提供一套统一答案,而是通过几位投资者的真实经历和评论,说明从 A8 到 A9 往往比从 A7 到 A8 更难。

开篇作者先讲了自己的经历:从大学入市一路走到 A8,期间经历过牛市、股灾、踩坑、重仓、止盈、回撤和重建认知。文章中不断出现的关键点是“运气”和“研究”的交替作用:有些阶段靠上了周期、有些阶段靠上了题材、有些阶段则因为对公司和行业有较深研究而赚到钱。但即便如此,作者也承认,A8 之后自己的投资思路越来越保守,开始担心大回撤,甚至对“从 A8 再往 A9 走”没有特别清晰的想法。

文章接着引用了多位集思录网友的观点,进一步解释为什么 A8 到 A9 这么难。一个核心观点是:从百万到千万的路径很多,靠工资、房产、创业、投资,甚至运气都可能实现;但从千万到亿元,能走通的路径就少得多,基本只剩投资和创业两条。也就是说,财富规模越往上,越不是“慢慢攒”能解决的,而更依赖于少数几次大的机会、足够高的认知,以及敢于承担波动的能力。

另一层意思是,资产规模越大,心理结构会发生变化。很多人从 A7 到 A8 之后,风格会变得越来越保守,开始配置红利、低波、可转债、摊大饼,追求稳健而不是激进。这样做的结果是:虽然更不容易回撤,但想再跨一级也会越来越难。换句话说,过去帮助你从 A7 到 A8 的进攻型策略,往往并不适合继续通往 A9;而如果为了 A9 去重新加大风险,又可能把已有成果打回去。

文章还提到,高净值和超高净值家庭的构成差异:千万级家庭里,金领、职业股民、不动产投资者都有一定比例;但亿元级家庭里,企业主占比显著更高。这也说明,财富上一个台阶之后,光靠稳定工资和普通投资积累,往往很难继续往上走。

整篇文章的结论是比较克制的:A8 到 A9 不是一个线性增长问题,而是一个需要认知、机遇、杠杆和心理承受力同时到位的问题。对很多人来说,最重要的也许不是执着于“再多一个零”,而是先把现有财富和生活稳住,再决定要不要为更高一级的目标继续冒险。

GARCH模型漫谈:离捕捉市场波动,我们还差什么?

这篇文章围绕 GARCH 模型在量化风控中的局限展开,核心问题是:为什么很多时候模型在样本内表现正常,但一遇到剧烈波动,真实亏损仍会大幅超出预测?

文章首先从“波动率聚集”讲起:市场经常呈现大波动跟着大波动、平静跟着平静的特征,因此 ARCH/GARCH 这类条件异方差模型成为描述波动动态的重要工具。它们相比固定波动率模型更贴近现实,也因此长期被用于 VaR 估计和风险管理。但作者指出,GARCH 主要解决的是“波动随时间变化”的问题,并没有真正解决收益率的肥尾问题。即便把分布改成更厚尾的学生 t 分布,极端行情下的损失仍经常超出模型给出的风险边界。

接着文章把矛头对准“标准化残差”的隐含假设。理论上,标准化残差应该用真实波动率来除,但实际计算时只能用模型估计的波动率,这里面同时包含模型设定误差和参数估计误差。于是,当真实波动率快速上升或下降时,估计值往往滞后,导致标准化残差的分布被“污染”:在波动骤升时,普通下跌会被模型误判为极端事件;在波动骤降时,真正的风险又可能被低估成小波动。作者认为,这正是很多 VaR 回测失败的重要隐藏原因。

为了进一步刻画尾部风险,文章讨论了极值理论(EVT)的用法:先用 GARCH 过滤出标准化残差,再对尾部超额损失用广义帕累托分布(GPD)建模。然而,这套方法也有明显问题。首先是阈值怎么选:阈值太低会把非尾部样本混进来,太高又会让样本过少、估计不稳。其次,GPD 的形状参数在小样本滚动窗口里经常剧烈波动,难以判断究竟是尾巴变厚了,还是只是样本噪声。作者因此建议把极值理论更多当作稳健性检验,而不是唯一的精确答案。

文章随后讨论贝叶斯收缩。它可以把局部估计往长期均值上拉,降低参数抖动,但新的问题是先验怎么选、先验窗口多长、先验是否本身也是时变的。尤其在局部样本很短时,后验结果高度依赖人为设定,主观性并不比阈值选择更少。作者因此倾向于把贝叶斯收缩当作辅助检验,而不是最终结论,并建议与滚动历史分位数等更朴素的方法交叉验证。

在期权数据部分,文章引入了“波动率偏斜”这一视角。尾部风险升高时,价外看跌期权隐含波动率往往高于看涨期权,偏斜能反映市场对尾部风险的即时定价。但作者提醒,这个信号的回归关系很不稳定,日内噪声也很大,难以直接作为精确输入。更可行的方式是把它作为辅助预警:当偏斜超过历史高分位时,适当上调 ES 估计;若没有高质量期权数据,也可以用历史已实现波动率的偏度做交叉参考。

最后文章回到金融建模的根本限制:从巴舍利耶的正态随机漫步,到曼德勃罗的厚尾,再到 GARCH、极值理论和波动率微笑,模型一直在修正旧框架,却始终无法彻底预测极端状态。作者强调,所有基于历史数据的 VaR/ES 模型都有一个共同前提——历史会以某种连续方式重复。但当出现极端流动性枯竭或历史上未曾出现的新状态时,模型会整体失效。因此,除了统计模型,策略还应该设置一条不依赖回测证明的硬性风控线,确保在未知状态来临时仍能存活。

文章的落点也很明确:与其执着于寻找一个“终极更优”的风险模型,不如承认预测的边界,把更多精力放在准备与防守上。

中国最大的大模型套壳创业者

这篇文章讲的是 Cherry Studio 创始人王新铭(Yinsen)的创业经历,以及他为什么不介意把自己定义成“套壳”创业者。文章的核心观点是:在大模型能力由底层算力、数据和生态决定的前提下,真正重要的并不是谁能“发明模型”,而是谁能把模型能力转化成普通人可用的真实生产力。

文章先介绍了 Yinsen 的背景:他 1990 年生于山东临沂,早年经历过邮局柜台、PPTV、喜马拉雅、字节、依图、黑鲨等多段职业路径,最终在 2024 年开始创业 Cherry Studio。Cherry Studio 一开始就是从“套壳”大模型出发,做一个把多家模型 API 接进来的 Chatbot / AI Workspace。作者强调,Yinsen 并不认为“套壳”是贬义词,相反,这代表了一种极强的产品化能力:当底层模型本身已经足够强时,真正创造价值的是如何把能力组织起来、让用户高效使用。

文章大量描写了 Cherry Studio 的创业细节:早期办公室在上海嘉定南翔,一个老厂房里几十平米的空间,租金很低,椅子不够还得拿露营椅凑数;团队里除了创始人和合伙人,还有一些研究生开发者,Yinsen 甚至会给他们报销模型订阅费和外卖费,以此提高迭代速度。团队最初的扩张也不是靠大规模销售,而是靠“超级个体”自传播——那些需要 AI 工具维持专业度和生产力的人,会成为自然的使用者和推广者。

文章还回顾了 Yinsen 的前职业经历,尤其是他在邮局工作的阶段。他原本可能会走一条更传统、更稳定的道路,但一部 2011 年买的小米手机改变了他:他在手机上安装各种应用、给开发者提建议,逐渐被互联网公司注意到,人生轨迹也随之转向。后来他在依图科技接触到上一代 AI,更清楚地看到那种以监控识别为核心的 AI 和当下“大模型 + 工具”方向的差别:前者偏管理和结构化,后者更接近解放生产力、让普通人变强。

文章也讨论了他对行业的判断。Yinsen 认为,Claude Code 的出现标志着 Agent 进入了“原生时代”,也说明原生工具与底层生态深度集成的重要性;同时他不太认同一些团队声称做出“比 Claude Code 更强 Agent”的说法,认为这是违背技术演进常识的幻觉。作者把这种态度总结为一种“弱者思维”的技术信仰:不去给 AI 架拐棍,而是做一个能随水位上涨的小木板,让工具本身成为生产力的一部分。

最后,文章把 Yinsen 归为那种“不太会讲给 VC 听,但很会讲给人听”的创始人。他的创业故事里有很多现实细节、职业转折和个人感受,形成了一种更像“to human”的叙事。整篇文章的结论很清楚:大模型时代真正值钱的,未必是模型本身,而是把模型能力产品化、工具化、生态化的那一层。

什么行为创造财富

这篇文章用一个偏理论化的模型,讨论“什么行为创造财富”。作者先把财富分成两类:物质财富和金融财富,并强调金融财富本质上是对物质财富的索取权,因此金融财富必须建立在物质财富之上,不能脱离实体生产独立存在。

文章通过一个“买房—分拆索取权—交易定价”的极端模型来说明这一点。假设小红用贷款买下一套房子,这一行为本身并没有改变房子的物理属性,但房子被赋予了金融价值;如果再把这套房子的未来收益索取权切分成许多份,市场参与者不断交易这些凭证,那么房子的名义市值就可能在货币扩张与交易博弈中被不断抬高。作者想说明的是:房子的物质属性没有变,变化的是围绕它的索取权定价。

在这个基础上,文章进一步把同样的逻辑推广到企业:企业的价值,本质上也可以拆分成两个层面——一是企业实际创造物质财富的能力,比如制造汽车、芯片或其他产品的能力;二是这种创造能力对应的索取权在金融市场上的定价。前者由技术、组织和生产能力决定,后者则强烈依赖边际交易者的认知、预期和资金条件。换句话说,企业的“实际财富创造能力”和其“市值”并不完全同质,二者可以相互关联,但不能混为一谈。

作者最后给出两个结论:第一,生产行为本身会创造财富;第二,对物质财富索取权凭证的交易,有时也可能促进财富创造,因为它能帮助组织资源、扩张产能,但索取权凭证的价格不能简单等同于物质财富本身。文章还推导出一个更激进的推论:如果未来实体生产路径清晰、并且货币与信贷持续扩张,那么某些资产的名义价格就可能不断加零。整体上,这是一篇偏宏观思辨的文章,核心在于区分“真实财富”与“金融定价”,提醒读者不要把市值直接当成生产本身。

国信券商与瑞金证券

这篇文章是一篇围绕国信证券、金融工程团队与“瑞金证券”构想展开的回忆与访谈整理。作者以播客访谈为线索,讲述了国信证券金工团队从无到有、从被质疑到成为行业标杆的历程,也补全了其对国信企业文化与组织理念的观察。

文章开头先回顾了中国卖方研究的发展背景:在基本面研究已经成为主流的年代,金融工程仍是冷门领域。国信证券在较早时期就开始布局金工,2005 年葛新元以个人名义拿下新财富金工第一,随后在 2009 年重建金工研究团队,并迅速在 2010 年冲到新财富第一。作者通过董艺婷的回忆说明,当时金工卖方的处境并不轻松:路演对象少、买方不理解、很多人甚至会直接质疑“如果这个东西能用,那还要我干嘛”。但也正是这种“先被怀疑、后被接受”的过程,让金工逐渐展示出技术输出能力,比如定制指数、算法交易系统等,成为券商研究中少见的“技术供应商”式存在。

文章接着把视角转向国信的管理文化,重点落在胡继之身上。作者通过多位老员工的回忆,描写胡继之在招聘、路演、管理上的细节:他敢于用高薪招揽优秀分析师,把这视作公司形象与人才战略的广告;他在陪同路演时会提前到场、整理领带、做笔记、给分析师反馈,表现出对专业的尊重和对细节的重视。作者由此提出,一个券商的文化并不抽象,而是由一代代从业者对公司细节的共同记忆构成。

文章后半部分进入最重要的主题:瑞金证券的设想。作者提到,2020 年曾有关于胡继之筹建瑞金证券的报道,当时自己并不以为然,认为这个构想过于理想化,且与行业现实趋势不符。直到与董艺婷深入交流后,他才发现自己低估了这件事。董艺婷拿出了当年筹备团队保存的架构图与 PPT,介绍了瑞金证券背后的三个“遗憾”:一是优秀员工离开公司,没能成为更紧密的利益共同体;二是现有组织架构无法充分计量一个人跨前台、中台、后台的综合贡献;三是券商往往只服务了客户的某一个环节,而没有把客户视作完整主体去提供全方位金融服务。瑞金证券的设计,正是希望通过更扁平、合伙人化、轨道并行的组织形式,去弥补这些遗憾。

但作者最终仍然认为,瑞金证券几乎不可能在现实中落地。不是因为设计不够先进,而是因为董事会、合规、监管、组织惯性等现实障碍太大。它在理念上非常前瞻,但在当时乃至可预见的未来,都难以真正成形。尽管如此,作者并没有把这当作失败,而是将其理解为一种理想主义的尝试:旧模式终将走到尽头,而改变往往总是由理想主义者推动。

文章最后回到更广泛的行业与人生主题。作者认为,自己以后或许不会再继续写国信证券的历史,因为“瑞金证券”这条故事线已经足够补全他对国信文化的理解。更进一步,文章也借这一段券商史提醒读者:行业发展并不只由制度和趋势决定,同样由具体的人、具体的坚持、具体的记忆构成。国信证券的“文化”,就在这些细节里被一代代人传承下来。

确定的乐观主义

这篇文章围绕彼得·蒂尔的“确定的乐观主义”展开,核心是在讨论人应该如何理解未来、如何安排自己的行动,以及“把每一天当作最后一天”与“把每一天当作永远”这两种时间观的区别。

文章先从乔布斯和彼得·蒂尔的两种说法切入。乔布斯强调把每天都当成生命中的最后一天来过,而蒂尔则反过来主张:应该把每一天都当作会永远持续下去来过。作者认为,这反映出蒂尔哲学中的核心概念——“确定的乐观主义”。在这个框架下,未来不是被动等待的结果,而是可以通过明确设计和长期执行主动塑造的对象。

文章进一步用一个“四象限”模型来解释人们对未来的态度:确定的乐观主义、 不确定的乐观主义、 确定的悲观主义、 不确定的悲观主义。作者解释说,蒂尔批判的主要对象是不确定的乐观主义,也就是“未来会更好,但我不知道怎么让它更好,所以保持灵活、分散、等待机会”的思维方式。在他看来,这种心态对应的是金融化时代:人们更习惯做资产重组、做多样化、做期权思维,而不是去真正创造新事物。

与之相对,确定的乐观主义则意味着相信未来会更好,并且相信自己知道如何让它变好。它强调的是“设计”而不是“运气”,强调长期工程、发明创造和高度聚焦。文章列举了阿波罗计划、州际公路系统、iPhone、火箭等例子,说明这种世界观下的人更倾向于 build,而不是 bet。蒂尔还反对过度分散和所谓的“多元化”,认为那只是无知的保护伞;如果你真的知道哪里有潜力,就应该 All-in,而不是东碰一点、西沾一点。

文章也提到蒂尔对“精益创业”的批评。蒂尔认为,过度依赖 MVP 和快速试错,反而说明创业者缺乏对未来的清晰信念;真正的确定性乐观主义者应该有更明确的愿景,并花时间把它扎实地实现出来,而不是被市场反馈牵着走。作者对此也做了补充说明:蒂尔强调的是一种积极的态度,但并不意味着抛弃概率和分析,而是要在明确目标之上使用工具。

最后,文章把这一切和“把每一天当作永远”联系起来,认为这其实是一种对长期主义的时间观表达:如果你相信未来仍然会持续,就不会把人生过成短期消费,而会更认真地设计自己的路径、项目和关系。整篇文章的结论是:真正的乐观不是盲目乐观,而是知道自己想去哪里,并愿意为那个未来持续投入。

连续扩散文本新突破

这篇文章介绍了 UIUC 团队提出的 LangFlow,核心目标是让连续扩散模型在文本生成上真正接近甚至追平当前最强的离散扩散模型。作者认为,过去连续扩散在语言建模里一直“打不过”离散扩散,根本原因不只是模型结构本身,而是理论、实现和技巧三个层面都存在缺口。

首先是理论层面。文章指出,之前的连续扩散语言模型在训练、采样和评估之间并不自洽:训练目标常常与流场学习没有严格对齐,评估困惑度时又依赖较弱的随机下界,导致研究者甚至难以判断模型优化到底有没有变好。LangFlow 通过 Bregman 散度把离散 token 的交叉熵损失与连续流匹配统一起来,并进一步推导出基于 ODE 的负对数似然上界,使训练、采样和评估能够放在同一个理论框架中,从而解决“训练和采样两张皮”的问题。

其次是实现层面。过去的连续扩散在语言任务上常常直接照搬图像扩散的经验,使用均匀的时间噪声调度,但作者发现这在语言任务中效率极低:大量中低噪声区间几乎没有学习价值,模型很容易就能预测正确 token。LangFlow 因此改用对数噪信比(logNSR)作为条件变量,并提出信息均匀原则,让每一个训练步都尽量承载等量信息。作者还用 Gumbel 分布来设计可学习的噪声调度器,把原本浪费在低价值区间的算力重新分配到更关键的高信息区域。这个改动显著降低了生成困惑度。

第三是技巧层面。文章重点讨论了 self-conditioning 在连续扩散中的作用。此前很多研究延续了离散扩散的习惯:在评估 PPL 时关闭 self-conditioning,因为离散扩散里它常常存在“生成变好、似然变差”的权衡。但 LangFlow 通过实验发现,连续扩散中 self-conditioning 没有这种 trade-off,反而会同时提升生成质量和似然表现。因此它在训练中以一定概率开启 self-conditioning,并在评估和采样时全程启用,从而进一步压低 PPL 和 Gen.PPL。

实验结果上,LangFlow 在 130M 参数的设置下取得了很强的竞争力,在 LM1B 等基准上首次让连续扩散在核心指标上追平甚至超过了最强离散扩散模型。文章也提醒,当前结果仍有边界:模型规模还不大,长上下文和工业级场景是否成立仍待验证;而连续扩散是否真有离散模型无法替代的独特优势,也还没有被完全证明。

总体来看,这篇文章的结论很明确:LangFlow 让连续扩散在文本建模上第一次真正建立了统一、可比、可优化的理论与工程框架,说明连续扩散并非天然不适合语言任务,只是过去的方法还没把关键环节补齐。