今日阅读

每天读过文章的摘要整理

DeepSeek救恒科

摘要

这篇文章把 DeepSeek-V4 的发布,放在港股和恒生科技指数的大背景下来看,认为它不仅是一次模型发布,更是一次对市场预期和产业链信心的“点火”。作者的核心观点是:DeepSeek 又一次在关键时点救了恒科一命

文章开头提到,DeepSeek V4 预览版官宣上线后,港股市场迅速反应,芯片制造环节和互联网 AI 相关公司都出现明显上涨,恒生科技指数也从下跌中拉回。作者认为,这背后反映的不只是题材炒作,而是市场开始真正把 DeepSeek 视为推动 AI 产业链重估的关键变量。

文章用一句话概括 DeepSeek V4 的价值:它把“长上下文”的成本打到了地板,把多领域能力融合做到天花板,并且主动拥抱国产芯片,让好用的 AI 变得更便宜、更普惠。这一代模型延续了 DeepSeek 一贯的低价策略,也因此让更多原本无法成立的应用场景变得商业可行,尤其是长文档分析、Agent 任务、跨会话记忆等方向。

更重要的是,作者把焦点从“模型能力”进一步延伸到“算力国产化”。文中强调,DeepSeek V4 已全面适配华为昇腾芯片,底层从 CUDA 迁移到 CANN,并在昇腾 950PR 上实现大幅推理提速。这被作者视为一个非常强的信号:国产大模型并不一定只能依赖英伟达生态,国产算力也可以承载顶级模型,并且形成自己的产业闭环。

文章还提到,华为通过“超节点”这种系统级互联方式,把大量昇腾芯片组织成更强的整体算力平台;而 DeepSeek 则用极低成本的大模型能力,进一步放大了这种国产算力的商业价值。两者结合起来,意味着 AI 推理成本有机会继续下降,千行百业真正接入 AI 的门槛也会继续降低。

作者的最终判断是:DeepSeek 不只是“救了恒科”,更是在推动整个 AI 产业从“概念阶段”进入“普惠阶段”。它带来的不是单一股价波动,而是对成本结构、技术路径、算力生态和行业预期的一次重构。

体会

这篇文章的重点不在模型细节,而在宏观影响:DeepSeek 这类低成本、高性能、国产适配的大模型,正在成为港股 AI 资产和国产算力链条的重要催化剂。它体现出的趋势是——未来 AI 的竞争,除了模型参数和 benchmark,更是成本、生态和产业协同的竞争。

GPT-5.5来了

摘要

这篇文章围绕 OpenAI 新发布的 GPT-5.5 展开,核心想表达的不是“又更聪明了”这么简单,而是 OpenAI 试图证明:模型不仅可以更强,还可以更快。文章一开始就强调,这是一轮不同寻常的迭代——GPT-5.4 发布仅六周后,GPT-5.5 就已经推送给付费用户,节奏非常紧凑。

作者指出,GPT 系列长期以来面临一个行业悖论:模型越聪明,通常越慢、越贵。想获得更深的推理、更复杂的任务处理能力,就往往要接受更高的延迟和计算成本。GPT-5.5 的定位,就是试图打破这个默认取舍,在保持接近 GPT-5.4 推理延迟的同时,让智能水平再上一个台阶。

文章的核心判断是,OpenAI 这次不仅想证明“更聪明”,还想证明“更快”和“更强”可以同时成立。作者把 GPT-5.5 视为一次面向实际服务体验的升级,而不是单纯的参数炫技或 benchmark 冲榜。对于用户而言,这意味着更好的日常可用性;对于行业而言,这意味着模型迭代速度和产品体验可能再次被拉高。

文章还提到,目前不少体验反馈都认为 GPT-5.5 的综合表现很强,甚至让人感觉 OpenAI 可能在这一轮竞争中重新占到上风。整体来看,这篇内容是在强调一个信号:OpenAI 正在把竞争重点从单点“智力”扩展到速度、效率和服务体验的统一。

体会

这篇文章最值得关注的,不只是 GPT-5.5 本身,而是它背后的方向:大模型竞争正在从“谁更强”走向“谁能在可用延迟内更强”。如果这一方向持续成立,未来的胜负手可能不再只是模型能力上限,而是把高智能稳定交付给用户的能力。

一个散户自学量化

摘要

这篇文章记录了一位散户自学量化 20 个月的经历,核心不是“如何快速赚钱”,而是“量化如何重塑一个人理解市场的方式”。作者一开始也抱着很典型的散户幻想:学 Python、做机器学习、写策略,就能预测涨跌、稳定盈利。但在不断亏损和反复试错之后,他逐渐意识到,量化的重点不是写代码本身,而是从“猜涨跌”转向“算概率”,从绝对判断转向条件判断。

文章首先强调,散户常常只盯着单个信号、单只股票、某根 K 线,而量化思维要求先理解条件概率:一个现象在什么条件下才有意义?孤立事件本身通常没交易价值,真正有价值的是它背后的统计关系。作者认为,这种转变是量化学习中最重要的一步,因为它意味着你不再把“肯定”当成答案,而是开始接受市场中的不确定性。

接着,文章讨论了“写策略之前先学会怀疑自己”。作者发现,回测中的最优解并不一定能在实盘中兑现,原因包括滑点、手续费、执行问题、样本外失效等。量化并不是把公式算出来就结束,而是一个持续验证、不断修正、承认误差的过程。尤其到了期权和更复杂的衍生品阶段,变量更多,波动本身也会成为成本的一部分。

文章还提到,量化不仅仅是研究单只股票,而是要在更大的资产和组合维度上思考;同时,估算误差会越来越成为真正的瓶颈。也就是说,模型本身未必是最难的,难的是你如何正确估计参数、如何处理偏差、如何面对现实世界里的噪声和约束。

整体来看,这篇文章更像是一份普通投资者的量化学习笔记:它没有夸张的收益承诺,而是强调量化是一种认知升级——让人从凭感觉交易,转向用概率、验证和风险约束来理解市场。

体会

这篇文章最有价值的地方,是它把量化从“高薪职业幻想”拉回到“方法论训练”。对普通人来说,真正值得学的不是某个神奇策略,而是概率思维、怀疑精神、组合意识和对实盘约束的尊重。

两种身份

摘要

这篇文章围绕“知识”和“智慧”、“确定性”和“不确定性”展开,核心是在提醒读者:投资不应只依赖知识堆砌和概念化分析,而要承认未来的复杂性,并用更谦逊的方式面对概率和时间。

作者先从教育切入,指出教育的好处是获得知识,但坏处也可能只是停留在知识层面。知识更像地图,能帮助我们理解世界;但智慧更像地形本身,是真实世界中不断变化的结构。知识多的人,容易把地图误当成地形,把模型当成现实。

接着,文章把这个观点延伸到投资。作者认为,投资不是简单套用金融理论,也不是只谈阿尔法和贝塔;投资本质上是在面对看不见的众多人、不断变化的外部环境,以及未来可能出现的新变量时,做出的判断。未来并不是可以完全被地图化的对象,因为未来由时间、变化和不确定性共同构成。

文章强调,不确定性才是常态,而且是普遍、宏大、长期存在的;相对而言,确定性只是局部、微小、短暂的。作者用宇宙、星空、熵增等比喻来说明,人类虽然擅长处理眼前可见、结构清晰的问题,但面对更大的未来时,往往会暴露出直觉的局限。真正理解未来,需要更深层的思考能力,而不是单纯的直觉反应。

在自我认知上,作者更认同“偶尔聪明的愚蠢人”这一身份,而不是“偶尔愚蠢的聪明人”。前者承认自己的局限,知道真正重要的判断来自对不确定性的尊重;后者则更容易沉迷于知识与思辨的优越感,以为自己已经掌握了未来。

文章最后引用 Howard Marks 的话:“巴菲特一生 70 年靠 12 个想法挣了绝大部分的钱。芒格用了 4 个。”这句话进一步强化了文章的主旨:真正高质量的投资决策并不依赖频繁行动,而往往来自少数几次深思熟虑、抓住关键确定性的判断。

体会

这篇文章的重点不在于提供具体投资技巧,而在于重塑投资心态:少一点自信过度,多一点对不确定性的敬畏;少一点把知识当答案,多一点把知识当工具。

投资思考2026-04-24

地平线三把火

摘要

这篇文章围绕地平线在一次高密度发布会上推出的三项核心产品展开:星空芯片、咖咖虾操作系统、HSD V1.6 辅助驾驶系统。作者认为,这不是一次普通的产品发布,而是地平线在智能汽车时代完成关键拼图的重要节点,标志着它正从“芯片公司”向“整车智能底层构建者”转型。

文章首先聚焦于地平线的新芯片方案。此次发布的两款芯片 Starry 6P 和 Starry 6H,核心卖点是舱驾融合:把座舱与智能驾驶两套原本割裂的计算体系,尽可能整合到同一套架构中,以降低成本、减少延迟、提升资源利用率。作者指出,这个概念行业里喊了很多年,但真正做到量产落地并不容易,因为它必须同时解决安全隔离和算力共享之间的矛盾。

文章强调,舱驾融合最大的挑战在于汽车安全等级要求极高,尤其智驾部分要满足 ASIL-D 级别,而座舱系统又是高度开放、容易受第三方应用干扰的消费电子环境。如果两者跑在同一芯片上,如何保证座舱异常不会影响智驾安全,是所有厂商都必须跨过的门槛。地平线这次的方案,被作者视为在工程和量产层面迈出关键一步。

除了芯片,文章也提到地平线在操作系统和辅助驾驶上的完整布局。咖咖虾 OS 让其不再只是提供单点硬件能力,而是进一步进入整车系统层;HSD V1.6 则体现出地平线希望把硬件、系统和智驾能力打包成一整套可交付方案。换言之,地平线不再只是卖“算力”,而是在提供面向整车智能时代的系统级能力。

文章的整体判断是:地平线这次“三把火”意味着它正在从传统认知里的芯片供应商,升级为更完整的智能汽车基础设施玩家。对于行业来说,这种转变的意义不仅在于产品更多,而在于它代表了一种新的底层整合方向:未来竞争的关键,可能不只是单颗芯片的性能,而是谁能把芯片、系统和智驾能力更好地打通。

体会

这篇文章最值得关注的地方,是它把“舱驾融合”从概念拉到了更接近量产和系统落地的层面。对智能汽车行业来说,真正的门槛已经不是单点能力,而是系统级协同、量产可靠性和工程闭环能力。

现代化的悖论

摘要

这篇文章从房地产、人口结构、以色列政治和全球少子化等多个角度,讨论作者所说的“现代化悖论”:越现代化、越受教育、越追求个人自由的社会,往往越不愿意生育,最终会反过来改变社会结构和政治走向。

文章先从中国房地产切入,认为很多人只看到房子总量过剩,却忽略了住房供给的结构性稀缺。作者强调,大量农村房、小城镇房和老旧远郊住房在未来可能逐步失去价值,而真正有价值的,是一二线核心区、较新的、带电梯和车位的“好房子”。在这个意义上,普通人买房更适合作为改善生活的消费决策,而不是投资决策。

接着,文章把讨论扩展到全球少子化。作者认为,现代教育、女性独立、生活成本上升和个人主义价值观,共同推动了生育率下降。这种变化在中国、东亚、欧洲和中东都有体现,只是表现方式不同。文章特别以伊朗和以色列为例,试图说明宗教、教育、经济条件和人口结构如何共同决定一个社会的政治走向。

关于以色列,作者认为,真正改变政治路线的不是抽象意识形态,而是人口结构本身。随着更保守、更高生育率的群体在总人口中的占比上升,国家政治会越来越偏向强硬和民族主义,这种变化很难通过程序正义逆转。文章把这种现象视为“文明在绝育、野蛮在繁衍”的一部分证据。

文章最后把希望寄托在 AI 与科技进步上。作者认为,如果未来 AI 真能显著降低知识门槛、提升生产力,并推动更广泛的现代化,那么人类社会也许能进入更稳定的低生育均衡状态。但他同时承认,这个过程需要时间,而现实世界在等到那一天之前,可能会经历更长时间的冲突、撕裂和极化。

体会

这篇文章的核心不是单一议题,而是把房产、人口、宗教、现代性和技术进步串成一个大框架:现代化会带来自由,也会带来生育率下滑;生育率下滑会重塑政治;而技术也许是唯一能缓解这一悖论的长期变量。

百万上下文普惠时代

摘要

DeepSeek 发布了全新系列模型 DeepSeek-V4 的预览版,并同步开源。文章强调,这一代模型的最大亮点是“百万字级上下文”,意味着模型在处理超长文本、长链路任务和复杂 Agent 工作流时,能保持更强的记忆与理解能力。官方希望借此把百万上下文能力进一步普惠化,让更多用户和开发者可以直接使用。

文章把 DeepSeek-V4 分成两个版本:V4-ProV4-Flash。其中,V4-Pro 面向更高质量任务,重点强调推理、知识和 Agent 能力;V4-Flash 则主打更快、更经济,适合高频调用和成本敏感场景。两者都支持 1M 上下文,并可通过官网 App、chat.deepseek.com 以及 API 方式调用。

在能力表现上,V4-Pro 被描述为在 Agent 能力上有显著增强,尤其是在 Agentic Coding 场景中表现突出,已经接近或超过多款主流闭源模型的部分非思考模式体验。文章还强调,它在世界知识和推理方面也取得了较强成绩:在知识测评上大幅领先其他开源模型;在数学、STEM 和竞赛代码等任务上,则达到了比肩顶级闭源模型的水平。

对普通用户来说,这篇文章传递出的信号很直接:DeepSeek 希望把“超长上下文 + 强推理 + 强 Agent”组合,做成一个可以实际落地的大模型能力栈。V4-Pro 适合追求效果的复杂任务,V4-Flash 更适合强调速度、性价比和批量使用的场景。对于开发者而言,API 的 model_name 也已经更新,可以直接切换到对应型号进行调用。

体会

这篇发布信息最值得注意的,不只是模型性能数字本身,而是 DeepSeek 明确把“百万上下文”从实验性能力推进到了可使用、可调用、可普及的产品阶段。未来如果长文档理解、代码仓库级别 Agent、跨文档推理等场景进一步成熟,这类模型可能会显著改变大模型应用的工作方式。

A8到A9有多难

这篇文章围绕“A8 到 A9要花多长时间”展开,A8、A9可以理解为个人资产从千万级继续迈向亿元级的过程。文章并没有提供一套统一答案,而是通过几位投资者的真实经历和评论,说明从 A8 到 A9 往往比从 A7 到 A8 更难。

开篇作者先讲了自己的经历:从大学入市一路走到 A8,期间经历过牛市、股灾、踩坑、重仓、止盈、回撤和重建认知。文章中不断出现的关键点是“运气”和“研究”的交替作用:有些阶段靠上了周期、有些阶段靠上了题材、有些阶段则因为对公司和行业有较深研究而赚到钱。但即便如此,作者也承认,A8 之后自己的投资思路越来越保守,开始担心大回撤,甚至对“从 A8 再往 A9 走”没有特别清晰的想法。

文章接着引用了多位集思录网友的观点,进一步解释为什么 A8 到 A9 这么难。一个核心观点是:从百万到千万的路径很多,靠工资、房产、创业、投资,甚至运气都可能实现;但从千万到亿元,能走通的路径就少得多,基本只剩投资和创业两条。也就是说,财富规模越往上,越不是“慢慢攒”能解决的,而更依赖于少数几次大的机会、足够高的认知,以及敢于承担波动的能力。

另一层意思是,资产规模越大,心理结构会发生变化。很多人从 A7 到 A8 之后,风格会变得越来越保守,开始配置红利、低波、可转债、摊大饼,追求稳健而不是激进。这样做的结果是:虽然更不容易回撤,但想再跨一级也会越来越难。换句话说,过去帮助你从 A7 到 A8 的进攻型策略,往往并不适合继续通往 A9;而如果为了 A9 去重新加大风险,又可能把已有成果打回去。

文章还提到,高净值和超高净值家庭的构成差异:千万级家庭里,金领、职业股民、不动产投资者都有一定比例;但亿元级家庭里,企业主占比显著更高。这也说明,财富上一个台阶之后,光靠稳定工资和普通投资积累,往往很难继续往上走。

整篇文章的结论是比较克制的:A8 到 A9 不是一个线性增长问题,而是一个需要认知、机遇、杠杆和心理承受力同时到位的问题。对很多人来说,最重要的也许不是执着于“再多一个零”,而是先把现有财富和生活稳住,再决定要不要为更高一级的目标继续冒险。

GARCH模型漫谈:离捕捉市场波动,我们还差什么?

这篇文章围绕 GARCH 模型在量化风控中的局限展开,核心问题是:为什么很多时候模型在样本内表现正常,但一遇到剧烈波动,真实亏损仍会大幅超出预测?

文章首先从“波动率聚集”讲起:市场经常呈现大波动跟着大波动、平静跟着平静的特征,因此 ARCH/GARCH 这类条件异方差模型成为描述波动动态的重要工具。它们相比固定波动率模型更贴近现实,也因此长期被用于 VaR 估计和风险管理。但作者指出,GARCH 主要解决的是“波动随时间变化”的问题,并没有真正解决收益率的肥尾问题。即便把分布改成更厚尾的学生 t 分布,极端行情下的损失仍经常超出模型给出的风险边界。

接着文章把矛头对准“标准化残差”的隐含假设。理论上,标准化残差应该用真实波动率来除,但实际计算时只能用模型估计的波动率,这里面同时包含模型设定误差和参数估计误差。于是,当真实波动率快速上升或下降时,估计值往往滞后,导致标准化残差的分布被“污染”:在波动骤升时,普通下跌会被模型误判为极端事件;在波动骤降时,真正的风险又可能被低估成小波动。作者认为,这正是很多 VaR 回测失败的重要隐藏原因。

为了进一步刻画尾部风险,文章讨论了极值理论(EVT)的用法:先用 GARCH 过滤出标准化残差,再对尾部超额损失用广义帕累托分布(GPD)建模。然而,这套方法也有明显问题。首先是阈值怎么选:阈值太低会把非尾部样本混进来,太高又会让样本过少、估计不稳。其次,GPD 的形状参数在小样本滚动窗口里经常剧烈波动,难以判断究竟是尾巴变厚了,还是只是样本噪声。作者因此建议把极值理论更多当作稳健性检验,而不是唯一的精确答案。

文章随后讨论贝叶斯收缩。它可以把局部估计往长期均值上拉,降低参数抖动,但新的问题是先验怎么选、先验窗口多长、先验是否本身也是时变的。尤其在局部样本很短时,后验结果高度依赖人为设定,主观性并不比阈值选择更少。作者因此倾向于把贝叶斯收缩当作辅助检验,而不是最终结论,并建议与滚动历史分位数等更朴素的方法交叉验证。

在期权数据部分,文章引入了“波动率偏斜”这一视角。尾部风险升高时,价外看跌期权隐含波动率往往高于看涨期权,偏斜能反映市场对尾部风险的即时定价。但作者提醒,这个信号的回归关系很不稳定,日内噪声也很大,难以直接作为精确输入。更可行的方式是把它作为辅助预警:当偏斜超过历史高分位时,适当上调 ES 估计;若没有高质量期权数据,也可以用历史已实现波动率的偏度做交叉参考。

最后文章回到金融建模的根本限制:从巴舍利耶的正态随机漫步,到曼德勃罗的厚尾,再到 GARCH、极值理论和波动率微笑,模型一直在修正旧框架,却始终无法彻底预测极端状态。作者强调,所有基于历史数据的 VaR/ES 模型都有一个共同前提——历史会以某种连续方式重复。但当出现极端流动性枯竭或历史上未曾出现的新状态时,模型会整体失效。因此,除了统计模型,策略还应该设置一条不依赖回测证明的硬性风控线,确保在未知状态来临时仍能存活。

文章的落点也很明确:与其执着于寻找一个“终极更优”的风险模型,不如承认预测的边界,把更多精力放在准备与防守上。

中国最大的大模型套壳创业者

这篇文章讲的是 Cherry Studio 创始人王新铭(Yinsen)的创业经历,以及他为什么不介意把自己定义成“套壳”创业者。文章的核心观点是:在大模型能力由底层算力、数据和生态决定的前提下,真正重要的并不是谁能“发明模型”,而是谁能把模型能力转化成普通人可用的真实生产力。

文章先介绍了 Yinsen 的背景:他 1990 年生于山东临沂,早年经历过邮局柜台、PPTV、喜马拉雅、字节、依图、黑鲨等多段职业路径,最终在 2024 年开始创业 Cherry Studio。Cherry Studio 一开始就是从“套壳”大模型出发,做一个把多家模型 API 接进来的 Chatbot / AI Workspace。作者强调,Yinsen 并不认为“套壳”是贬义词,相反,这代表了一种极强的产品化能力:当底层模型本身已经足够强时,真正创造价值的是如何把能力组织起来、让用户高效使用。

文章大量描写了 Cherry Studio 的创业细节:早期办公室在上海嘉定南翔,一个老厂房里几十平米的空间,租金很低,椅子不够还得拿露营椅凑数;团队里除了创始人和合伙人,还有一些研究生开发者,Yinsen 甚至会给他们报销模型订阅费和外卖费,以此提高迭代速度。团队最初的扩张也不是靠大规模销售,而是靠“超级个体”自传播——那些需要 AI 工具维持专业度和生产力的人,会成为自然的使用者和推广者。

文章还回顾了 Yinsen 的前职业经历,尤其是他在邮局工作的阶段。他原本可能会走一条更传统、更稳定的道路,但一部 2011 年买的小米手机改变了他:他在手机上安装各种应用、给开发者提建议,逐渐被互联网公司注意到,人生轨迹也随之转向。后来他在依图科技接触到上一代 AI,更清楚地看到那种以监控识别为核心的 AI 和当下“大模型 + 工具”方向的差别:前者偏管理和结构化,后者更接近解放生产力、让普通人变强。

文章也讨论了他对行业的判断。Yinsen 认为,Claude Code 的出现标志着 Agent 进入了“原生时代”,也说明原生工具与底层生态深度集成的重要性;同时他不太认同一些团队声称做出“比 Claude Code 更强 Agent”的说法,认为这是违背技术演进常识的幻觉。作者把这种态度总结为一种“弱者思维”的技术信仰:不去给 AI 架拐棍,而是做一个能随水位上涨的小木板,让工具本身成为生产力的一部分。

最后,文章把 Yinsen 归为那种“不太会讲给 VC 听,但很会讲给人听”的创始人。他的创业故事里有很多现实细节、职业转折和个人感受,形成了一种更像“to human”的叙事。整篇文章的结论很清楚:大模型时代真正值钱的,未必是模型本身,而是把模型能力产品化、工具化、生态化的那一层。

什么行为创造财富

这篇文章用一个偏理论化的模型,讨论“什么行为创造财富”。作者先把财富分成两类:物质财富和金融财富,并强调金融财富本质上是对物质财富的索取权,因此金融财富必须建立在物质财富之上,不能脱离实体生产独立存在。

文章通过一个“买房—分拆索取权—交易定价”的极端模型来说明这一点。假设小红用贷款买下一套房子,这一行为本身并没有改变房子的物理属性,但房子被赋予了金融价值;如果再把这套房子的未来收益索取权切分成许多份,市场参与者不断交易这些凭证,那么房子的名义市值就可能在货币扩张与交易博弈中被不断抬高。作者想说明的是:房子的物质属性没有变,变化的是围绕它的索取权定价。

在这个基础上,文章进一步把同样的逻辑推广到企业:企业的价值,本质上也可以拆分成两个层面——一是企业实际创造物质财富的能力,比如制造汽车、芯片或其他产品的能力;二是这种创造能力对应的索取权在金融市场上的定价。前者由技术、组织和生产能力决定,后者则强烈依赖边际交易者的认知、预期和资金条件。换句话说,企业的“实际财富创造能力”和其“市值”并不完全同质,二者可以相互关联,但不能混为一谈。

作者最后给出两个结论:第一,生产行为本身会创造财富;第二,对物质财富索取权凭证的交易,有时也可能促进财富创造,因为它能帮助组织资源、扩张产能,但索取权凭证的价格不能简单等同于物质财富本身。文章还推导出一个更激进的推论:如果未来实体生产路径清晰、并且货币与信贷持续扩张,那么某些资产的名义价格就可能不断加零。整体上,这是一篇偏宏观思辨的文章,核心在于区分“真实财富”与“金融定价”,提醒读者不要把市值直接当成生产本身。

国信券商与瑞金证券

这篇文章是一篇围绕国信证券、金融工程团队与“瑞金证券”构想展开的回忆与访谈整理。作者以播客访谈为线索,讲述了国信证券金工团队从无到有、从被质疑到成为行业标杆的历程,也补全了其对国信企业文化与组织理念的观察。

文章开头先回顾了中国卖方研究的发展背景:在基本面研究已经成为主流的年代,金融工程仍是冷门领域。国信证券在较早时期就开始布局金工,2005 年葛新元以个人名义拿下新财富金工第一,随后在 2009 年重建金工研究团队,并迅速在 2010 年冲到新财富第一。作者通过董艺婷的回忆说明,当时金工卖方的处境并不轻松:路演对象少、买方不理解、很多人甚至会直接质疑“如果这个东西能用,那还要我干嘛”。但也正是这种“先被怀疑、后被接受”的过程,让金工逐渐展示出技术输出能力,比如定制指数、算法交易系统等,成为券商研究中少见的“技术供应商”式存在。

文章接着把视角转向国信的管理文化,重点落在胡继之身上。作者通过多位老员工的回忆,描写胡继之在招聘、路演、管理上的细节:他敢于用高薪招揽优秀分析师,把这视作公司形象与人才战略的广告;他在陪同路演时会提前到场、整理领带、做笔记、给分析师反馈,表现出对专业的尊重和对细节的重视。作者由此提出,一个券商的文化并不抽象,而是由一代代从业者对公司细节的共同记忆构成。

文章后半部分进入最重要的主题:瑞金证券的设想。作者提到,2020 年曾有关于胡继之筹建瑞金证券的报道,当时自己并不以为然,认为这个构想过于理想化,且与行业现实趋势不符。直到与董艺婷深入交流后,他才发现自己低估了这件事。董艺婷拿出了当年筹备团队保存的架构图与 PPT,介绍了瑞金证券背后的三个“遗憾”:一是优秀员工离开公司,没能成为更紧密的利益共同体;二是现有组织架构无法充分计量一个人跨前台、中台、后台的综合贡献;三是券商往往只服务了客户的某一个环节,而没有把客户视作完整主体去提供全方位金融服务。瑞金证券的设计,正是希望通过更扁平、合伙人化、轨道并行的组织形式,去弥补这些遗憾。

但作者最终仍然认为,瑞金证券几乎不可能在现实中落地。不是因为设计不够先进,而是因为董事会、合规、监管、组织惯性等现实障碍太大。它在理念上非常前瞻,但在当时乃至可预见的未来,都难以真正成形。尽管如此,作者并没有把这当作失败,而是将其理解为一种理想主义的尝试:旧模式终将走到尽头,而改变往往总是由理想主义者推动。

文章最后回到更广泛的行业与人生主题。作者认为,自己以后或许不会再继续写国信证券的历史,因为“瑞金证券”这条故事线已经足够补全他对国信文化的理解。更进一步,文章也借这一段券商史提醒读者:行业发展并不只由制度和趋势决定,同样由具体的人、具体的坚持、具体的记忆构成。国信证券的“文化”,就在这些细节里被一代代人传承下来。

确定的乐观主义

这篇文章围绕彼得·蒂尔的“确定的乐观主义”展开,核心是在讨论人应该如何理解未来、如何安排自己的行动,以及“把每一天当作最后一天”与“把每一天当作永远”这两种时间观的区别。

文章先从乔布斯和彼得·蒂尔的两种说法切入。乔布斯强调把每天都当成生命中的最后一天来过,而蒂尔则反过来主张:应该把每一天都当作会永远持续下去来过。作者认为,这反映出蒂尔哲学中的核心概念——“确定的乐观主义”。在这个框架下,未来不是被动等待的结果,而是可以通过明确设计和长期执行主动塑造的对象。

文章进一步用一个“四象限”模型来解释人们对未来的态度:确定的乐观主义、 不确定的乐观主义、 确定的悲观主义、 不确定的悲观主义。作者解释说,蒂尔批判的主要对象是不确定的乐观主义,也就是“未来会更好,但我不知道怎么让它更好,所以保持灵活、分散、等待机会”的思维方式。在他看来,这种心态对应的是金融化时代:人们更习惯做资产重组、做多样化、做期权思维,而不是去真正创造新事物。

与之相对,确定的乐观主义则意味着相信未来会更好,并且相信自己知道如何让它变好。它强调的是“设计”而不是“运气”,强调长期工程、发明创造和高度聚焦。文章列举了阿波罗计划、州际公路系统、iPhone、火箭等例子,说明这种世界观下的人更倾向于 build,而不是 bet。蒂尔还反对过度分散和所谓的“多元化”,认为那只是无知的保护伞;如果你真的知道哪里有潜力,就应该 All-in,而不是东碰一点、西沾一点。

文章也提到蒂尔对“精益创业”的批评。蒂尔认为,过度依赖 MVP 和快速试错,反而说明创业者缺乏对未来的清晰信念;真正的确定性乐观主义者应该有更明确的愿景,并花时间把它扎实地实现出来,而不是被市场反馈牵着走。作者对此也做了补充说明:蒂尔强调的是一种积极的态度,但并不意味着抛弃概率和分析,而是要在明确目标之上使用工具。

最后,文章把这一切和“把每一天当作永远”联系起来,认为这其实是一种对长期主义的时间观表达:如果你相信未来仍然会持续,就不会把人生过成短期消费,而会更认真地设计自己的路径、项目和关系。整篇文章的结论是:真正的乐观不是盲目乐观,而是知道自己想去哪里,并愿意为那个未来持续投入。

连续扩散文本新突破

这篇文章介绍了 UIUC 团队提出的 LangFlow,核心目标是让连续扩散模型在文本生成上真正接近甚至追平当前最强的离散扩散模型。作者认为,过去连续扩散在语言建模里一直“打不过”离散扩散,根本原因不只是模型结构本身,而是理论、实现和技巧三个层面都存在缺口。

首先是理论层面。文章指出,之前的连续扩散语言模型在训练、采样和评估之间并不自洽:训练目标常常与流场学习没有严格对齐,评估困惑度时又依赖较弱的随机下界,导致研究者甚至难以判断模型优化到底有没有变好。LangFlow 通过 Bregman 散度把离散 token 的交叉熵损失与连续流匹配统一起来,并进一步推导出基于 ODE 的负对数似然上界,使训练、采样和评估能够放在同一个理论框架中,从而解决“训练和采样两张皮”的问题。

其次是实现层面。过去的连续扩散在语言任务上常常直接照搬图像扩散的经验,使用均匀的时间噪声调度,但作者发现这在语言任务中效率极低:大量中低噪声区间几乎没有学习价值,模型很容易就能预测正确 token。LangFlow 因此改用对数噪信比(logNSR)作为条件变量,并提出信息均匀原则,让每一个训练步都尽量承载等量信息。作者还用 Gumbel 分布来设计可学习的噪声调度器,把原本浪费在低价值区间的算力重新分配到更关键的高信息区域。这个改动显著降低了生成困惑度。

第三是技巧层面。文章重点讨论了 self-conditioning 在连续扩散中的作用。此前很多研究延续了离散扩散的习惯:在评估 PPL 时关闭 self-conditioning,因为离散扩散里它常常存在“生成变好、似然变差”的权衡。但 LangFlow 通过实验发现,连续扩散中 self-conditioning 没有这种 trade-off,反而会同时提升生成质量和似然表现。因此它在训练中以一定概率开启 self-conditioning,并在评估和采样时全程启用,从而进一步压低 PPL 和 Gen.PPL。

实验结果上,LangFlow 在 130M 参数的设置下取得了很强的竞争力,在 LM1B 等基准上首次让连续扩散在核心指标上追平甚至超过了最强离散扩散模型。文章也提醒,当前结果仍有边界:模型规模还不大,长上下文和工业级场景是否成立仍待验证;而连续扩散是否真有离散模型无法替代的独特优势,也还没有被完全证明。

总体来看,这篇文章的结论很明确:LangFlow 让连续扩散在文本建模上第一次真正建立了统一、可比、可优化的理论与工程框架,说明连续扩散并非天然不适合语言任务,只是过去的方法还没把关键环节补齐。

2019年,这件事,对我来说最重要

这篇文章的主题是“与自己和解”。作者以 2019 年跨年为契机,回顾自己从年轻时的锋芒、执拗与理想主义,逐渐走向成熟、克制和自我接纳的过程。文章并不只是讲个人感悟,也借此梳理了“发现世界—改变世界—与自己和解”这三重人生境界。

核心观点

1. 人生可以分成三重境界

作者借王国维的“三重境界”与高晓松的说法,提出自己对人生的理解:
  • 第一重:发现世界,追求“事实”
  • 第二重:改变世界,追求“态度”
  • 第三重:与自己和解,学会“放下”

他认为,年轻人往往停留在前两层,越到后来越会发现,第三重才是真正的成熟。

2. 成熟不是更强硬,而是更能接受不完美

文章反复强调,世界本来就不完美,人也一样不完美。真正成熟的人,不是非要把一切改造成自己想要的样子,而是承认自己的有限,接受自己的软弱与无知。

3. 见得越多,越能理解他人的局限

作者通过刘德华、马化腾、罗振宇、甚至普通人的生活习惯与认知差异,说明一个道理:你以为的“常识”,对别人可能根本不是常识。世界的真实面貌远比精英视角复杂得多。

4. “与自己和解”也意味着放下不切实际的宏愿

作者坦言,自己早年希望“带领亿万理财小白走向财务自由”,后来意识到这是妄念。人群分布、能力边界、社会现实都决定了,不可能靠一个人改变所有人的命运。对他来说,和解就是承认这一点。

5. 未来的重心是做自己真正擅长的事

2019 年他准备把工作重心收缩到少数几件事:写书、完善定投策略、做好会员服务、推进理财训练营,同时更多旅行,去看更真实的中国。他认为,这样才能持续接近“事实”,而不是沉迷于虚幻的自我想象。

总结

这是一篇很典型的年度自省文章。它讲的不是激烈的成功学,而是一个人在经历了表达、扩张、尝试改变世界之后,如何慢慢学会承认边界、接纳自己、并与现实和解。文章最后落在一句非常朴素的话上:与自己和解,接受不完美,才是最重要的人生智慧。