← 所有标签

# 微信文章

Jane Street赚钱逻辑

这篇文章介绍了全球最神秘、也最赚钱的交易机构之一 Jane Street,重点解释它为什么能在 2025 年创下极高的交易利润,以及它的赚钱方式为何让普通投资者既依赖又不安。

文章首先梳理了 Jane Street 的背景:它成立于 1999 年,总部在纽约,规模只有约 3500 名员工,却凭借做市与量化交易在 2025 年实现了 390 亿美元级别的交易利润。它低调到几乎不公开接受采访,也没有典型华尔街公司的强层级结构,而是强调扁平化组织和极强的技术文化。

作者指出,Jane Street 的核心业务是做市商:在买卖双方之间提供报价、撮合成交,并通过极小的价差盈利。单笔利润微薄,但在超高频、超大规模的交易中会被放大成惊人的收益。其优势主要来自两点:一是早早切入 ETF 做市,建立了长期技术壁垒;二是依赖数学建模与速度,在多个市场之间寻找瞬时价格偏差并完成套利。

文章还强调,Jane Street 的招聘与华尔街传统金融机构很不一样,更看重数学、逻辑和概率思维,甚至会通过扑克等方式测试候选人的决策能力。它的内部文化也与交易逻辑高度一致:重视在不完整信息下做概率判断,而不是传统意义上的金融经验。

与此同时,文章也讨论了监管和争议。2008 年金融危机后,传统银行受监管限制退出部分自营与做市空间,Jane Street 趁机扩张;但随着它在印度、欧洲乃至中国等市场的影响力扩大,围绕“做市与操纵的边界”也出现了更多质疑。文章认为,Jane Street 的成功说明市场需要流动性,但其盈利模式本身也建立在信息和速度优势之上,因此天然带有争议。

最后,作者总结,Jane Street 不只是一个赚钱很强的交易机构,更像是一套把数学、技术、资本和组织方式结合到极致的市场机器。它既是现代金融效率的代表,也折射出当代市场中普通投资者、机构与监管之间越来越复杂的关系。

佛教能取代儒家吗

文章围绕一个历史假设展开:如果儒家主导的“家国同构”秩序失灵,佛教有没有可能在中国取代儒家,成为新的国家意识形态。

作者认为,佛教在中国历史上影响极深,尤其在魏晋南北朝到隋唐时期,曾经扩张到社会生活、思想文化与政治象征的多个层面,但它的核心关切仍是“解脱”而非“组织社会”。佛教可以安顿人心、解释苦难、塑造慈悲伦理,也能为王权提供神圣性,却很难直接承担税赋、兵役、基层治理、家族秩序和官僚行政这些国家运转所必需的功能。

文章提出,若儒家整合能力崩塌,最可能出现的不是一个完整的佛教国家,而是三种不同走向:

  1. 宗教化的碎片秩序:寺院网络扩张,承担救济、超度、地方整合与精神安顿功能,但社会整体会变得更碎片化。
  2. 政教合一的佛教王权:在强王权与制度改造条件具备时,佛教可能成为王权合法性资源,形成类似佛教护法王的国家形态,但条件极苛刻。
  3. 新的世俗组织原则:从更长时段看,真正取代传统秩序的往往不是另一种宗教,而是现代民族国家、法律、学校、市场与政党等制度化组织原则。

文章进一步解释了为什么真实历史没有走向“佛教国家”,而是走向宋明理学:理学并未简单排斥佛教,而是吸收佛教的心性修养技术,把“明心见性”“去执”“内在觉悟”等资源重新安放回儒家的家国伦理中,使佛教的出世方向被改造为入世修身的工具。这样,佛教被消化为儒家的一部分,而不是成为国家底座。

最后,作者总结说,一种思想要成为国家意识形态,不能只看精神深度,还要看它能否组织社会。儒家的优势在于把家庭、教育、官僚、伦理和政治连成系统;佛教更擅长安顿心灵;现代性则提供了新的社会组织方式。文章借这个思想实验强调,文明之间真正的竞争,表面上是教义之争,深处其实是“谁能组织社会”的竞争。

有限性如何生出意识

这篇文章围绕“意识从何而来”展开,提出一个核心观点:意识并不是大脑“无所不能”时自然产生的结果,而恰恰诞生于认知资源的有限性。作者认为,正因为人脑无法把外部世界完整复制到内部,才必须通过选择、压缩、整合与建模,构造出一个带有个人偏好的“主观世界”。

文章首先强调,意识的起点是主观性。所谓主观性,不只是“每个人感觉不同”,而是每个主体都通过自己独特的方式体验世界。作者把这种主观体验理解为一种内部要素彼此约束、动态耦合的复杂系统:大脑并不是模块简单堆叠,而是在神经振荡、前馈—反馈回路、跨区域同步等机制中形成一个持续自洽的整体。只有这种“统一视角”存在,主体感才可能出现。

接着,文章提出更反直觉的判断:主观意识的根源不在于认知资源充足,而在于资源不足。因为资源有限,大脑必须做选择、分层、抽象和重构,不能无差别地处理一切输入;也正因为如此,系统才会形成内部模型、先验偏好和结构化解释。若一个系统真的能毫无成本地理解和处理全部信息,它反而不需要选择,也就难以形成我们熟悉的“意识体验”。

文章还进一步解释了为什么不同的人会有不同的主观体验。作者认为,差异不仅来自基因和环境,也来自大脑作为复杂系统的动态特性:微小的初始差异会被不断放大,不同个体会在相同输入下生成不同的内部模型。意识因此不是被动接收现实,而是在有限资源中主动建构一个“主观宫殿”。

在理论层面,文章把这一观点与整合信息理论(IIT)、全局工作空间理论(GNW)以及预测加工/生成模型等主流意识理论联系起来,认为这些理论虽然路径不同,但都强调了一个共同点:意识依赖于信息整合、动态耦合和主动建构,而不是单纯的信息堆积。

文章最后指出,现代社会的信息过载会进一步强化这种有限性困境:信息越多,主体越需要依靠模型和筛选来维持自我;而如果认知系统被技术彻底增强到接近“全知”,主体感反而可能减弱。作者因此总结,意识是有限性、复杂性与建构性共同作用的结果——它不是“全能”的副产品,而是在限制中闪耀出来的主观光芒。

看不见的腾讯

这篇文章从“看不见的腾讯”切入,重点分析腾讯真正重要却常被忽略的一面:其庞大的投资组合,以及这张万亿级资产负债表如何重塑公司的长期战略。

文章指出,外界往往更关注腾讯的微信、游戏、广告等显性业务,但腾讯 2025 年报中的投资组合账面价值已接近万亿,在总资产中占比接近一半。对腾讯来说,投资不只是财务回报工具,更承担着战略防御、业务赋能和生态卡位等多重作用,是理解腾讯的关键维度之一。

作者将腾讯股权投资的演进分为三个阶段:

  1. 2011—2018 年的移动互联网扩张期:腾讯通过流量与资本双轮驱动,重仓京东、美团、拼多多、富途等项目,既获得高额财务回报,也放大了微信支付等生态能力。
  2. 2019—2023 年的收缩与兑现期:在反垄断和行业红利见顶背景下,腾讯开始减持部分非核心资产,转向更聚焦的投资策略。
  3. 2024 年至今的 AI 与硬科技转向期:腾讯开始明显向大模型、算力、芯片、先进制造、创新药等方向倾斜,试图为下一代技术周期布局。

文章还通过多个案例说明腾讯投资的打法:它倾向于长期持有、深度协同、精选标的,而不是短期投机。无论是京东、美团、富途,还是燧原科技、智谱、MiniMax、摩尔线程等项目,腾讯都在用资本结合场景、云服务和生态资源,强化自身在产业链中的位置。对于一些项目,腾讯获得了极高回报;对于少数项目,也会出现浮亏,但整体成功率相当高。

最后,文章总结称,腾讯的投资版图更像是公司的“战略雷达”和“未来保险单”。在互联网红利逐渐见顶、AI 竞争重新加速的时代,这张看不见的投资清单,正在悄悄决定腾讯还能走多远、下一轮增长从哪里来。

DeepMind CEO谈AI健康

这篇访谈围绕 Google DeepMind CEO Demis Hassabis 对 AI 未来用途的看法展开,核心观点是:AI 最有价值的方向不是简单的聊天或生成内容,而是帮助人类理解现实世界,并优先改善健康、科学和医学。

文章首先回顾了 Hassabis 对 AlphaFold 的思考路径。早在本科时期,他就对蛋白质折叠问题着迷,因为蛋白质的三维结构决定功能,而传统实验方法既慢又贵。AlphaFold 的突破在于,它把原本需要几十万美元、耗费多年才能得到的结构预测,压缩到几秒钟完成,并且可以把大量已知蛋白结构免费开放给全球科学家使用。作者强调,这使得 AlphaFold 不只是一个模型,而是一次彻底改变科研流程的基础设施升级。

接着,访谈讨论了 AlphaFold 在科研中的具体价值。它帮助研究者更快理解蛋白结构、探索药物靶点,也让研究冷门物种、植物、疟疾、查加斯病等“低商业回报”疾病的团队拥有了更好的工具。Hassabis 认为,AI 应该先解决这些能显著改善人类健康和基础科学的问题,而不是等到所谓的 AGI 完全成熟后才开始发挥作用。

文章随后转向药物发现。Hassabis 认为,知道蛋白结构只是第一步,真正的目标是把 AI 用在药物设计、分子筛选和副作用预测上。DeepMind 及其孵化公司 Isomorphic Labs 正在构建一整套相邻系统,尝试在计算机中完成尽可能多的药物发现流程:设计候选化合物、预测它们与目标蛋白的结合强度、快速检查是否会误伤其他蛋白,再把最有希望的结果送入湿实验室验证。这样的流程有望把现在动辄十年的药物研发周期大幅缩短。

文章还介绍了 AlphaGenome 的意义。它试图解码基因组中大量不编码蛋白质的区域,尤其是帮助识别哪些突变会导致疾病。Hassabis 认为,未来 AI 可能能更准确地指出疾病的关键突变,再和 CRISPR 这类基因编辑技术结合,直接修复问题位点,从而为遗传病治疗打开新路径。

最后,文章讨论了 AI 发展节奏的变化。Hassabis 承认,如果按他的个人意愿,他希望把 AI 更长时间留在实验室里,优先做科学和医学方向的工作;但现实中,ChatGPT 之后的产业竞争显著加速了 AI 的公众化和产品化。他认为自己始终最关心的仍然是“用 AI 理解世界”,而他希望这份技术力量最终能被用于科学发现、疾病治疗和人类认知边界的拓展。

英伟达想革光模块的命

这篇文章围绕“英伟达为什么想改造光模块产业链”展开,核心是在解释 AI 数据中心互连需求、光模块的作用,以及英伟达推动 CPO(光电共封装)背后的产业影响。

文章先从中际旭创、新易盛、天孚通信等光模块龙头的高景气写起,说明在 AI 数据中心建设和资本开支持续扩张的背景下,光模块行业一度成为市场焦点。随后作者解释了数据中心内部通信为何重要:GPU 需要通过服务器、机柜、交换机等多个层级互联,才能把算力组织起来,而光模块正是把电信号转换为光信号、支撑长距离高速传输的关键器件。

接着,文章比较了铜缆与光缆的特点:铜缆便宜、低延迟,但距离受限;光纤能传得更远、功耗更低,但需要额外的光模块完成“翻译”。随着 GPU 集群规模变大、传输速率提升到 800G、1.6T,光模块的功耗和系统复杂度也越来越高,行业逐渐暴露出“中间环节太多”的问题。

英伟达的思路是把光模块拆解重组,推动 CPO 技术落地:把光引擎等器件直接放到交换机芯片甚至 GPU 附近,缩短电/光转换路径,降低功耗,并提升对整个系统的控制力。文章指出,英伟达与台积电在先进封装上的合作,以及后续在交换机、机架级系统中的布局,都说明它并不满足于只卖芯片,而是想进一步掌控“计算系统”的整体形态。

文章也重点分析了这一变化对中国光模块厂商的冲击。当前中国企业在光模块“系统集成”环节占据很强地位,但 CPO 如果普及,最先被削弱的恰恰是这类集成型价值;而高端激光器、探测器、DSP/AFE 等核心器件主要仍掌握在美日厂商手中。换句话说,CPO 可能会把产业链利润进一步向上游核心器件和大客户集中,挤压中国厂商擅长的中间层。

最后,文章认为短期内 CPO 仍受成本、工艺和量产节奏限制,光模块行业不会立刻被颠覆,但中长期看,英伟达、台积电、博通等玩家正在重新定义数据中心互连的技术路线,光模块行业的竞争格局也因此面临重塑。

多样性与灭绝

这篇文章围绕彼得·沃德的“稀有地球”观点展开,核心议题是:复杂生命为什么如此罕见,而多样性又如何帮助生命规避灭绝。文章先从寒武纪爆发切入,指出动物在极短时间内突然出现大量新的形体构型,这与“缓慢渐变”的传统印象并不一致,也让达尔文式演化面临化石记录上的难题。

随后,文章把“集群灭绝”作为理解生命演化的关键变量来讨论。作者强调,地球历史上多次大灭绝事件会重置生态系统,让旧有优势类群退场,为新类群腾出空间;但从更宏观的角度看,灭绝总体上对生物多样性是净损失,而不是天然的进步机制。尤其在寒武纪这类复杂生命刚起步的阶段,环境条件的微小变化都可能造成整个类型或“门”的消失。

文章的一个重要结论是:复杂性本身会增加脆弱性。简单生物往往能更长久地存活,细菌和古菌几乎不需要显著改变形体就能适应环境;相对而言,复杂后生动物的演化寿命更短,灭绝风险更高。作者据此认为,生物要对抗灭绝,关键不在于不断变复杂,而在于提高多样性——也就是在一个高等分类群内部发展出足够多的物种和形体储备。

文章最后把这一逻辑归结为一句话:多样性是对抗灭绝的最好方法。一个类群如果拥有足够多的物种,即使局部遭遇灾难,也更有可能凭借少数幸存者重新扩散、恢复生态位。换句话说,生命不是靠单一“最强者”赢得未来,而是靠广泛而分散的多样化储备,来穿越一次次随机而残酷的环境冲击。

心理降噪,这个时代投资人最稀缺的能力

文章从美伊冲突引发的市场噪音切入,讨论在高不确定性环境下,投资人最稀缺的能力并不是获取更多信息,而是“心理降噪”。作者指出,当地缘政治、油价波动和客户情绪同时涌来时,投资管理人往往会把恐惧、焦虑和自我防御误当成判断本身,真正需要处理的是心理噪音压过了判断力的问题。

为说明这一点,文章回顾了精神分析学家亚伦·斯特恩进入老虎基金的故事。斯特恩把心理学和临床观察带进对冲基金,不只是帮助投资人管理情绪,更重要的是识别“用感受替代现实判断”的防御机制。朱利安·罗伯逊请他设计选人体系,最终形成了一套长达 450 题的测评,重点不是智商,而是外向的竞争性、通才能力,以及在压力下仍能与现实保持连接的能力。

文章还通过老虎基金的兴衰说明,正确的宏观判断并不总能转化为结果:罗伯逊对科技泡沫的判断大体正确,但管理规模仍在委托人赎回中急剧缩水,最终基金关闭。这个案例强调,职业投资人的难点不只是看对市场,还要承受客户的焦虑,并避免把“如何向客户交代”当成决策依据。

最后,作者把斯特恩的方法总结成三问:我感受到的是现实还是恐惧?噪音下真正改变了什么?我是在为市场还是为委托人的情绪做决定?文章认为,心理降噪不是一次性的危机应对,而是一种长期训练——知道什么时候是市场在说话,什么时候是自己在喊叫。对于职业投资管理人来说,这种清醒比更复杂的模型或更多的信息更重要。

财富阶梯与无人之地

文章围绕 Nick Maggiulli 的《财富阶梯》展开,用“净资产”而非“收入”来理解财富层级,并将家庭财富划分为六层:从不足 1 万美元到 1 亿美元以上。作者指出,财富增长并不是线性爬升,而是十倍十倍地跨越,不同层级对应的生活自由度也不同:第二层接近“超市自由”,第三层接近“餐厅自由”,第四层接近“旅行自由”。

文章的核心观点是第四层存在一个“无人之地”:净资产在 100 万到 1000 万美元之间的家庭,20 年后仍有 64% 停留在这一层。原因并不只是运气不好,而是时间窗口不足、资产类型断层以及激励结构翻转。到第四层之后,继续用高风险进攻策略不一定划算,因为一次大亏损可能再也没有足够时间弥补。

作者进一步强调,不同财富层级需要不同策略:第二层的重点不是研究投资,而是提升能被市场付费的技能;第三层要依靠持续买入多元化生息资产,让复利真正起作用;到了第四层,则要从进攻切换到防守,更多考虑分散、税务与风险控制。文章还提出“0.01% 法则”,把消费和净资产的日回报对应起来,让人可以在合适的层级上安心花钱。

文章后半部分将这一框架放到中国语境里讨论,指出中国家庭资产高度依赖房产,流动性差、再投资能力弱,因此“无人之地”可能更早出现。许多看似体面的中产家庭,可能因为学区房、面子房和高月供而压缩现金流,导致净资产增长停滞。真正拉开差距的,不是单纯的收入高低,而是收入增长能否持续快于支出增长。

最后,作者认为停在第四层并不一定是失败,对大多数人来说这反而是数学规律下最合理的落点。比起执着于继续向上,成熟的财务规划更重要的是回答“我可能要为谁、为什么、支付多少”这个问题,并在新的时代里重新分配时间、能力和注意力。

人有时候需要逼自己一下

这篇文章的核心意思是:人不能长期待在舒适区里。作者认为,很多人的“躺平”与“内卷”,本质上都是因为缺少行动和思考,遇到环境变化时才会被动转型、四处找路。

文章借作者早年做网站、考证、做公众号和翻译历史书的经历说明:真正的兴趣不是空想,而是需要被行动逼出来。很多事在开始前看起来很难,但只要愿意迈出第一步,后面就会越做越顺。

作者还强调,职业、学历和所谓“旱涝保收”并不能保证未来,关键是持续学习、独立判断和行动能力。与其停留在“独立思考”的口头阶段,不如先动手实践,在过程中不断调整。

文章最后想传达的是:比起沉浸在焦虑和抱怨里,不如把注意力放回自己,主动尝试、主动改变,给自己一点压力,反而更容易走出真正的路。

微信文章2026-04-25

弹性预训练

这篇文章介绍了 Google 提出的 Decoupled DiLoCo:一种面向超大规模分布式预训练的弹性训练框架,核心目标是在硬件频繁故障、跨地域异构资源、带宽受限的条件下,仍然保持训练可持续推进,而不依赖所有设备严格同步。

文章先解释了传统 SPMD 数据并行的瓶颈:当集群规模扩大到数十万、乃至数百万块芯片时,即便单卡平均故障率不高,整体集群也会因为“规模效应”变得几乎持续在处理故障、重配置和等待。论文给出的模拟表明,在极大规模下,即便采用弹性机制,传统方案的有效吞吐率也会显著下降,大量时间消耗在同步等待和重配上,而不是有效计算。

Decoupled DiLoCo 的思路是把训练系统拆成多个相互独立的学习器(Learner),每个学习器可以自行训练,不需要等其他节点完全对齐;与此同时,引入一个运行在更稳定 CPU 资源上的同步器(Syncer),周期性收集各学习器的更新并做参数合并。关键设计包括:

  • 最小法定数(Minimum Quorum):不必等待全部学习器,只要达到一定数量即可同步。
  • 自适应宽限窗口(Adaptive Grace Window):在达到法定数后,短暂等待更多学习器赶上,以提升每轮合并质量。
  • 按 token 加权的合并机制:避免不同速度的学习器在合并中贡献失衡。
  • 平衡张量分片(Balanced Tensor Fragmentation):把参数拆成大小接近的碎片进行传输,平滑通信压力。

文章进一步展示了实验结果:在极高故障率、超大规模集群下,这种框架能够把有效吞吐率维持在较高水平;在模型质量方面,它在大参数稠密模型和多种文本/视觉基准上的表现,也能与传统数据并行训练保持接近,说明容错能力的提升并没有明显牺牲最终效果。对于混用不同代际芯片的场景,这套方法也能通过异步和宽限窗口机制保持稳定训练。

一个很重要的延伸价值,是它让“捡漏算力”成为可能:临时可用的机器、跨地区零散资源、不同时间段的闲置算力,都可以被纳入训练,而不必像传统数据并行那样为了接入新节点付出高昂同步代价。文章认为,这种“可用性优先”的训练范式,正在从研究思路变成下一代大规模模型基础设施的现实需求。

离开DeepSeek

这篇访谈围绕王子涵的研究经历、在 DeepSeek 的一线实践,以及他对 Agent 方向的长期思考展开。文章先从他在社交媒体上被更多人注意到的经历写起:随着 DeepSeek R1、V3 等模型发布,外界开始关注这家公司和站在一线的研究者,而他选择做的事情并不是包装故事,而是尽量把真实的一线情况讲清楚。文章强调,真正定义他的不是短期“走红”,而是长期持续投入的 Agent system 研究路径。

王子涵的科研路径从人大时期就已经开始显现。他从推荐系统、搜索与信息检索切入,逐步接触强化学习和 Agent benchmark 研究,再到进入 DeepSeek 后围绕 MoE 专家专业化深入探索,后来继续把问题推进到 Agent 强化学习的底层机制。他关心的核心问题很朴素:AI 系统能不能像人一样,在没有持续外部指导的情况下自主学习、自主改进;更进一步,能不能在行动之前,先在内部完成对世界的预演和模拟。

文章还总结了他对“什么是 Agent”的理解:Agent 不只取决于模型本身,更取决于它所处的环境。给它开放的计算机环境,它就更接近 OpenClaw;给它受限的环境,它更像 Claude Code 或 Codex;只给聊天界面,它又更像 GPT。也就是说,环境开放程度决定了 Agent 的智能释放程度。基于这个视角,他希望打造的是能够适应资源约束、把不同规模资源都用出效果的 Agent,而不是只在理想条件下表现出色的系统。

在回顾早期科研经历时,文章写到他从统计学兴趣出发,主动联系老师进入人工智能相关课题组,做推荐系统和搜索算法等较传统的研究。那时的工作很多是手工设计、流程繁琐,但也让他更早感受到 AI 在现实应用中的价值。随后,他在 DeepSeek 看到了更高密度的研究氛围:几乎人人都在做研究相关的事情,工程同事也会积极讨论前沿进展;前辈甚至会逐行帮新同学改代码。这种环境促使他建立起一种“逆向思考”:有些看起来高深的东西未必真的成立,而一些看似工程化的任务,真正做起来反而需要扎实功夫。

整篇文章的主旨可以概括为:王子涵并不是把研究当成单点突破,而是沿着“理解智能—定义环境—改进行动”的链条持续推进。他对 Agent 的关注不是追热点,而是希望通过长期研究,让系统真正具备自主学习、环境适应和资源伸缩能力。