# 微信文章

Jane Street赚钱逻辑

wechat - 歌伶的大局观原文链接

这篇文章介绍了全球最神秘、也最赚钱的交易机构之一 Jane Street，重点解释它为什么能在 2025 年创下极高的交易利润，以及它的赚钱方式为何让普通投资者既依赖又不安。

文章首先梳理了 Jane Street 的背景：它成立于 1999 年，总部在纽约，规模只有约 3500 名员工，却凭借做市与量化交易在 2025 年实现了 390 亿美元级别的交易利润。它低调到几乎不公开接受采访，也没有典型华尔街公司的强层级结构，而是强调扁平化组织和极强的技术文化。

作者指出，Jane Street 的核心业务是做市商：在买卖双方之间提供报价、撮合成交，并通过极小的价差盈利。单笔利润微薄，但在超高频、超大规模的交易中会被放大成惊人的收益。其优势主要来自两点：一是早早切入 ETF 做市，建立了长期技术壁垒；二是依赖数学建模与速度，在多个市场之间寻找瞬时价格偏差并完成套利。

文章还强调，Jane Street 的招聘与华尔街传统金融机构很不一样，更看重数学、逻辑和概率思维，甚至会通过扑克等方式测试候选人的决策能力。它的内部文化也与交易逻辑高度一致：重视在不完整信息下做概率判断，而不是传统意义上的金融经验。

与此同时，文章也讨论了监管和争议。2008 年金融危机后，传统银行受监管限制退出部分自营与做市空间，Jane Street 趁机扩张；但随着它在印度、欧洲乃至中国等市场的影响力扩大，围绕“做市与操纵的边界”也出现了更多质疑。文章认为，Jane Street 的成功说明市场需要流动性，但其盈利模式本身也建立在信息和速度优势之上，因此天然带有争议。

最后，作者总结，Jane Street 不只是一个赚钱很强的交易机构，更像是一套把数学、技术、资本和组织方式结合到极致的市场机器。它既是现代金融效率的代表，也折射出当代市场中普通投资者、机构与监管之间越来越复杂的关系。

微信文章金融做市量化 ETF2026-05-11

佛教能取代儒家吗

wechat - 无形学园原文链接

文章围绕一个历史假设展开：如果儒家主导的“家国同构”秩序失灵，佛教有没有可能在中国取代儒家，成为新的国家意识形态。

作者认为，佛教在中国历史上影响极深，尤其在魏晋南北朝到隋唐时期，曾经扩张到社会生活、思想文化与政治象征的多个层面，但它的核心关切仍是“解脱”而非“组织社会”。佛教可以安顿人心、解释苦难、塑造慈悲伦理，也能为王权提供神圣性，却很难直接承担税赋、兵役、基层治理、家族秩序和官僚行政这些国家运转所必需的功能。

文章提出，若儒家整合能力崩塌，最可能出现的不是一个完整的佛教国家，而是三种不同走向：

宗教化的碎片秩序：寺院网络扩张，承担救济、超度、地方整合与精神安顿功能，但社会整体会变得更碎片化。
政教合一的佛教王权：在强王权与制度改造条件具备时，佛教可能成为王权合法性资源，形成类似佛教护法王的国家形态，但条件极苛刻。
新的世俗组织原则：从更长时段看，真正取代传统秩序的往往不是另一种宗教，而是现代民族国家、法律、学校、市场与政党等制度化组织原则。

文章进一步解释了为什么真实历史没有走向“佛教国家”，而是走向宋明理学：理学并未简单排斥佛教，而是吸收佛教的心性修养技术，把“明心见性”“去执”“内在觉悟”等资源重新安放回儒家的家国伦理中，使佛教的出世方向被改造为入世修身的工具。这样，佛教被消化为儒家的一部分，而不是成为国家底座。

最后，作者总结说，一种思想要成为国家意识形态，不能只看精神深度，还要看它能否组织社会。儒家的优势在于把家庭、教育、官僚、伦理和政治连成系统；佛教更擅长安顿心灵；现代性则提供了新的社会组织方式。文章借这个思想实验强调，文明之间真正的竞争，表面上是教义之争，深处其实是“谁能组织社会”的竞争。

微信文章历史佛教儒家文明2026-05-11

有限性如何生出意识

wechat - 集智俱乐部原文链接

这篇文章围绕“意识从何而来”展开，提出一个核心观点：意识并不是大脑“无所不能”时自然产生的结果，而恰恰诞生于认知资源的有限性。作者认为，正因为人脑无法把外部世界完整复制到内部，才必须通过选择、压缩、整合与建模，构造出一个带有个人偏好的“主观世界”。

文章首先强调，意识的起点是主观性。所谓主观性，不只是“每个人感觉不同”，而是每个主体都通过自己独特的方式体验世界。作者把这种主观体验理解为一种内部要素彼此约束、动态耦合的复杂系统：大脑并不是模块简单堆叠，而是在神经振荡、前馈—反馈回路、跨区域同步等机制中形成一个持续自洽的整体。只有这种“统一视角”存在，主体感才可能出现。

接着，文章提出更反直觉的判断：主观意识的根源不在于认知资源充足，而在于资源不足。因为资源有限，大脑必须做选择、分层、抽象和重构，不能无差别地处理一切输入；也正因为如此，系统才会形成内部模型、先验偏好和结构化解释。若一个系统真的能毫无成本地理解和处理全部信息，它反而不需要选择，也就难以形成我们熟悉的“意识体验”。

文章还进一步解释了为什么不同的人会有不同的主观体验。作者认为，差异不仅来自基因和环境，也来自大脑作为复杂系统的动态特性：微小的初始差异会被不断放大，不同个体会在相同输入下生成不同的内部模型。意识因此不是被动接收现实，而是在有限资源中主动建构一个“主观宫殿”。

在理论层面，文章把这一观点与整合信息理论（IIT）、全局工作空间理论（GNW）以及预测加工/生成模型等主流意识理论联系起来，认为这些理论虽然路径不同，但都强调了一个共同点：意识依赖于信息整合、动态耦合和主动建构，而不是单纯的信息堆积。

文章最后指出，现代社会的信息过载会进一步强化这种有限性困境：信息越多，主体越需要依靠模型和筛选来维持自我；而如果认知系统被技术彻底增强到接近“全知”，主体感反而可能减弱。作者因此总结，意识是有限性、复杂性与建构性共同作用的结果——它不是“全能”的副产品，而是在限制中闪耀出来的主观光芒。

微信文章意识脑科学认知科学人工智能2026-05-11

看不见的腾讯

wechat - 锦缎原文链接

这篇文章从“看不见的腾讯”切入，重点分析腾讯真正重要却常被忽略的一面：其庞大的投资组合，以及这张万亿级资产负债表如何重塑公司的长期战略。

文章指出，外界往往更关注腾讯的微信、游戏、广告等显性业务，但腾讯 2025 年报中的投资组合账面价值已接近万亿，在总资产中占比接近一半。对腾讯来说，投资不只是财务回报工具，更承担着战略防御、业务赋能和生态卡位等多重作用，是理解腾讯的关键维度之一。

作者将腾讯股权投资的演进分为三个阶段：

2011—2018 年的移动互联网扩张期：腾讯通过流量与资本双轮驱动，重仓京东、美团、拼多多、富途等项目，既获得高额财务回报，也放大了微信支付等生态能力。
2019—2023 年的收缩与兑现期：在反垄断和行业红利见顶背景下，腾讯开始减持部分非核心资产，转向更聚焦的投资策略。
2024 年至今的 AI 与硬科技转向期：腾讯开始明显向大模型、算力、芯片、先进制造、创新药等方向倾斜，试图为下一代技术周期布局。

文章还通过多个案例说明腾讯投资的打法：它倾向于长期持有、深度协同、精选标的，而不是短期投机。无论是京东、美团、富途，还是燧原科技、智谱、MiniMax、摩尔线程等项目，腾讯都在用资本结合场景、云服务和生态资源，强化自身在产业链中的位置。对于一些项目，腾讯获得了极高回报；对于少数项目，也会出现浮亏，但整体成功率相当高。

最后，文章总结称，腾讯的投资版图更像是公司的“战略雷达”和“未来保险单”。在互联网红利逐渐见顶、AI 竞争重新加速的时代，这张看不见的投资清单，正在悄悄决定腾讯还能走多远、下一轮增长从哪里来。

微信文章腾讯 AI 投资财报2026-05-11

DeepMind CEO谈AI健康

微信公众号 - Z Potentials 原文链接

这篇访谈围绕 Google DeepMind CEO Demis Hassabis 对 AI 未来用途的看法展开，核心观点是：AI 最有价值的方向不是简单的聊天或生成内容，而是帮助人类理解现实世界，并优先改善健康、科学和医学。

文章首先回顾了 Hassabis 对 AlphaFold 的思考路径。早在本科时期，他就对蛋白质折叠问题着迷，因为蛋白质的三维结构决定功能，而传统实验方法既慢又贵。AlphaFold 的突破在于，它把原本需要几十万美元、耗费多年才能得到的结构预测，压缩到几秒钟完成，并且可以把大量已知蛋白结构免费开放给全球科学家使用。作者强调，这使得 AlphaFold 不只是一个模型，而是一次彻底改变科研流程的基础设施升级。

接着，访谈讨论了 AlphaFold 在科研中的具体价值。它帮助研究者更快理解蛋白结构、探索药物靶点，也让研究冷门物种、植物、疟疾、查加斯病等“低商业回报”疾病的团队拥有了更好的工具。Hassabis 认为，AI 应该先解决这些能显著改善人类健康和基础科学的问题，而不是等到所谓的 AGI 完全成熟后才开始发挥作用。

文章随后转向药物发现。Hassabis 认为，知道蛋白结构只是第一步，真正的目标是把 AI 用在药物设计、分子筛选和副作用预测上。DeepMind 及其孵化公司 Isomorphic Labs 正在构建一整套相邻系统，尝试在计算机中完成尽可能多的药物发现流程：设计候选化合物、预测它们与目标蛋白的结合强度、快速检查是否会误伤其他蛋白，再把最有希望的结果送入湿实验室验证。这样的流程有望把现在动辄十年的药物研发周期大幅缩短。

文章还介绍了 AlphaGenome 的意义。它试图解码基因组中大量不编码蛋白质的区域，尤其是帮助识别哪些突变会导致疾病。Hassabis 认为，未来 AI 可能能更准确地指出疾病的关键突变，再和 CRISPR 这类基因编辑技术结合，直接修复问题位点，从而为遗传病治疗打开新路径。

最后，文章讨论了 AI 发展节奏的变化。Hassabis 承认，如果按他的个人意愿，他希望把 AI 更长时间留在实验室里，优先做科学和医学方向的工作；但现实中，ChatGPT 之后的产业竞争显著加速了 AI 的公众化和产品化。他认为自己始终最关心的仍然是“用 AI 理解世界”，而他希望这份技术力量最终能被用于科学发现、疾病治疗和人类认知边界的拓展。

微信文章 DeepMind AlphaFold AI健康生命科学2026-05-06

英伟达想革光模块的命

微信公众号 - 远川研究所原文链接

这篇文章围绕“英伟达为什么想改造光模块产业链”展开，核心是在解释 AI 数据中心互连需求、光模块的作用，以及英伟达推动 CPO（光电共封装）背后的产业影响。

文章先从中际旭创、新易盛、天孚通信等光模块龙头的高景气写起，说明在 AI 数据中心建设和资本开支持续扩张的背景下，光模块行业一度成为市场焦点。随后作者解释了数据中心内部通信为何重要：GPU 需要通过服务器、机柜、交换机等多个层级互联，才能把算力组织起来，而光模块正是把电信号转换为光信号、支撑长距离高速传输的关键器件。

接着，文章比较了铜缆与光缆的特点：铜缆便宜、低延迟，但距离受限；光纤能传得更远、功耗更低，但需要额外的光模块完成“翻译”。随着 GPU 集群规模变大、传输速率提升到 800G、1.6T，光模块的功耗和系统复杂度也越来越高，行业逐渐暴露出“中间环节太多”的问题。

英伟达的思路是把光模块拆解重组，推动 CPO 技术落地：把光引擎等器件直接放到交换机芯片甚至 GPU 附近，缩短电/光转换路径，降低功耗，并提升对整个系统的控制力。文章指出，英伟达与台积电在先进封装上的合作，以及后续在交换机、机架级系统中的布局，都说明它并不满足于只卖芯片，而是想进一步掌控“计算系统”的整体形态。

文章也重点分析了这一变化对中国光模块厂商的冲击。当前中国企业在光模块“系统集成”环节占据很强地位，但 CPO 如果普及，最先被削弱的恰恰是这类集成型价值；而高端激光器、探测器、DSP/AFE 等核心器件主要仍掌握在美日厂商手中。换句话说，CPO 可能会把产业链利润进一步向上游核心器件和大客户集中，挤压中国厂商擅长的中间层。

最后，文章认为短期内 CPO 仍受成本、工艺和量产节奏限制，光模块行业不会立刻被颠覆，但中长期看，英伟达、台积电、博通等玩家正在重新定义数据中心互连的技术路线，光模块行业的竞争格局也因此面临重塑。

微信文章英伟达光模块 CPO AI数据中心2026-05-06

多样性与灭绝

微信公众号 - 在苍茫中传灯原文链接

这篇文章围绕彼得·沃德的“稀有地球”观点展开，核心议题是：复杂生命为什么如此罕见，而多样性又如何帮助生命规避灭绝。文章先从寒武纪爆发切入，指出动物在极短时间内突然出现大量新的形体构型，这与“缓慢渐变”的传统印象并不一致，也让达尔文式演化面临化石记录上的难题。

随后，文章把“集群灭绝”作为理解生命演化的关键变量来讨论。作者强调，地球历史上多次大灭绝事件会重置生态系统，让旧有优势类群退场，为新类群腾出空间；但从更宏观的角度看，灭绝总体上对生物多样性是净损失，而不是天然的进步机制。尤其在寒武纪这类复杂生命刚起步的阶段，环境条件的微小变化都可能造成整个类型或“门”的消失。

文章的一个重要结论是：复杂性本身会增加脆弱性。简单生物往往能更长久地存活，细菌和古菌几乎不需要显著改变形体就能适应环境；相对而言，复杂后生动物的演化寿命更短，灭绝风险更高。作者据此认为，生物要对抗灭绝，关键不在于不断变复杂，而在于提高多样性——也就是在一个高等分类群内部发展出足够多的物种和形体储备。

文章最后把这一逻辑归结为一句话：多样性是对抗灭绝的最好方法。一个类群如果拥有足够多的物种，即使局部遭遇灾难，也更有可能凭借少数幸存者重新扩散、恢复生态位。换句话说，生命不是靠单一“最强者”赢得未来，而是靠广泛而分散的多样化储备，来穿越一次次随机而残酷的环境冲击。

微信文章演化大灭绝多样性2026-04-29

心理降噪，这个时代投资人最稀缺的能力

微信公众号 - 聪明投资者原文链接

文章从美伊冲突引发的市场噪音切入，讨论在高不确定性环境下，投资人最稀缺的能力并不是获取更多信息，而是“心理降噪”。作者指出，当地缘政治、油价波动和客户情绪同时涌来时，投资管理人往往会把恐惧、焦虑和自我防御误当成判断本身，真正需要处理的是心理噪音压过了判断力的问题。

为说明这一点，文章回顾了精神分析学家亚伦·斯特恩进入老虎基金的故事。斯特恩把心理学和临床观察带进对冲基金，不只是帮助投资人管理情绪，更重要的是识别“用感受替代现实判断”的防御机制。朱利安·罗伯逊请他设计选人体系，最终形成了一套长达 450 题的测评，重点不是智商，而是外向的竞争性、通才能力，以及在压力下仍能与现实保持连接的能力。

文章还通过老虎基金的兴衰说明，正确的宏观判断并不总能转化为结果：罗伯逊对科技泡沫的判断大体正确，但管理规模仍在委托人赎回中急剧缩水，最终基金关闭。这个案例强调，职业投资人的难点不只是看对市场，还要承受客户的焦虑，并避免把“如何向客户交代”当成决策依据。

最后，作者把斯特恩的方法总结成三问：我感受到的是现实还是恐惧？噪音下真正改变了什么？我是在为市场还是为委托人的情绪做决定？文章认为，心理降噪不是一次性的危机应对，而是一种长期训练——知道什么时候是市场在说话，什么时候是自己在喊叫。对于职业投资管理人来说，这种清醒比更复杂的模型或更多的信息更重要。

微信文章投资心理学对冲基金2026-04-29

财富阶梯与无人之地

微信公众号 - 经纬创投原文链接

文章围绕 Nick Maggiulli 的《财富阶梯》展开，用“净资产”而非“收入”来理解财富层级，并将家庭财富划分为六层：从不足 1 万美元到 1 亿美元以上。作者指出，财富增长并不是线性爬升，而是十倍十倍地跨越，不同层级对应的生活自由度也不同：第二层接近“超市自由”，第三层接近“餐厅自由”，第四层接近“旅行自由”。

文章的核心观点是第四层存在一个“无人之地”：净资产在 100 万到 1000 万美元之间的家庭，20 年后仍有 64% 停留在这一层。原因并不只是运气不好，而是时间窗口不足、资产类型断层以及激励结构翻转。到第四层之后，继续用高风险进攻策略不一定划算，因为一次大亏损可能再也没有足够时间弥补。

作者进一步强调，不同财富层级需要不同策略：第二层的重点不是研究投资，而是提升能被市场付费的技能；第三层要依靠持续买入多元化生息资产，让复利真正起作用；到了第四层，则要从进攻切换到防守，更多考虑分散、税务与风险控制。文章还提出“0.01% 法则”，把消费和净资产的日回报对应起来，让人可以在合适的层级上安心花钱。

文章后半部分将这一框架放到中国语境里讨论，指出中国家庭资产高度依赖房产，流动性差、再投资能力弱，因此“无人之地”可能更早出现。许多看似体面的中产家庭，可能因为学区房、面子房和高月供而压缩现金流，导致净资产增长停滞。真正拉开差距的，不是单纯的收入高低，而是收入增长能否持续快于支出增长。

最后，作者认为停在第四层并不一定是失败，对大多数人来说这反而是数学规律下最合理的落点。比起执着于继续向上，成熟的财务规划更重要的是回答“我可能要为谁、为什么、支付多少”这个问题，并在新的时代里重新分配时间、能力和注意力。

微信文章财富资产配置阶梯理论2026-04-29

人有时候需要逼自己一下

wechat - 太阳照常升起原文链接

这篇文章的核心意思是：人不能长期待在舒适区里。作者认为，很多人的“躺平”与“内卷”，本质上都是因为缺少行动和思考，遇到环境变化时才会被动转型、四处找路。

文章借作者早年做网站、考证、做公众号和翻译历史书的经历说明：真正的兴趣不是空想，而是需要被行动逼出来。很多事在开始前看起来很难，但只要愿意迈出第一步，后面就会越做越顺。

作者还强调，职业、学历和所谓“旱涝保收”并不能保证未来，关键是持续学习、独立判断和行动能力。与其停留在“独立思考”的口头阶段，不如先动手实践，在过程中不断调整。

文章最后想传达的是：比起沉浸在焦虑和抱怨里，不如把注意力放回自己，主动尝试、主动改变，给自己一点压力，反而更容易走出真正的路。

微信文章2026-04-25

弹性预训练

wechat - 机器之心原文链接

这篇文章介绍了 Google 提出的 Decoupled DiLoCo：一种面向超大规模分布式预训练的弹性训练框架，核心目标是在硬件频繁故障、跨地域异构资源、带宽受限的条件下，仍然保持训练可持续推进，而不依赖所有设备严格同步。

文章先解释了传统 SPMD 数据并行的瓶颈：当集群规模扩大到数十万、乃至数百万块芯片时，即便单卡平均故障率不高，整体集群也会因为“规模效应”变得几乎持续在处理故障、重配置和等待。论文给出的模拟表明，在极大规模下，即便采用弹性机制，传统方案的有效吞吐率也会显著下降，大量时间消耗在同步等待和重配上，而不是有效计算。

Decoupled DiLoCo 的思路是把训练系统拆成多个相互独立的学习器（Learner），每个学习器可以自行训练，不需要等其他节点完全对齐；与此同时，引入一个运行在更稳定 CPU 资源上的同步器（Syncer），周期性收集各学习器的更新并做参数合并。关键设计包括：

最小法定数（Minimum Quorum）：不必等待全部学习器，只要达到一定数量即可同步。
自适应宽限窗口（Adaptive Grace Window）：在达到法定数后，短暂等待更多学习器赶上，以提升每轮合并质量。
按 token 加权的合并机制：避免不同速度的学习器在合并中贡献失衡。
平衡张量分片（Balanced Tensor Fragmentation）：把参数拆成大小接近的碎片进行传输，平滑通信压力。

文章进一步展示了实验结果：在极高故障率、超大规模集群下，这种框架能够把有效吞吐率维持在较高水平；在模型质量方面，它在大参数稠密模型和多种文本/视觉基准上的表现，也能与传统数据并行训练保持接近，说明容错能力的提升并没有明显牺牲最终效果。对于混用不同代际芯片的场景，这套方法也能通过异步和宽限窗口机制保持稳定训练。

一个很重要的延伸价值，是它让“捡漏算力”成为可能：临时可用的机器、跨地区零散资源、不同时间段的闲置算力，都可以被纳入训练，而不必像传统数据并行那样为了接入新节点付出高昂同步代价。文章认为，这种“可用性优先”的训练范式，正在从研究思路变成下一代大规模模型基础设施的现实需求。

微信文章 AI 分布式训练预训练2026-04-25

离开DeepSeek

wechat - Z Potentials 原文链接

这篇访谈围绕王子涵的研究经历、在 DeepSeek 的一线实践，以及他对 Agent 方向的长期思考展开。文章先从他在社交媒体上被更多人注意到的经历写起：随着 DeepSeek R1、V3 等模型发布，外界开始关注这家公司和站在一线的研究者，而他选择做的事情并不是包装故事，而是尽量把真实的一线情况讲清楚。文章强调，真正定义他的不是短期“走红”，而是长期持续投入的 Agent system 研究路径。

王子涵的科研路径从人大时期就已经开始显现。他从推荐系统、搜索与信息检索切入，逐步接触强化学习和 Agent benchmark 研究，再到进入 DeepSeek 后围绕 MoE 专家专业化深入探索，后来继续把问题推进到 Agent 强化学习的底层机制。他关心的核心问题很朴素：AI 系统能不能像人一样，在没有持续外部指导的情况下自主学习、自主改进；更进一步，能不能在行动之前，先在内部完成对世界的预演和模拟。

文章还总结了他对“什么是 Agent”的理解：Agent 不只取决于模型本身，更取决于它所处的环境。给它开放的计算机环境，它就更接近 OpenClaw；给它受限的环境，它更像 Claude Code 或 Codex；只给聊天界面，它又更像 GPT。也就是说，环境开放程度决定了 Agent 的智能释放程度。基于这个视角，他希望打造的是能够适应资源约束、把不同规模资源都用出效果的 Agent，而不是只在理想条件下表现出色的系统。

在回顾早期科研经历时，文章写到他从统计学兴趣出发，主动联系老师进入人工智能相关课题组，做推荐系统和搜索算法等较传统的研究。那时的工作很多是手工设计、流程繁琐，但也让他更早感受到 AI 在现实应用中的价值。随后，他在 DeepSeek 看到了更高密度的研究氛围：几乎人人都在做研究相关的事情，工程同事也会积极讨论前沿进展；前辈甚至会逐行帮新同学改代码。这种环境促使他建立起一种“逆向思考”：有些看起来高深的东西未必真的成立，而一些看似工程化的任务，真正做起来反而需要扎实功夫。

整篇文章的主旨可以概括为：王子涵并不是把研究当成单点突破，而是沿着“理解智能—定义环境—改进行动”的链条持续推进。他对 Agent 的关注不是追热点，而是希望通过长期研究，让系统真正具备自主学习、环境适应和资源伸缩能力。

微信文章 AI Agent DeepSeek2026-04-25