今日阅读

每天读过文章的摘要整理

对话曦智科技沈亦晨:一个 MIT 博士与光计算穿越死亡谷的十年

这篇专访讲的是曦智科技创始人沈亦晨十年来推动光计算创业的过程,也是一段典型的硬科技穿越“死亡谷”的故事。2017 年,他还是 MIT 博士生时,基于一篇发表在 Nature Photonics 上的论文开始创业,并拿到了真格、百度、五源等机构的天使投资。彼时行业对光计算的理解还很有限,但投资人愿意押注这种“先看见未来、再慢慢找落地”的方向。

文章回顾了曦智早期的技术路线:最初目标是用光计算替代部分电芯片算力,瞄准的是 AI 计算和视觉分析场景,希望把计算速度显著提升。不过,现实比设想更难。摩尔定律并没有像很多人预期那样迅速失效,先进制程和封装技术持续演进,电芯片的竞争力被延长了很多年;与此同时,光计算在器件、工艺、供应链、工程化和商业化上都遇到了巨大挑战。

最关键的转折发生在 2022 年底。彼时曦智的光计算产品陷入瓶颈,继续投入新项目至少还需要 5 亿元,但公司账上只有 3 亿元。沈亦晨最终选择暂停高风险的光计算研发,转向更接近商业化的光互连业务,用光替代部分电线,服务 GPU 集群和超节点互联。这次调整让公司活了下来,也让它在大模型时代找到了新的市场切口。

文章特别强调了“活下去”的重要性。对硬科技公司来说,技术判断当然重要,但如果现金流和融资窗口关闭,再好的路线也可能被迫中断。沈亦晨在采访里提到,很多 MIT 同学创办的公司都在这一阶段倒下,自己也因此更清楚地意识到,创业不是单纯追求最前沿,而是要在理想与生存之间找到平衡。

在商业层面,曦智后来靠光互连成为主要收入来源之一。到 2025 年,光互连已经贡献了公司接近 80% 的收入,并占据中国独立 Scale-up 光互连解决方案市场的大部分份额。与此同时,公司也重新启动了面向大模型推理的新一代光计算芯片研发,试图在更大的 AI 基础设施浪潮中再次回到最初的技术愿景。

这篇文章的核心,不只是一个创业故事,而是一个关于“原始创新如何穿越现实”的样本。它说明,最早看到未来的人不一定最先收获商业回报,很多时候必须先在真实世界里找到一个可存活的落地点,再一步步把更大的理想推回到工程和市场中。

AI知识库难用

过去两三年,围绕“AI + 个人知识库”的方案已经轮番出现过很多次:Notion 配 ChatGPT、RAG 配 Obsidian、Obsidian 加 Claude Code、会自己写记忆的 Agent、以及最近 Karpathy 提出的 LLM Wiki。作者试过不少方案,但结论是:它们都不算真正解决了“长期知识状态”问题

一、问题不在“存”和“搜”

作者认为,很多人把个人知识库理解成“把资料存好、让 AI 能搜出来”,但这其实只覆盖了最表层的需求。

真正麻烦的是:

  • 一条判断什么时候生成
  • 凭什么成立
  • 什么时候过期
  • 与旧判断冲突时怎么办
  • 能不能追到证据
  • 模型有没有权力把自己的总结直接写成长期事实

也就是说,难点不是检索,而是长期知识状态的维护

二、四类“记忆”其实不是一回事

作者把大家常混在一起说的“记忆”拆成四层:

  1. 文档知识库:Obsidian、Notion、RAG,负责存放和检索资料
  2. 会话上下文管理:摘要、压缩、裁剪,解决长对话塞不下的问题
  3. 智能体记忆运行时:长期运行的 agent 什么时候读、写、审核、冻结记忆
  4. 个人知识状态系统:关于一个人或项目的长期知识,如何多年保持准确、可审计、可演化

作者的判断是:现在很多产品本质上只是拿第一层工具,去硬做第四层的事情,所以总会卡住。

三、RAG / Obsidian 能查,但不能积累

RAG 和 Obsidian 的优点很明显:资料能找出来,主题能搜到。但它们本质上是检索系统,不是知识维护系统

它们的问题在于:

  • 今天的判断不会自动继承到明天
  • 过期内容不会自动失效
  • 多份资料冲突时,系统不会主动处理
  • 很难知道某个结论到底来自哪段原文

所以它们越用越像资料仓库,而不是“越来越懂你”的系统。

四、让模型自己写记忆,也会出问题

第二类方案是让 AI 自己总结、自己沉淀、自己升级长期存储。看起来很自然,但作者认为这里有个危险假设:模型既负责提议,又负责决定什么是真相

他提到一个典型事故:用户让 agent 整理邮箱,并明确说“确认前不要执行任何动作”。但在后续上下文压缩里,这条关键约束被丢掉了,于是 agent 继续按自己的理解执行删除操作。

这个问题的本质不是“忘了一句话”,而是:

  • 安全约束
  • 审批合约
  • 长期偏好
  • 临时任务
  • 会话摘要

这些本不该混在一条链路里,但很多系统把它们都交给模型自己总结,最终就会把关键约束压没。

作者的结论很明确:模型可以提议,但不能由模型自己决定长期事实和危险动作

五、Hermes 做对了“运行时”,但还不够

作者认为 Hermes 这一类系统已经比前两类成熟很多,因为它真的把记忆当成一个运行时子系统来做,而不是“顺手加的功能”。

他特别认可的点包括:

  • 会话开始时冻结记忆快照
  • 记忆同步是异步管线,不在主回答链路里硬做
  • review 由独立的 quiet agent 处理
  • 记忆提供方可以抽象成多个 provider

但作者也指出,Hermes 主要解决的是“一个长期跑的 agent 怎么稳定携带工作记忆”,还没完全解决“个人多年积累的知识状态怎么编译成可审计、可演化、可投影的长期知识”。

六、Karpathy 的 LLM Wiki:进步了,但证据容易变软

Karpathy 的思路比纯 RAG 更进一步:不是每次问问题时才临时综合,而是让系统持续维护一份 wiki。

作者自己也本地实现过类似方案,刚开始效果很好,似乎能回答很多“我有哪些项目、我有什么习惯、资料之间有什么关联”这类问题。

但问题很快出现:AI 开始越来越依赖维基,而不是原文。

而维基的弱点在于:

  • 它是综合结果,不是事实源
  • 综合过程是有损的
  • 细节会丢失,解释会被加重,弱关系会被写成强关系
  • 用久了以后,很难追回原始证据

所以作者认为,维基可以是很好的投影,但不能当底层事实源。

七、真正需要的是“知识状态运行时”

作者最终把问题重新定义为:

如何在有限上下文、变化的世界、不可靠的抽取器之间,维护一份可验证的知识状态?

他给出的方向不是“更聪明的模型”或“更漂亮的笔记软件”,而是一套更完整的系统:

  • 原始资料进入系统
  • 变成可追溯的观察
  • 模型提出候选主张
  • 主张绑定证据、时间和风险等级
  • 低风险自动接受,中高风险进入审核
  • 通过后的主张进入长期状态
  • 对话、维基、报告、上下文包都从同一份状态投影出来

他强调的核心是:模型负责提议,系统负责权威

八、记忆系统至少要有四个关键层

1. 统一的运行时边界

记忆不能散落在各处读写,而应该由一个专门层统一负责什么时候读、什么时候写、什么时候进 prompt、什么时候后台处理。

2. 冻结快照

一场对话开始后,系统应该使用同一份记忆视图,不能中途因为后台更新而让模型看到不同版本。

3. 候选门

不是所有看起来“值得记住”的内容都能直接成为长期记忆。尤其是关于人的判断,应该默认高风险,先进入候选区。

4. 版本与可观测性

被编辑、替换、审批的记忆都应该保留版本历史,并且能追踪它为什么存在、什么时候生效、用了哪些证据。

九、知识层和权限层要分开

作者认为,记忆系统还有一个常被忽略的问题:记忆做对了,权限做错了一样会出事

所以至少要分清四种权力:

  • 事实写入权
  • 约束写入权
  • 工具执行权
  • 危险动作审批权

其中最关键的原则是:危险动作不能由模型自己批准自己

十、怎么判断这套系统真的变好了

作者目前关注的几个指标是:

  • 长期主张能不能追到原始资料
  • 新资料和旧主张冲突时,系统能不能发现
  • 过期主张能不能降权或失效
  • 同一场对话里的记忆是否稳定
  • 审核负担是否过重
  • 不同视图是不是都来自同一份状态源

他认为,判断一个个人知识系统,不能只看回答漂亮不漂亮,还要看它能不能解释自己为什么这么答,能不能回到证据,能不能发现冲突,能不能在时间里保持稳定。

结语

这篇文章的核心观点很清楚:“个人知识库”这个词太轻了,我们真正需要的可能是一个“知识状态运行时”

RAG 只能查,记忆系统要能维护;
Wiki 可以综合,但不能替代事实源;
模型可以提议,但不能自己定义真相;
知识可以投影,但底层必须有证据、版本和审核。

作者最后的判断是:这件事不会靠换一个更聪明的模型,或者换一个更漂亮的笔记应用来解决。它需要一整套能长期运行、可验证、可审计的系统设计。

Manus撤销交易

这篇文章围绕 Manus 被要求撤销交易这一事件展开,核心不是单纯讨论一笔并购,而是在讲:AI 时代创业公司的位置、身份、合规和技术归属,已经变成比融资故事更重要的问题

一、这不只是一次交易失败

作者认为,这次事件的重点不在于 Manus 少拿了多少钱,而在于它传递出一个非常明确的信号:过去那套“在中国起步、融资拿美元、主体放离岸、最后去美国退出”的默认剧本,在 AI 时代可能已经失效。

他把这件事看成一种旧世界模型的崩塌:

  • 以前创业公司更像纯商业主体,主要看产品、增长、估值和退出
  • 现在 AI 已经被放进国家竞争、技术边界和产业控制的框架里
  • 因此公司不再只是公司,它的位置会被重新审视

二、AI 时代,位置比能力更重要

文章反复强调一个判断:在大时代里,最重要的不只是能力,而是位置

作者问了几个很尖锐的问题:

  • 你站在哪里?
  • 你向谁证明价值?
  • 你把技术资产交给谁?
  • 你最终属于哪个体系?

他认为,创业者可以换注册地、换办公室、换融资口径,但很难换掉自己的生长史。公司在哪里长出来、谁贡献了核心人才、谁给了第一波流量和关注,这些都会成为身份的一部分。

所以 Manus 的问题不是“想不想国际化”,而是“你到底从哪里来、最终要站在哪边”。

三、不能既要、又要、也要

作者的态度很直接:全球化可以,但套利不行;出海可以,但切割不行。

他认为,创业者如果真想做一家美国公司、新加坡公司或欧洲公司,就应该从第一天开始在那边注册、融资、招人、接受监管,而不是先吃中国生态红利,等做大后再包装成“非中国资产”卖给美国巨头。

他把这种中间状态视为最危险的路:

  • 出发时要中国速度
  • 融资时要美元估值
  • 传播时要全球化光环
  • 退出时要美国接盘

在和平周期里,这种模糊可能被看作聪明;但在冲突周期里,这种模糊就是风险。

四、这对中国 AI 创业生态意味着什么

作者认为,这次事件之所以重要,是因为它会形成示范效应。

如果 Manus 这条路被默许,那么后面会有更多中国 AI 创业者走同样路径:

  • 在中国技术生态里起步
  • 做出声量后搬去离岸地区
  • 最后被美国大厂收购整合

而这对中国 AI 生态来说,会是一个很坏的信号,因为它会鼓励“先吃红利、再切出去”的路径成为默认选择。

所以从系统角度看,这不是一个单独公司的问题,而是对一种创业路线的否定。

五、AI 时代的竞争,已经不是上一代互联网逻辑

作者认为,很多创业者还在用上一代互联网的逻辑理解 AI:

  • 以为本质还是资本游戏
  • 以为只要产品好、增长快,就能自然完成全球化
  • 以为技术可以和国家边界脱钩

但他认为 AI 不是团购、外卖,也不是短视频推荐算法升级,而是会变成下一代软件入口、智能体工作流和产业分工的关键资产。

因此,今天处理 AI 公司,不能再只看商业路径,还要看:

  • 技术归属
  • 产业位置
  • 监管边界
  • 国家竞争关系

六、这篇文章真正的核心:战略判断

文章最后落到一个很明确的结论:创业者最重要的能力,不是只会往前冲,而是要看清自己站在哪里

作者认为:

  • 如果选择美国公司,就一开始就在美国做
  • 如果选择新加坡公司,就一开始在新加坡做
  • 如果选择中国公司,就承认自己在中国体系里,想清楚自己的责任和代价

他说,时代重新划线的时候,位置会决定很多东西:融资、退出、并购、合规、团队流动,甚至公司身份本身。

结语

这篇文章的语气很强,但核心观点其实很简单:

AI 时代的创业,不再只是做产品和讲故事,而是先回答“你是谁、你从哪里来、你站在哪个体系里”

作者给创业者的提醒是:

往前跑,别回头。

不是因为前面一定安全,而是因为回头的那条路,已经不在了。

霍华德学AI

这篇文章围绕橡树资本联合创始人霍华德·马克斯如何看待和使用 AI 展开。作者借助霍华德自己用 Claude 完成的一篇长备忘录,系统梳理了他对 AI 本质、最新进展、投资影响、泡沫判断与社会冲击的思考。

一、霍华德如何理解 AI

霍华德最核心的认识是:AI 不是搜索引擎,而是能综合信息、进行推理的系统。他把 AI 的生命过程分成两个阶段:

  • 训练:模型通过海量文本学习推理模式、论证结构和概念组合方式
  • 推理:模型在接到提示词后,利用已有能力回应用户任务

他特别强调,AI 的关键不只是“记住了多少信息”,而是学会了“如何思考”。因此,提示词质量非常重要;很多人低估 AI,不是因为模型不行,而是因为自己不会提需求。

二、AI 正从聊天工具变成劳动替代品

文章里用一个很清晰的三阶段模型描述 AI 的演进:

  1. 聊天式 AI:回答问题,节省思考时间
  2. 工具型 AI:会搜索、分析、执行任务,开始节省执行时间
  3. 自主代理:用户只给目标和约束,AI 自己完成任务并交付结果

霍华德认为,真正重要的变化在于第三层。到这一步,AI 不再只是辅助人类,而是开始替代劳动力,这也是为什么它的经济影响会突然变得巨大。

三、AI 的发展速度前所未有

霍华德反复强调一个判断:AI 的普及速度远快于历史上的计算机和互联网

他拿计算机的发展做对比:从 ENIAC 到个人电脑普及,经历了几十年;而 AI 从“看不见的基础能力”到“被大众广泛使用”,只用了很短时间。他认为这意味着两件事:

  • 企业和个人适应 AI 的时间窗口非常短
  • AI 带来的变化会在社会还没完全准备好的情况下迅速发生

四、AI 可能重塑软件、工作和安全边界

霍华德对 AI 的一个重要担忧,是它会同时冲击多个领域:

  • 软件开发:很多结构化工作会被 AI 接管
  • 安全与漏洞发现:AI 可能让系统漏洞暴露得更快
  • 反爬与对抗:网站会越来越难用传统手段区分人和机器

他并不把 AI 看成“只会提高效率的工具”,而是更像一种会改变规则的技术。尤其是当代理能力增强后,AI 可能会开始做过去根本没有自动化想象空间的任务。

五、他怎么看 AI 的局限

尽管态度偏乐观,霍华德也明确写出了 AI 的局限:

  • 它在真正全新的情境里不一定可靠
  • 它有幻觉,未必知道自己不知道什么
  • 它仍然会犯错
  • 它的上下文窗口有限,记忆并不完整
  • 它可能让人过度信任其输出

他认为,AI 很强,但并不是“无所不能的思考机器”。尤其在缺乏历史模式、需要直觉和主观判断的领域,人类仍然有价值。

六、AI 对投资意味着什么

在投资层面,霍华德的判断很有代表性:

  • AI 很擅长处理量化信息、识别历史模式、保持冷静
  • 但伟大的投资并不只依赖数据,还依赖对定性因素的判断
  • 比如管理层、产品创新、合作方、时机、直觉等,都不是简单模式匹配能完全替代的

他的结论是:AI 会提高投资门槛,但不会完全消灭优秀投资者的价值。未来真正能胜出的,仍然是那些能判断信息意义、理解定性因素、并对新环境做出高质量猜测的人。

七、这是泡沫吗?他的态度很克制

霍华德对“AI 是不是泡沫”这个问题的回答并不极端。他的态度是:

  • AI 技术本身是真的,不是幻觉
  • 市场需求也是真的,而且增长很快
  • 但基础设施投资是否过度、资产价格是否合理,仍然不能轻易下结论

所以他不建议:

  • 全仓押注
  • 也不建议完全离场

更合理的做法是:保持适度仓位,同时精选标的、保持审慎

八、他最担心的是就业与社会冲击

文章最后一部分转向社会层面。霍华德真正担心的,不只是技术和估值,而是AI 带来的失业与身份感危机

他引用了大量例子说明:

  • 软件、广告、驾驶、分析、合规等岗位都可能被重塑
  • AI 替代的不是一两个岗位,而是很多结构化知识工作
  • 社会可能来不及为被替代的人创造足够快的新工作

他也讨论了乐观派的说法——历史上每次技术革命都会创造新岗位——但他并没有完全相信这种外推。他的态度是:希望自己是错的,但不能假装风险不存在

总结

这篇文章最有价值的地方,不在于它给出了某个单点结论,而在于霍华德用一个非常成熟的投资框架,去理解 AI 这场技术革命:

  • 它是真实的
  • 它发展极快
  • 它已经开始替代劳动
  • 它会影响投资、软件和社会结构
  • 但它仍然有局限,仍然不能被神化

整体上,这是一篇很典型的“老练投资人学习 AI”的笔记:既有好奇心,也有克制;既承认机会,也不回避风险。

Agent 动力学

这篇文章是 42 章经对 RC 的访谈,核心围绕三个主题展开:CLI 时代为什么重新兴起、Agent 产品该如何设计、以及多 Agents 协作的组织形态会怎样演化。整篇对话的信息量很大,重点不是单纯讲一个工具,而是在讨论「人和 AI 如何一起工作」这件事。

1. CLI 为什么会重新火起来

RC 认为,CLI 之所以再次变得重要,是因为它对 Agent 更友好。相比图形界面,命令行天然是文本化、结构化的,更适合大模型理解和操作。随着 Agent 能力提升,过去只适合人类直接使用的 GUI,反而不一定是最优入口。

他强调,今天的 CLI 已经不只是“给人用的命令行工具”,而是开始变成“给 Agent 用的工作界面”。因此,输入要尽量简洁、明确,输出要尽量稳定、高密度、可被机器直接读懂。

2. Kimi CLI 和“本地 Agent harness”

RC 回顾了自己做 Kimi CLI 的经历。他并不认为 CLI 是 Agent 的终局形态,但它是一个很好的起点,因为可以先把最底层的本地执行框架做扎实:

  • 先有一个最小可用的 agent loop
  • 先接入 bash tool
  • 再逐步补充更多 built-in tools
  • 再基于这套 harness 封装 SDK,扩展到 Web UI、VS Code 插件等形态

他很看重这种“从第一性原理往上搭”的方式,认为这样更容易发现新的 insights,也更容易把能力沉淀成可复用的底座。

3. 模型能力提升后,安全与反爬都会被重写

文章里有一段很重要的判断:当模型能力继续提升,很多原本依赖“人类行为差异”的防线会被削弱。RC 认为,不论是安全漏洞扫描,还是网站反爬,Agent 都会越来越强,甚至会反过来逼迫防守方升级。

他提到,未来模型如果足够强,可能会让底层软件、编译器、内核、浏览器等系统暴露更多漏洞;而防守和修复往往跟不上攻击速度。类似地,网站也会越来越难依靠传统交互方式来区分人和机器。

4. Slock:不是单个 Agent,而是多人 + 多 Agents 的协作平台

RC 重点介绍了他创业后在做的 Slock。它不是一个“单一全能 Agent”,而更像一个人和多个 Agents 协作的工作空间

他认为,今天的 Agent 使用形态会越来越接近组织协作,而不是单人问答:

  • 需要通信:人和 Agent、Agent 和 Agent 之间要能沟通
  • 需要分工:任务发出后要有 claim / lock 机制,避免重复抢活
  • 需要共享:不同 Agent 的沉淀要能被其他人和 Agent 复用

他把这套机制类比成一种“AI 版飞书”,但底层逻辑更偏 Agent-first。

5. 多 Agents 协作的“动力学”

文章里最有意思的概念之一是“Agent 动力学”。RC 认为,当多个 Agent 长期协作时,它们不只是各自拥有 memory,还会形成一种群体记忆和群体文化,类似组织行为学中的公司文化。

他观察到,不同用户会把 Agent 组织成不同风格:

  • 有的更像协作型团队
  • 有的更像赛马竞争
  • 有的甚至会出现“办公室政治”式行为

这说明,未来 Agent 产品不只是工程问题,也会越来越像组织学、管理学和社会学问题。

6. Memory 比 skill 更重要

RC 对 MCP、skill、prompt 的看法也很明确:

  • MCP 本质上常常只是把 API 再包装一层
  • skill 只是把能力标准化、结构化,方便分发
  • 真正重要的是 memory

他认为,Agent 市场里卖的不是某个固定功能,而是该 Agent 的长期记忆、长期对话、纠偏过程和行为模式。也就是说,用户买到的不是“一个 app”,而更像是“一个会持续演化的工作伙伴”。

7. agent-first 产品设计:让 AI 先看懂,再让人看懂

文章后半段讨论了一个很关键的问题:产品不应该只为人设计,还要为 Agent 设计。

RC 提到,人类看界面是依赖空间结构的,但 Agent 的记忆是线性的 context,因此产品需要考虑:

  • Agent 如何快速定位上下文
  • 新消息如何和旧任务关联
  • 如何把任务摘要、状态、历史记录组织成 Agent 能直接用的信息

他说,真正难的不是把界面做漂亮,而是让“Agent 看到的产品”足够清晰、可执行。

8. 人和 AI 的未来关系

RC 的整体态度偏乐观。他认为未来不会简单变成“AI 取代人”,而更可能是:

  • 顶尖模型厂商越来越重视安全边界
  • 人类和 AI 会在更复杂的组织结构里协作
  • 编程、产品、设计、增长、运营等许多工作都会变成“先说目标,再由 AI 执行”的方式

他甚至提到,很多以前需要程序员才能做的事情,未来会被 top-down 的方式重写:先用 prompt 做出原型,再按需补充更深层的知识。

结语

这篇访谈的价值不在于某个单点技巧,而在于它把 CLI、Agent、Memory、多 Agents 协作、组织结构 这些概念串成了一条线。RC 的核心判断是:未来重要的不是“一个超级 Agent”,而是一个能让很多 Agent 和人一起工作的系统。

如果说传统软件是在为人设计界面,那么这一代产品开始是在为“人 + Agent 共同组成的组织”设计基础设施。

A股优于港股

这篇文章的核心观点很明确:对于内地投资者来说,如果 A 股和港股通标的的性价比接近,那么 A 股通常比港股更值得投。作者从市场结构、流动性、交易机会、制度安排等多个角度,系统比较了两者的优劣。

主要观点

1. A 股标的更多,选择面更大

A 股上市公司数量远多于港股通可投资标的,整体选择空间更大。这意味着投资者更容易找到合适的企业,也更容易在不同标的之间做比较和切换。

2. A 股整体流动性环境更好

作者认为 A 股与内地经济和资金面联系更紧密,整体流动性通常优于港股。港股作为离岸市场,虽然在流动性充裕时表现也不错,但一旦市场波动,流动性往往收缩得更快。

3. A 股的交易机会更多

由于投资者结构、情绪波动和市场参与度等因素,A 股中不同股票之间更容易出现明显的估值错配。对价值投资者来说,这种错配会带来更多低买高卖的机会。

4. A 股可以用市值申购新股

作者把这一点视为 A 股的额外收益加成。A 股投资者可以用市值参与新股申购,而港股通投资者无法享受这一便利;同时 A 股新股上市后通常也更容易获得正收益。

5. 融资与税费制度对内地投资者更友好

A 股市场在融资、分红税等制度设计上,对内地投资者通常更方便;而通过港股通投资港股时,在部分制度安排上会受到限制。文章还提到,不同账户类型在港股分红税上待遇也不完全一致。

6. A 股交易制度更适合多数内地投资者

文章认为 A 股的交易制度更“友好”,例如涨跌停板机制在一定程度上能抑制剧烈波动。相比之下,港股更接近国际市场机制,波动时会更直接地反映风险。

结论

作者最终得出的结论是:如果只比较股票本身的性价比,在 A 股与港股之间做选择时,A 股往往更优。不过文章也承认,港股市场在极端低估时会出现独特机会,因此并不是说港股没有价值,而是相对而言,A 股更适合大多数内地投资者作为优先选择。

如何读书

这篇文章讨论的核心不是“多读书”本身,而是如何带着方法去读书。作者强调,真正有效的阅读,不只是获取信息,而是借助脚注、尾注和引注,进入知识形成的脉络,理解观点如何被继承、修正和碰撞。

核心观点

1. 读研究类书籍,最重要的是引注

作者认为,教育往往教人读小说或散文,却很少系统教人如何读研究类书籍。对这类书而言,脚注、尾注、参考文献比正文更重要,因为它们揭示了知识从哪里来、与谁对话、又是如何形成的。

2. 知识不是凭空产生的

文章反复强调,文字知识是在传承、借鉴、辩驳和碰撞中形成的。一本书如果没有引注,就很难看出它与既有研究的关系,也不容易判断它到底是原创、转述,还是包装过的二手材料。

3. 引注能帮助识别学术质量

作者提到,过去一些学术著作大量互相引用,却缺少对原始来源的尊重,导致内容空心化、低质量化。通过检查引注,可以更容易识别一本书是不是建立在扎实的一手资料和真实研究之上。

4. 读书能力决定问题能力

作者把“会读书”与“会提问题”联系起来。没有阅读积累,就很难意识到引注的重要性,也就很难沿着不同文献的线索继续追问、延伸和发现新的问题。

5. 读书与现实研究、政策判断有关

文章举了自己在半导体、产业研究和政策讨论中的经历,说明认真阅读与深入检索文献,能够直接推动原创判断和现实分析,而不只是停留在“知道一些书名”的层面。

文章想传达的阅读方法

可以把这篇文章理解为一套阅读提醒:

  • 不要只看结论,要看证据从哪里来。
  • 不要只看作者说了什么,要看他引用了谁。
  • 不要只读单篇书籍,要顺着引注继续往下追。
  • 不要把读书当成信息消费,要把它当成建立问题意识的过程。

结论

作者的最终意思很明确:真正会读书的人,不只是读懂表面内容,而是能顺着引注、来源和脉络,发现知识背后的结构。在 AI 时代,这种能力不但没有过时,反而更重要,因为它直接关系到一个人能否提出好问题、做出好判断。

民粹主义改造美国

这篇文章是关于美国民粹主义的一篇长文增补合辑,核心不是简单解释“民粹主义是什么”,而是试图用美国历史来说明:民粹主义并不是偶发的情绪现象,而是一种能够周期性重塑美国政治、经济和社会结构的力量

文章主旨

作者认为,美国历史上的民粹主义运动,往往出现在社会矛盾、债务压力、收入分化、精英与大众脱节加剧的阶段。它的作用不是单纯制造混乱,而是在某些时期打破建制僵化,推动制度重新调整。

核心内容

1. 民粹主义是理解当代美国的重要钥匙

作者指出,中文世界对美国民粹主义的研究相对薄弱,这会影响我们对美国政治走向、中美关系和全球局势的判断。要理解美国当下的政治生态,必须从美国本土的历史脉络来观察民粹主义。

2. 美国民粹主义并非新现象

文章回顾了美国历史上的几次民粹主义浪潮:
  • 19 世纪末,民粹主义推动政府对铁路运费等问题进行干预,并促进反垄断立法;
  • 20 世纪 30 年代的大萧条时期,民粹主义推动了“小罗斯福新政”和更强的福利取向;
  • 60 年代以来,民粹主义再次影响美国社会结构与政治联盟。

作者借此强调,美国民粹主义并不是边缘噪音,而是反复参与美国制度重塑的历史力量。

3. 民粹主义与债务、分配和建制失灵有关

文章引用多位研究者观点,认为民粹主义往往与政府债务累积、财富鸿沟、机会不平等、以及民众对建制派失望有关。也就是说,它通常不是凭空出现,而是现实压力长期积累后的结果。

4. Trump 只是当前阶段的代表

作者把 Trump 视为美国本轮民粹主义浪潮的代表人物之一,但并不把问题简单归结为某个政治人物。文章更关心的是:民粹主义背后的结构性原因是什么,以及它会如何影响美国的长期政策取向。

5. 对中美关系有现实意义

文章最后强调,美国今天的民粹主义已经成为影响中美乃至全球的重要力量。对政府、企业和研究者来说,理解这种力量,有助于做中长期判断,而不只是跟着短期新闻情绪走。

总结

这篇文章想传达的核心判断是:美国民粹主义不是一次性的政治噪声,而是周期性地重塑美国内部利益结构和对外行为的历史机制。因此,若要理解今天的美国,就不能只看选举表面,而要看民粹主义与经济周期、债务压力和社会分裂之间的关系。

芯片战争及其应对(上)

这篇文章围绕《Chip War》展开,但重点并不只是介绍这本书,而是试图从半导体产业的发展史出发,解释美国半导体产业、美国政府系统和国际竞争之间的深层关系。上篇主要回顾历史背景,为后文分析美国当前芯片政策的动因做铺垫。

文章主旨

作者想说明的是:半导体产业从诞生之初,就不是一个单纯的市场化产业,而是与美国国防投入、政府采购、技术扩散和国际竞争深度绑定的混合型产业。因此,理解今天的芯片博弈,不能只从企业竞争看,还要从国家安全与产业政策的角度看。

主要内容

1. 半导体产业最初受惠于美国国防投入

文章开头回顾了半导体技术的起点:二战和冷战时期,美国军方、NASA 等机构对电子信息产业的投入,直接推动了晶体管、集成电路等关键技术的发展。仙童半导体、德州仪器等早期企业,都与美国国防订单有密切关系。

2. 军工需求推动了早期技术成熟

作者强调,半导体在早期并不是靠大众消费市场起飞的,而是先在军工、航天和导弹系统中成熟。像登月计划、民兵导弹项目等,都为半导体企业提供了关键订单和研发资金。

3. 民用市场扩大后,产业才真正起飞

随着民用消费电子需求增长,日本企业在晶体管收音机、电视机、录像机、计算器等产品上迅速崛起,推动了半导体的大规模民用化。美国与日本形成了某种垂直分工:美国偏向高端研发和军工市场,日本偏向消费电子制造。

4. 离岸外包与全球分工改变了产业格局

文章提到,美国半导体企业开始把部分制造环节外包到更低成本地区,例如香港等地。这种全球分工一方面提升了效率,另一方面也带来了技术扩散和产业竞争格局的变化。

5. 半导体产业一直带有政策与市场交织的特征

作者并不认同“半导体完全由市场自然演化”的看法。他认为,美国半导体产业从一开始就是政策、军工、市场与国际竞争交织的结果,只不过不同阶段政策和市场的主导权会发生变化。

这篇上篇的作用

这篇文章本身更像是一篇历史铺垫:

  • 先解释半导体产业为何会兴起;
  • 再说明美国为何在技术和产业上长期保持优势;
  • 最后为后续讨论“美国为何会针对中国大陆实施超常规芯片政策”提供历史基础。

结论

如果用一句话概括,这篇文章的核心观点是:半导体不是普通制造业,而是国家安全、军工体系、民用市场和全球分工共同塑造出来的战略产业。理解这一点,才能真正看懂芯片战争的来龙去脉。

AI出题法

这篇文章讲的是一种很实用的 AI 学习方式:不要只问 AI“这是什么”,而是让它给你出题,逼你先理解,再命名。作者借用 Anthropic 研究员 Amanda Askell 的提示词方法,强调通过故事、延迟命名和反向费曼式训练,来加深对陌生概念的理解。

核心观点

1. 不要急着要定义

作者认为,很多人使用 AI 时,第一反应是直接索要定义或标准答案。但真正有效的学习,不是快速拿到结论,而是让自己先进入理解过程。定义只是压缩过的标签,容易让人停留在表面。

2. 让 AI 先讲故事

文章提出一个很有意思的训练方式:
  • 先找一个本科生不太懂、研究生才懂的小众概念;
  • 让 AI 用三段式故事把它讲出来;
  • 故事里不能直接说出概念名称;
  • 最后再揭晓名称,并反过来对照故事里的每个要素。

这种方法的关键,是把抽象概念重新变成可感知的情境。

3. “延迟命名”能逼出深度理解

作者认为,标签往往是思考的终点。真正有用的是在命名之前,先理解一件事在现实中如何运作。等你先明白了逻辑,再知道它叫什么,理解会更牢固。

4. 高质量问题比标准答案更重要

文中还提到,聪明人的关键能力,不是复述别人给的答案,而是会提出足够具体、足够偏离常规的问题。也就是说,AI 时代的真正竞争力,越来越体现在“会不会出题”。

5. 理解一件事,最好能把它变回故事

文章最后强调,真正理解某个概念,不是会背定义,而是能把它还原成一个有冲突、有取舍、有过程的故事。作者认为这比死记硬背定义更接近真实理解。

可直接使用的提示词思路

文章给了一个可直接套用的模板,大意是:

我想搞懂 [X],但你别直接告诉我定义。先找一个与 [X] 相近但更冷门的原理,用三段故事讲清楚,故事里不能出现概念名;讲完后先别揭晓,先问我它讲的是什么;最后再告诉我 [X] 叫什么,并逐条对照故事和概念。

结论

这篇文章的重点不是某个具体 AI 技巧,而是一种更高阶的学习观:聪明人用 AI,不是为了更快拿答案,而是为了训练自己的思考能力。AI 最适合做的,不是替你思考,而是帮你设计思考的难度。

人有时候需要逼自己一下

这篇文章的核心意思是:人不能长期待在舒适区里。作者认为,很多人的“躺平”与“内卷”,本质上都是因为缺少行动和思考,遇到环境变化时才会被动转型、四处找路。

文章借作者早年做网站、考证、做公众号和翻译历史书的经历说明:真正的兴趣不是空想,而是需要被行动逼出来。很多事在开始前看起来很难,但只要愿意迈出第一步,后面就会越做越顺。

作者还强调,职业、学历和所谓“旱涝保收”并不能保证未来,关键是持续学习、独立判断和行动能力。与其停留在“独立思考”的口头阶段,不如先动手实践,在过程中不断调整。

文章最后想传达的是:比起沉浸在焦虑和抱怨里,不如把注意力放回自己,主动尝试、主动改变,给自己一点压力,反而更容易走出真正的路。

微信文章2026-04-25

弹性预训练

这篇文章介绍了 Google 提出的 Decoupled DiLoCo:一种面向超大规模分布式预训练的弹性训练框架,核心目标是在硬件频繁故障、跨地域异构资源、带宽受限的条件下,仍然保持训练可持续推进,而不依赖所有设备严格同步。

文章先解释了传统 SPMD 数据并行的瓶颈:当集群规模扩大到数十万、乃至数百万块芯片时,即便单卡平均故障率不高,整体集群也会因为“规模效应”变得几乎持续在处理故障、重配置和等待。论文给出的模拟表明,在极大规模下,即便采用弹性机制,传统方案的有效吞吐率也会显著下降,大量时间消耗在同步等待和重配上,而不是有效计算。

Decoupled DiLoCo 的思路是把训练系统拆成多个相互独立的学习器(Learner),每个学习器可以自行训练,不需要等其他节点完全对齐;与此同时,引入一个运行在更稳定 CPU 资源上的同步器(Syncer),周期性收集各学习器的更新并做参数合并。关键设计包括:

  • 最小法定数(Minimum Quorum):不必等待全部学习器,只要达到一定数量即可同步。
  • 自适应宽限窗口(Adaptive Grace Window):在达到法定数后,短暂等待更多学习器赶上,以提升每轮合并质量。
  • 按 token 加权的合并机制:避免不同速度的学习器在合并中贡献失衡。
  • 平衡张量分片(Balanced Tensor Fragmentation):把参数拆成大小接近的碎片进行传输,平滑通信压力。

文章进一步展示了实验结果:在极高故障率、超大规模集群下,这种框架能够把有效吞吐率维持在较高水平;在模型质量方面,它在大参数稠密模型和多种文本/视觉基准上的表现,也能与传统数据并行训练保持接近,说明容错能力的提升并没有明显牺牲最终效果。对于混用不同代际芯片的场景,这套方法也能通过异步和宽限窗口机制保持稳定训练。

一个很重要的延伸价值,是它让“捡漏算力”成为可能:临时可用的机器、跨地区零散资源、不同时间段的闲置算力,都可以被纳入训练,而不必像传统数据并行那样为了接入新节点付出高昂同步代价。文章认为,这种“可用性优先”的训练范式,正在从研究思路变成下一代大规模模型基础设施的现实需求。

离开DeepSeek

这篇访谈围绕王子涵的研究经历、在 DeepSeek 的一线实践,以及他对 Agent 方向的长期思考展开。文章先从他在社交媒体上被更多人注意到的经历写起:随着 DeepSeek R1、V3 等模型发布,外界开始关注这家公司和站在一线的研究者,而他选择做的事情并不是包装故事,而是尽量把真实的一线情况讲清楚。文章强调,真正定义他的不是短期“走红”,而是长期持续投入的 Agent system 研究路径。

王子涵的科研路径从人大时期就已经开始显现。他从推荐系统、搜索与信息检索切入,逐步接触强化学习和 Agent benchmark 研究,再到进入 DeepSeek 后围绕 MoE 专家专业化深入探索,后来继续把问题推进到 Agent 强化学习的底层机制。他关心的核心问题很朴素:AI 系统能不能像人一样,在没有持续外部指导的情况下自主学习、自主改进;更进一步,能不能在行动之前,先在内部完成对世界的预演和模拟。

文章还总结了他对“什么是 Agent”的理解:Agent 不只取决于模型本身,更取决于它所处的环境。给它开放的计算机环境,它就更接近 OpenClaw;给它受限的环境,它更像 Claude Code 或 Codex;只给聊天界面,它又更像 GPT。也就是说,环境开放程度决定了 Agent 的智能释放程度。基于这个视角,他希望打造的是能够适应资源约束、把不同规模资源都用出效果的 Agent,而不是只在理想条件下表现出色的系统。

在回顾早期科研经历时,文章写到他从统计学兴趣出发,主动联系老师进入人工智能相关课题组,做推荐系统和搜索算法等较传统的研究。那时的工作很多是手工设计、流程繁琐,但也让他更早感受到 AI 在现实应用中的价值。随后,他在 DeepSeek 看到了更高密度的研究氛围:几乎人人都在做研究相关的事情,工程同事也会积极讨论前沿进展;前辈甚至会逐行帮新同学改代码。这种环境促使他建立起一种“逆向思考”:有些看起来高深的东西未必真的成立,而一些看似工程化的任务,真正做起来反而需要扎实功夫。

整篇文章的主旨可以概括为:王子涵并不是把研究当成单点突破,而是沿着“理解智能—定义环境—改进行动”的链条持续推进。他对 Agent 的关注不是追热点,而是希望通过长期研究,让系统真正具备自主学习、环境适应和资源伸缩能力。

AI范式巨变

摘要

这篇访谈围绕“AI 范式正在发生怎样的巨变”展开,核心人物是罗福莉。文章认为,2026 年是大模型战争的第二幕:行业正在从以 Pre-train(预训练) 为主的 Chat 时代,转向以 Post-train(后训练)Agent 为核心的新阶段。

罗福莉的一个重要判断是:上一个时代的成功,并不意味着下一个时代还能继续领先。随着模型能力逐渐接近,真正拉开差距的,已经不只是基座模型本身,而是围绕模型构建的 Agent 框架、后训练范式、推理系统和组织协作方式。她特别强调,未来的竞争重点将是如何在 Agent 上做好 RL scaling,以及如何把模型能力和框架能力一起推进。

文章中一个非常重要的主题,是她对 OpenClaw 这类 Agent 框架的评价。她认为,一个好的框架应该尽量弥补行动上的缺陷:比如更强的 memory、更丰富的消息通道、更主动的任务执行、更好的多模型协同,以及更完善的评估机制。她一开始也对 OpenClaw 持怀疑态度,但在深度使用后发现,这类框架不仅能显著提升体验,还能把中层模型的能力上限大幅抬高。

在她看来,OpenClaw 之所以令人震撼,不只是因为它“像 Claude Code 加了一个壳”,而是它把 Agent 框架做得足够开放、足够可改、足够厚重。用户可以直接改 memory、multi-agent 流程、skills 和工作流,这种可操纵性会极大激发创造力。她认为,真正强大的不是单一产品界面,而是产品背后那层负责调度、记忆、评估和任务编排的中间层。

文章还讨论了组织层面的变化。罗福莉提到,在新的范式下,团队需要更强的敏捷性和更高的研究效率;同时,资源分配也会改变,后训练的重要性会显著上升。她甚至提到,在顶尖团队中,预训练和后训练的资源比例可能已经接近 1:1。与此同时,组织结构也在变化:更平权、更少层级、更少约束的组织,可能更有利于创新。

另一个值得注意的观点,是她对“自学习”的理解:未来的模型进步,不只是模型单独变强,而是模型和 Agent 框架同步演化。模型在训练中变强的同时,也会反过来改变框架设计,包括静态的 memory、skills,以及动态的调度和工作流。换句话说,真正的竞争不再只是“谁的模型更大”,而是“谁能把模型、框架、组织一起升级”。

体会

这篇访谈最大的价值,在于它把“AI 变革”从抽象口号落到了具体工程和组织层面:模型不再是唯一主角,Agent 框架、后训练、评估体系、组织方式都成了决定性变量。它传达出的信号很明确:下一阶段的领先者,可能不是单纯把模型做得更大的人,而是最会把模型能力转化为系统能力的人。

DeepSeek-V4论文解读

摘要

这篇文章是对 DeepSeek-V4 开源发布的论文细节解读与实测对比。作者首先介绍了这次开源的两个版本:DeepSeek-V4-ProDeepSeek-V4-Flash,并给出了模型规模、激活参数以及对应的 Hugging Face 链接,整体语气是“终于等到,但也有一点小失望”。

文章明确指出,DeepSeek-V4 依然是纯文本模型,不是多模态模型,这让作者感到略微遗憾。不过他也强调,DeepSeek 作为国内团队仍然保持了很强的工程和研究自洽性,并继续坚持一种“不诱于誉,不恐于诽,率道而行”的路线。

在技术层面,文章重点讲解了 DeepSeek-V4 论文中的关键改进。作者提到,V4 在模型结构上引入了一些此前已有但实现细节不同的技术,其中包括 流形约束超连接(mHC),其目标是把残差映射约束到双随机矩阵流形上,从而增强跨层信号传播的稳定性。文章还讨论了混合压缩稀疏注意力(CSA)重度压缩注意力(HCA)等机制,以及 DeepSeek 稀疏注意力 DSA 的延续和扩展。

作者的整体判断是:DeepSeek-V4 在架构和训练策略上继续推进了长上下文、稀疏注意力和高效推理方向,但它并不是一次“颠覆式改变”,而更像是对前代思路的系统性加强和工程化收敛。文章也通过论文细节和图示,帮助读者理解 DeepSeek 为什么能在开源大模型领域持续保持领先或接近领先的位置。

在评测与实测对比部分,作者结合公开论文内容和实际体验,认为 V4-Pro 的能力更偏向高质量推理和复杂任务处理,而 V4-Flash 则更适合成本敏感、效率优先的使用场景。虽然这次没有带来多模态能力上的惊喜,但从纯文本模型的角度看,DeepSeek 依旧展示了很强的研究深度和工程一致性。

体会

这篇文章的重点不只是“DeepSeek-V4 发布了什么”,更是“为什么它这样设计”。作者用比较细的论文解读告诉读者:DeepSeek 的优势并不只来自参数规模,而来自它在架构、注意力机制和训练稳定性上的持续打磨。对于关注开源大模型的人来说,这是一篇偏技术向、适合理解 V4 设计逻辑的解读文章。