← 所有标签

# AI

DeepSeek万亿战略

文章摘要

这篇文章围绕 DeepSeek 的商业路径展开推演,核心观点是:DeepSeek 表面上似乎没有像其他模型厂商那样全力做编程订阅、多模态或语音视频应用,但这并不意味着它缺乏商业化方向;相反,作者认为它是在通过模型架构、推理优化与开源策略,推动一整套更宏大的 AI 硬件与算力生态。

文章首先从 KV Cache 的压缩与长上下文成本谈起,强调 DeepSeek 在减少显存压力方面的创新会显著降低长程推理和长上下文智能体的成本。作者认为,这类技术不仅能提升模型推理效率,还会间接扩大 SSD、NAND、LPDDR 等存储与内存组件的需求,因为更便宜、更小的缓存让“把数据转存到更低成本介质上”变得更可行。

接着,文章把这种技术路线放到更大的产业图景里解读:如果模型对 HBM 的依赖下降,那么中国本土的 NAND、LPDDR 供应链就有机会成为 AI 时代的重要受益者。作者认为,DeepSeek 的一系列选择并非单纯为了做应用层收入,而是在降低 AI 使用门槛的同时,推动一套可由中国本土硬件支撑的替代性生态。

文章还提到 DeepSeek 的一些研究方向,例如 MoE、MLA、mHC、CSA/HSA 等,认为这些创新共同指向一个目标:以更低的计算和通信成本提升模型能力,压缩推理开销,并让国产 GPU/ASIC 与网络芯片更“够用”,从而在现实产业中形成联动效应。

最后,作者将这一切总结为一盘“10 万亿美元大棋”:DeepSeek 的目标不只是单一模型产品的收入,而是借由开源、架构创新和推理优化,推动 AI 成本下降,进而带动存储、内存、芯片、封装、网络等上下游产业链的发展,并在中西方 AI 硬件竞争中形成新的力量平衡。

柏基AI研究议程

柏基AI研究议程

这篇文章围绕柏基投资(Baillie Gifford)2026年的人工智能研究议程展开,核心观点是:在 AI 快速扩张的时代,投资机会不只来自“AI 本身”,更来自 AI 带来的新稀缺性旧稀缺性的转移

文章先介绍柏基长期研究的特点:以 10 年为尺度思考,强调跨学科视角、长期主义与“非共识正确”,关注能带来指数级增长的变革型公司,而不是短期利润波动。作者指出,柏基很早就把 AI 作为重点研究方向,今年的研究议程再次把它放在最核心的位置。

文章主要观点

1. 技术革命会把稀缺性重新分配

文章用印刷术、能源革命等历史例子说明,技术进步通常会把某些原本稀缺的资源变成丰富资源,同时把新的瓶颈抬升为“稀缺点”。

在 AI 时代,这种变化主要体现在两个方面:

  • 信息变得更丰富:生成式 AI 让内容生成、知识获取、软件编写等能力大幅普及。
  • 能源与算力更稀缺:训练和运行大模型需要海量 GPU、存储、数据中心、电力与冷却能力,物理基础设施反而更重要。

2. AI 的核心稀缺性在基础设施

文章认为,AI 的价值链里,真正容易形成瓶颈和定价权的环节,主要集中在物理基础设施层:
  • GPU 与处理芯片:仍是训练和推理的核心,需求持续旺盛。
  • 高带宽存储(HBM):AI 对内存和带宽的要求会持续推高存储需求。
  • 半导体设备与材料:复杂芯片制造需要少数关键供应商,产业集中度高。
  • 数据中心与供电:即便能效提升,电力依然是大瓶颈,数据中心扩张会显著推高用电需求。

文章特别强调,AI 的大规模普及并不只是软件问题,而是数字世界和物理世界更深度耦合的问题。

3. 软件“稀缺性”可能被削弱

作者讨论了一个重要判断:AI 代理和自动化工具可能会削弱传统企业软件、中介平台、部分在线服务的稀缺性。

当 AI 代理能够自动构建、维护、调用很多系统时,部分软件产品的议价能力可能下降。过去靠“连接买卖双方”“提供工作流管理”形成壁垒的平台,也可能面临被 AI 重塑的风险。

不过,文章也指出,不是所有软件公司都会被替代。那些:

  • 具备强数据安全与可信能力的公司,
  • 能与物理世界深度结合的公司,
  • 能主动利用 AI 重塑商业模式的公司,

仍可能保有稀缺价值。

4. 投资者要寻找“新的护城河”

文章将 AI 时代的机会概括为三类稀缺性:
  • 信任与准确性:例如支付、安全、可信数据等领域。
  • 物理优势:能与现实资产、供应链、物流、制造深度连接的企业。
  • 适应性:能够快速把 AI 融入产品和收费方式的公司。

换句话说,AI 时代的赢家,不一定是最会“做 AI 的公司”,而可能是最能把 AI 嵌入自身稀缺资源与业务结构的公司。

我的理解

这篇文章的重点不在于预测某个具体公司涨跌,而是在提醒读者:

  • AI 会让很多能力变得更便宜、更普及;
  • 真正值钱的东西,可能转移到算力、能源、数据中心、供应链和可信基础设施;
  • 投资框架要从“软件红利”转向“稀缺性在哪里”来思考。

整体来看,这是一个典型的柏基式视角:不追逐短期热点,而是从长期技术变迁里找结构性的瓶颈和赢家。

看不见的腾讯

这篇文章从“看不见的腾讯”切入,重点分析腾讯真正重要却常被忽略的一面:其庞大的投资组合,以及这张万亿级资产负债表如何重塑公司的长期战略。

文章指出,外界往往更关注腾讯的微信、游戏、广告等显性业务,但腾讯 2025 年报中的投资组合账面价值已接近万亿,在总资产中占比接近一半。对腾讯来说,投资不只是财务回报工具,更承担着战略防御、业务赋能和生态卡位等多重作用,是理解腾讯的关键维度之一。

作者将腾讯股权投资的演进分为三个阶段:

  1. 2011—2018 年的移动互联网扩张期:腾讯通过流量与资本双轮驱动,重仓京东、美团、拼多多、富途等项目,既获得高额财务回报,也放大了微信支付等生态能力。
  2. 2019—2023 年的收缩与兑现期:在反垄断和行业红利见顶背景下,腾讯开始减持部分非核心资产,转向更聚焦的投资策略。
  3. 2024 年至今的 AI 与硬科技转向期:腾讯开始明显向大模型、算力、芯片、先进制造、创新药等方向倾斜,试图为下一代技术周期布局。

文章还通过多个案例说明腾讯投资的打法:它倾向于长期持有、深度协同、精选标的,而不是短期投机。无论是京东、美团、富途,还是燧原科技、智谱、MiniMax、摩尔线程等项目,腾讯都在用资本结合场景、云服务和生态资源,强化自身在产业链中的位置。对于一些项目,腾讯获得了极高回报;对于少数项目,也会出现浮亏,但整体成功率相当高。

最后,文章总结称,腾讯的投资版图更像是公司的“战略雷达”和“未来保险单”。在互联网红利逐渐见顶、AI 竞争重新加速的时代,这张看不见的投资清单,正在悄悄决定腾讯还能走多远、下一轮增长从哪里来。

Claude Code与HTML

这篇译文围绕一个核心观点展开:对 Claude Code 这类 AI 智能体来说,HTML 往往比 Markdown 更适合作为输出与交付格式。作者首先指出,Markdown 虽然简单、轻便、便于人工编辑,但当文档变长、信息变复杂后,它在呈现力、视觉层次和分享体验上都开始吃亏。相比之下,HTML 能更好地承载表格、CSS、SVG、脚本、交互控件和图像等丰富信息,因此更适合展示高密度内容。文章用多个角度解释 HTML 的优势:它更清晰易读,文档结构更容易通过标签、选项卡和视觉元素组织;它也更容易分享,因为浏览器天然支持渲染。此外,HTML 还能实现双向交互,例如通过滑块、按钮和参数调节让读者直接与内容互动,这对 AI 生成的报告、规格说明和分析页面尤其有用。作者还强调,Claude Code 之所以特别适合生成 HTML,是因为它能摄取大量上下文,并可结合文件系统、浏览器、Slack、Linear、Git 等外部信息源。文章整体观点很明确:如果文档已经不只是给人‘看’,而是要高密度展示、分享、交互和复用,那么 HTML 可能比 Markdown 更合适。

AI威胁叙事

这篇文章讲的是硅谷资本如何借助政治行动委员会、营销机构和社交媒体网红,把“中国 AI 威胁”包装成一套面向美国普通家庭的传播叙事。作者认为,这不是单纯的反华宣传,而是一场夹杂着政策游说、资本利益和监管博弈的政治传播工程。

文章的重点是:网红视频背后的脚本、资金链和政策文件彼此对应,OpenAI、a16z、Palantir 等硅谷势力既在制造话术,也在推动反监管与政府订单。所谓“打中国”,在作者看来更多是手段;真正想争取的是未来几年美国 AI 政策的真空,以及对本土闭源模型商业模式的保护。

文章最后把这件事放到更大的背景里:很多国家喜欢把内部治理问题转移成外部敌人叙事,而“中国”只是这个全球脚本里最方便的靶子之一。

AI时代PM启示

文章的核心结论是:在 AI 时代,产品经理的价值没有下降,而是从“协调推进”转向了“判断方向、定义成功标准、快速做取舍”。

Anthropic 这类 AI 公司真正的竞争力,不只是模型能力,更是发布速度和组织机制。功能先快速推给用户、再通过反馈迭代,是这篇文章反复强调的重点。

文章也提到,PM、工程师、设计师的边界正在模糊,真正稀缺的是产品品味、第一性原理思考和主动补位能力。与此同时,AI 产品的关键不在于“能不能做”,而在于“是否足够可靠”,因此评估体系和反馈闭环非常重要。

最后,文章把 Claude Code 和 CoWork 的分工讲得很清楚:前者偏代码和测试,后者偏文档、PPT、邮件等非代码任务。整篇文章想表达的是:AI 提高了杠杆,但真正拉动杠杆的,仍然是有判断力和行动力的人。

伯克希尔股东会要点

这篇文章梳理了 2026 年伯克希尔股东大会的核心信息:巴菲特首次退居幕后,阿贝尔正式进入“压力测试”,伯克希尔也开始以更制度化的方式展示接班后的治理结构。

文章重点提到几件事:巴菲特看好阿贝尔的接班能力;伯克希尔仍坚持少数核心持仓和长期主义;对 AI 的态度是“有用才用”,不会为了 AI 而 AI;同时也强调了 AI 带来的网络安全风险和数据中心用电需求。

整体来看,这场股东大会传达出的信号是:伯克希尔会继续保持资本配置纪律、现金安全边际和人类判断优先的原则,只在能创造真实价值的地方谨慎使用 AI。

伯克希尔股东会看点

这篇文章围绕伯克希尔 2026 年股东大会总结了几个重点:阿贝尔正式接过更多公开职责,巴菲特继续强调长期持有、资本纪律和现金安全边际,伯克希尔则保持以少数核心持仓为锚的投资策略。

文章还强调了 AI 在伯克希尔的使用原则:只在真正创造价值的地方部署,不追求概念化跟风;同时也承认 AI 会带来网络安全风险,以及数据中心和电力需求带来的新增长机会。

总体来说,这篇文章表达的是一种很典型的伯克希尔风格:审慎、克制、重视人类判断,接受技术变化,但不为技术本身而改变基本原则。

DeepSeek新论文揭秘

本文介绍了 DeepSeek 被撤下的一篇多模态新论文《Thinking with Visual Primitives》。文章的核心观点是:当前多模态大模型面临的不只是“看不清”,还包括“引用鸿沟”——即模型即使识别出了图像内容,也很难在推理过程中稳定、精确地指向图中的具体对象。

作者把问题拆成两个层面:一是感知鸿沟(Perception Gap),即模型看图分辨细节的能力;二是引用鸿沟(Reference Gap),即模型在思考时能否准确把注意力锚定到图中的某个点或区域。前者过去两年主要靠高分辨率、裁切、分块等方式改进,但后者更像是视觉推理真正卡住的地方。

DeepSeek 的思路很朴素:给模型“装一根手指”。具体来说,就是让模型在推理过程中输出点和框等空间坐标,把它们当作认知锚点,模拟人类“边指边想”的方式。文章用“数手指”作类比,说明当目标很多、空间关系复杂时,仅靠语言描述很容易丢失上下文,而点选/框选可以让推理更稳定。

文章认为,这篇论文之所以引人关注,不只是因为它提出了一个可能有效的新路径,也因为它暗示多模态模型的下一阶段竞争,未必只是更清晰地“看见”,而是能否更准确地“指认”与“定位”。

达利欧谈美股与AI

本文整理了桥水基金创始人达利欧的最新观点,围绕美股新高、地缘冲突、美联储政策以及人工智能的影响展开。文章核心在于:当前市场表面繁荣,但背后同时受到高估值、宏观政策不确定性和地缘政治风险的共同影响。

在美股方面,达利欧强调高位市场并不等于低风险,投资者需要警惕估值偏高与情绪过热带来的波动;在货币政策方面,美联储的利率路径仍是影响市场的重要变量,降息预期、通胀走势与经济韧性彼此牵制。

文章还提到地缘冲突对全球资产定价和供应链的扰动,以及人工智能对生产率、产业结构和资本市场的长期重塑作用。整体来看,这是一篇从宏观与资产配置角度解读当前市场环境的评论,强调在不确定性上升时要保持分散和谨慎。

Karpathy访谈:Agentic Engineering

这篇访谈围绕 Karpathy 对 AI 编程范式变化的判断展开。

他认为自己在 2025 年底明显进入了“Vibe Coding”状态:让模型持续生成、修改、调试代码,自己很少再逐行纠错。

更重要的是他把 LLM 看成 Software 3.0:真正的编程不只是在代码里,而是在 prompt、context window、工具调用和外部环境之间组织给模型执行的上下文程序。

他用 MenuGen 说明一个典型变化:很多原本需要多步骤 App 才能完成的任务,可能会被模型原生能力直接吞掉,旧式中间层不一定还有存在价值。

在能力边界上,Karpathy 强调 LLM 是“锯齿状智能”:它可以重构大规模代码、做出高难度推理,也可能在非常基础的常识题上出错。

因此,Agentic Engineering 的重点不是盲目外包思考,而是理解系统结构、把控质量、安全和责任边界,并学会正确指挥 Agent。

他对未来的想象是:神经网络可能逐步成为主进程,传统 CPU/软件成为协处理器,产品形态会围绕模型的理解和生成能力重新组织。

AI开放终局焦虑

这篇文章把当前 AI 竞争描述成一场“看不见终点的蒙眼狂奔”。作者认为,真正困扰人的不是 AI 能力本身有多强,而是整个社会、公司、个人和投资人都被卷入一个开放终局的囚徒困境:任何单个主体都很难停下来,因为一旦停下就可能被别人超越。

文章指出,AI 竞争已经从“工具增效”进入“生产函数替代”和“组织结构重写”的阶段。很多团队表面上做了更多功能、烧了更多 token、用了更多 agent,但并没有同步带来营收、PMF 或真正的商业兑现,这说明 token 消耗并不等于生产力落地。

作者进一步提出,今天的焦虑并不是普通的进步焦虑,而是基因层面的不确定性焦虑。人类面对食物、猛兽、部落等风险时,风险边界是清晰的;而 AI 时代的风险是世界模型本身不稳定,技能半衰期变短,努力的回报路径也变得不再可靠。

文章把这种局面拆成多层囚徒困境:公司担心不 AI-native 会死,员工担心不学 AI 会被替代,投资人担心错过下一轮范式,国家担心在竞争中落后。于是大家都在不断加速,但这种加速更多是恐惧驱动,而不是明确的理性乐观。

在员工视角里,最残酷的悖论是:为了避免被替代,人必须用 AI 提升自己;但提升自己的过程,又会把经验显性化、模板化,反过来加速岗位压缩。过去“努力—积累—升值”的稳定逻辑正在变成“学习—被吸收—再学习”的循环。

文章也批评了资本市场的失锚:不投 AI 怕错过,乱投 AI 也可能踩空,于是估值框架、风险偏好和行业叙事都被焦虑牵引。作者认为,当前的虚无感并不只是情绪问题,而是一个重要的社会信号,意味着 AI 叙事正在从惊叹和追赶,走向焦虑、反噬和制度重构。

最后,文章强调真正的解法不是跑得更快,而是重新建立控制感。与其试图消灭不确定性,不如构建一个能够持续更新的世界模型,把状态识别、证据更新、反证机制和行动路由系统化。未来真正稀缺的,不是会不会用工具,而是在持续变化中仍能保持判断、节奏和主体性的精神结构。

AI知识库难用

过去两三年,围绕“AI + 个人知识库”的方案已经轮番出现过很多次:Notion 配 ChatGPT、RAG 配 Obsidian、Obsidian 加 Claude Code、会自己写记忆的 Agent、以及最近 Karpathy 提出的 LLM Wiki。作者试过不少方案,但结论是:它们都不算真正解决了“长期知识状态”问题

一、问题不在“存”和“搜”

作者认为,很多人把个人知识库理解成“把资料存好、让 AI 能搜出来”,但这其实只覆盖了最表层的需求。

真正麻烦的是:

  • 一条判断什么时候生成
  • 凭什么成立
  • 什么时候过期
  • 与旧判断冲突时怎么办
  • 能不能追到证据
  • 模型有没有权力把自己的总结直接写成长期事实

也就是说,难点不是检索,而是长期知识状态的维护

二、四类“记忆”其实不是一回事

作者把大家常混在一起说的“记忆”拆成四层:

  1. 文档知识库:Obsidian、Notion、RAG,负责存放和检索资料
  2. 会话上下文管理:摘要、压缩、裁剪,解决长对话塞不下的问题
  3. 智能体记忆运行时:长期运行的 agent 什么时候读、写、审核、冻结记忆
  4. 个人知识状态系统:关于一个人或项目的长期知识,如何多年保持准确、可审计、可演化

作者的判断是:现在很多产品本质上只是拿第一层工具,去硬做第四层的事情,所以总会卡住。

三、RAG / Obsidian 能查,但不能积累

RAG 和 Obsidian 的优点很明显:资料能找出来,主题能搜到。但它们本质上是检索系统,不是知识维护系统

它们的问题在于:

  • 今天的判断不会自动继承到明天
  • 过期内容不会自动失效
  • 多份资料冲突时,系统不会主动处理
  • 很难知道某个结论到底来自哪段原文

所以它们越用越像资料仓库,而不是“越来越懂你”的系统。

四、让模型自己写记忆,也会出问题

第二类方案是让 AI 自己总结、自己沉淀、自己升级长期存储。看起来很自然,但作者认为这里有个危险假设:模型既负责提议,又负责决定什么是真相

他提到一个典型事故:用户让 agent 整理邮箱,并明确说“确认前不要执行任何动作”。但在后续上下文压缩里,这条关键约束被丢掉了,于是 agent 继续按自己的理解执行删除操作。

这个问题的本质不是“忘了一句话”,而是:

  • 安全约束
  • 审批合约
  • 长期偏好
  • 临时任务
  • 会话摘要

这些本不该混在一条链路里,但很多系统把它们都交给模型自己总结,最终就会把关键约束压没。

作者的结论很明确:模型可以提议,但不能由模型自己决定长期事实和危险动作

五、Hermes 做对了“运行时”,但还不够

作者认为 Hermes 这一类系统已经比前两类成熟很多,因为它真的把记忆当成一个运行时子系统来做,而不是“顺手加的功能”。

他特别认可的点包括:

  • 会话开始时冻结记忆快照
  • 记忆同步是异步管线,不在主回答链路里硬做
  • review 由独立的 quiet agent 处理
  • 记忆提供方可以抽象成多个 provider

但作者也指出,Hermes 主要解决的是“一个长期跑的 agent 怎么稳定携带工作记忆”,还没完全解决“个人多年积累的知识状态怎么编译成可审计、可演化、可投影的长期知识”。

六、Karpathy 的 LLM Wiki:进步了,但证据容易变软

Karpathy 的思路比纯 RAG 更进一步:不是每次问问题时才临时综合,而是让系统持续维护一份 wiki。

作者自己也本地实现过类似方案,刚开始效果很好,似乎能回答很多“我有哪些项目、我有什么习惯、资料之间有什么关联”这类问题。

但问题很快出现:AI 开始越来越依赖维基,而不是原文。

而维基的弱点在于:

  • 它是综合结果,不是事实源
  • 综合过程是有损的
  • 细节会丢失,解释会被加重,弱关系会被写成强关系
  • 用久了以后,很难追回原始证据

所以作者认为,维基可以是很好的投影,但不能当底层事实源。

七、真正需要的是“知识状态运行时”

作者最终把问题重新定义为:

如何在有限上下文、变化的世界、不可靠的抽取器之间,维护一份可验证的知识状态?

他给出的方向不是“更聪明的模型”或“更漂亮的笔记软件”,而是一套更完整的系统:

  • 原始资料进入系统
  • 变成可追溯的观察
  • 模型提出候选主张
  • 主张绑定证据、时间和风险等级
  • 低风险自动接受,中高风险进入审核
  • 通过后的主张进入长期状态
  • 对话、维基、报告、上下文包都从同一份状态投影出来

他强调的核心是:模型负责提议,系统负责权威

八、记忆系统至少要有四个关键层

1. 统一的运行时边界

记忆不能散落在各处读写,而应该由一个专门层统一负责什么时候读、什么时候写、什么时候进 prompt、什么时候后台处理。

2. 冻结快照

一场对话开始后,系统应该使用同一份记忆视图,不能中途因为后台更新而让模型看到不同版本。

3. 候选门

不是所有看起来“值得记住”的内容都能直接成为长期记忆。尤其是关于人的判断,应该默认高风险,先进入候选区。

4. 版本与可观测性

被编辑、替换、审批的记忆都应该保留版本历史,并且能追踪它为什么存在、什么时候生效、用了哪些证据。

九、知识层和权限层要分开

作者认为,记忆系统还有一个常被忽略的问题:记忆做对了,权限做错了一样会出事

所以至少要分清四种权力:

  • 事实写入权
  • 约束写入权
  • 工具执行权
  • 危险动作审批权

其中最关键的原则是:危险动作不能由模型自己批准自己

十、怎么判断这套系统真的变好了

作者目前关注的几个指标是:

  • 长期主张能不能追到原始资料
  • 新资料和旧主张冲突时,系统能不能发现
  • 过期主张能不能降权或失效
  • 同一场对话里的记忆是否稳定
  • 审核负担是否过重
  • 不同视图是不是都来自同一份状态源

他认为,判断一个个人知识系统,不能只看回答漂亮不漂亮,还要看它能不能解释自己为什么这么答,能不能回到证据,能不能发现冲突,能不能在时间里保持稳定。

结语

这篇文章的核心观点很清楚:“个人知识库”这个词太轻了,我们真正需要的可能是一个“知识状态运行时”

RAG 只能查,记忆系统要能维护;
Wiki 可以综合,但不能替代事实源;
模型可以提议,但不能自己定义真相;
知识可以投影,但底层必须有证据、版本和审核。

作者最后的判断是:这件事不会靠换一个更聪明的模型,或者换一个更漂亮的笔记应用来解决。它需要一整套能长期运行、可验证、可审计的系统设计。

Manus撤销交易

这篇文章围绕 Manus 被要求撤销交易这一事件展开,核心不是单纯讨论一笔并购,而是在讲:AI 时代创业公司的位置、身份、合规和技术归属,已经变成比融资故事更重要的问题

一、这不只是一次交易失败

作者认为,这次事件的重点不在于 Manus 少拿了多少钱,而在于它传递出一个非常明确的信号:过去那套“在中国起步、融资拿美元、主体放离岸、最后去美国退出”的默认剧本,在 AI 时代可能已经失效。

他把这件事看成一种旧世界模型的崩塌:

  • 以前创业公司更像纯商业主体,主要看产品、增长、估值和退出
  • 现在 AI 已经被放进国家竞争、技术边界和产业控制的框架里
  • 因此公司不再只是公司,它的位置会被重新审视

二、AI 时代,位置比能力更重要

文章反复强调一个判断:在大时代里,最重要的不只是能力,而是位置

作者问了几个很尖锐的问题:

  • 你站在哪里?
  • 你向谁证明价值?
  • 你把技术资产交给谁?
  • 你最终属于哪个体系?

他认为,创业者可以换注册地、换办公室、换融资口径,但很难换掉自己的生长史。公司在哪里长出来、谁贡献了核心人才、谁给了第一波流量和关注,这些都会成为身份的一部分。

所以 Manus 的问题不是“想不想国际化”,而是“你到底从哪里来、最终要站在哪边”。

三、不能既要、又要、也要

作者的态度很直接:全球化可以,但套利不行;出海可以,但切割不行。

他认为,创业者如果真想做一家美国公司、新加坡公司或欧洲公司,就应该从第一天开始在那边注册、融资、招人、接受监管,而不是先吃中国生态红利,等做大后再包装成“非中国资产”卖给美国巨头。

他把这种中间状态视为最危险的路:

  • 出发时要中国速度
  • 融资时要美元估值
  • 传播时要全球化光环
  • 退出时要美国接盘

在和平周期里,这种模糊可能被看作聪明;但在冲突周期里,这种模糊就是风险。

四、这对中国 AI 创业生态意味着什么

作者认为,这次事件之所以重要,是因为它会形成示范效应。

如果 Manus 这条路被默许,那么后面会有更多中国 AI 创业者走同样路径:

  • 在中国技术生态里起步
  • 做出声量后搬去离岸地区
  • 最后被美国大厂收购整合

而这对中国 AI 生态来说,会是一个很坏的信号,因为它会鼓励“先吃红利、再切出去”的路径成为默认选择。

所以从系统角度看,这不是一个单独公司的问题,而是对一种创业路线的否定。

五、AI 时代的竞争,已经不是上一代互联网逻辑

作者认为,很多创业者还在用上一代互联网的逻辑理解 AI:

  • 以为本质还是资本游戏
  • 以为只要产品好、增长快,就能自然完成全球化
  • 以为技术可以和国家边界脱钩

但他认为 AI 不是团购、外卖,也不是短视频推荐算法升级,而是会变成下一代软件入口、智能体工作流和产业分工的关键资产。

因此,今天处理 AI 公司,不能再只看商业路径,还要看:

  • 技术归属
  • 产业位置
  • 监管边界
  • 国家竞争关系

六、这篇文章真正的核心:战略判断

文章最后落到一个很明确的结论:创业者最重要的能力,不是只会往前冲,而是要看清自己站在哪里

作者认为:

  • 如果选择美国公司,就一开始就在美国做
  • 如果选择新加坡公司,就一开始在新加坡做
  • 如果选择中国公司,就承认自己在中国体系里,想清楚自己的责任和代价

他说,时代重新划线的时候,位置会决定很多东西:融资、退出、并购、合规、团队流动,甚至公司身份本身。

结语

这篇文章的语气很强,但核心观点其实很简单:

AI 时代的创业,不再只是做产品和讲故事,而是先回答“你是谁、你从哪里来、你站在哪个体系里”

作者给创业者的提醒是:

往前跑,别回头。

不是因为前面一定安全,而是因为回头的那条路,已经不在了。

霍华德学AI

这篇文章围绕橡树资本联合创始人霍华德·马克斯如何看待和使用 AI 展开。作者借助霍华德自己用 Claude 完成的一篇长备忘录,系统梳理了他对 AI 本质、最新进展、投资影响、泡沫判断与社会冲击的思考。

一、霍华德如何理解 AI

霍华德最核心的认识是:AI 不是搜索引擎,而是能综合信息、进行推理的系统。他把 AI 的生命过程分成两个阶段:

  • 训练:模型通过海量文本学习推理模式、论证结构和概念组合方式
  • 推理:模型在接到提示词后,利用已有能力回应用户任务

他特别强调,AI 的关键不只是“记住了多少信息”,而是学会了“如何思考”。因此,提示词质量非常重要;很多人低估 AI,不是因为模型不行,而是因为自己不会提需求。

二、AI 正从聊天工具变成劳动替代品

文章里用一个很清晰的三阶段模型描述 AI 的演进:

  1. 聊天式 AI:回答问题,节省思考时间
  2. 工具型 AI:会搜索、分析、执行任务,开始节省执行时间
  3. 自主代理:用户只给目标和约束,AI 自己完成任务并交付结果

霍华德认为,真正重要的变化在于第三层。到这一步,AI 不再只是辅助人类,而是开始替代劳动力,这也是为什么它的经济影响会突然变得巨大。

三、AI 的发展速度前所未有

霍华德反复强调一个判断:AI 的普及速度远快于历史上的计算机和互联网

他拿计算机的发展做对比:从 ENIAC 到个人电脑普及,经历了几十年;而 AI 从“看不见的基础能力”到“被大众广泛使用”,只用了很短时间。他认为这意味着两件事:

  • 企业和个人适应 AI 的时间窗口非常短
  • AI 带来的变化会在社会还没完全准备好的情况下迅速发生

四、AI 可能重塑软件、工作和安全边界

霍华德对 AI 的一个重要担忧,是它会同时冲击多个领域:

  • 软件开发:很多结构化工作会被 AI 接管
  • 安全与漏洞发现:AI 可能让系统漏洞暴露得更快
  • 反爬与对抗:网站会越来越难用传统手段区分人和机器

他并不把 AI 看成“只会提高效率的工具”,而是更像一种会改变规则的技术。尤其是当代理能力增强后,AI 可能会开始做过去根本没有自动化想象空间的任务。

五、他怎么看 AI 的局限

尽管态度偏乐观,霍华德也明确写出了 AI 的局限:

  • 它在真正全新的情境里不一定可靠
  • 它有幻觉,未必知道自己不知道什么
  • 它仍然会犯错
  • 它的上下文窗口有限,记忆并不完整
  • 它可能让人过度信任其输出

他认为,AI 很强,但并不是“无所不能的思考机器”。尤其在缺乏历史模式、需要直觉和主观判断的领域,人类仍然有价值。

六、AI 对投资意味着什么

在投资层面,霍华德的判断很有代表性:

  • AI 很擅长处理量化信息、识别历史模式、保持冷静
  • 但伟大的投资并不只依赖数据,还依赖对定性因素的判断
  • 比如管理层、产品创新、合作方、时机、直觉等,都不是简单模式匹配能完全替代的

他的结论是:AI 会提高投资门槛,但不会完全消灭优秀投资者的价值。未来真正能胜出的,仍然是那些能判断信息意义、理解定性因素、并对新环境做出高质量猜测的人。

七、这是泡沫吗?他的态度很克制

霍华德对“AI 是不是泡沫”这个问题的回答并不极端。他的态度是:

  • AI 技术本身是真的,不是幻觉
  • 市场需求也是真的,而且增长很快
  • 但基础设施投资是否过度、资产价格是否合理,仍然不能轻易下结论

所以他不建议:

  • 全仓押注
  • 也不建议完全离场

更合理的做法是:保持适度仓位,同时精选标的、保持审慎

八、他最担心的是就业与社会冲击

文章最后一部分转向社会层面。霍华德真正担心的,不只是技术和估值,而是AI 带来的失业与身份感危机

他引用了大量例子说明:

  • 软件、广告、驾驶、分析、合规等岗位都可能被重塑
  • AI 替代的不是一两个岗位,而是很多结构化知识工作
  • 社会可能来不及为被替代的人创造足够快的新工作

他也讨论了乐观派的说法——历史上每次技术革命都会创造新岗位——但他并没有完全相信这种外推。他的态度是:希望自己是错的,但不能假装风险不存在

总结

这篇文章最有价值的地方,不在于它给出了某个单点结论,而在于霍华德用一个非常成熟的投资框架,去理解 AI 这场技术革命:

  • 它是真实的
  • 它发展极快
  • 它已经开始替代劳动
  • 它会影响投资、软件和社会结构
  • 但它仍然有局限,仍然不能被神化

整体上,这是一篇很典型的“老练投资人学习 AI”的笔记:既有好奇心,也有克制;既承认机会,也不回避风险。

Agent 动力学

这篇文章是 42 章经对 RC 的访谈,核心围绕三个主题展开:CLI 时代为什么重新兴起、Agent 产品该如何设计、以及多 Agents 协作的组织形态会怎样演化。整篇对话的信息量很大,重点不是单纯讲一个工具,而是在讨论「人和 AI 如何一起工作」这件事。

1. CLI 为什么会重新火起来

RC 认为,CLI 之所以再次变得重要,是因为它对 Agent 更友好。相比图形界面,命令行天然是文本化、结构化的,更适合大模型理解和操作。随着 Agent 能力提升,过去只适合人类直接使用的 GUI,反而不一定是最优入口。

他强调,今天的 CLI 已经不只是“给人用的命令行工具”,而是开始变成“给 Agent 用的工作界面”。因此,输入要尽量简洁、明确,输出要尽量稳定、高密度、可被机器直接读懂。

2. Kimi CLI 和“本地 Agent harness”

RC 回顾了自己做 Kimi CLI 的经历。他并不认为 CLI 是 Agent 的终局形态,但它是一个很好的起点,因为可以先把最底层的本地执行框架做扎实:

  • 先有一个最小可用的 agent loop
  • 先接入 bash tool
  • 再逐步补充更多 built-in tools
  • 再基于这套 harness 封装 SDK,扩展到 Web UI、VS Code 插件等形态

他很看重这种“从第一性原理往上搭”的方式,认为这样更容易发现新的 insights,也更容易把能力沉淀成可复用的底座。

3. 模型能力提升后,安全与反爬都会被重写

文章里有一段很重要的判断:当模型能力继续提升,很多原本依赖“人类行为差异”的防线会被削弱。RC 认为,不论是安全漏洞扫描,还是网站反爬,Agent 都会越来越强,甚至会反过来逼迫防守方升级。

他提到,未来模型如果足够强,可能会让底层软件、编译器、内核、浏览器等系统暴露更多漏洞;而防守和修复往往跟不上攻击速度。类似地,网站也会越来越难依靠传统交互方式来区分人和机器。

4. Slock:不是单个 Agent,而是多人 + 多 Agents 的协作平台

RC 重点介绍了他创业后在做的 Slock。它不是一个“单一全能 Agent”,而更像一个人和多个 Agents 协作的工作空间

他认为,今天的 Agent 使用形态会越来越接近组织协作,而不是单人问答:

  • 需要通信:人和 Agent、Agent 和 Agent 之间要能沟通
  • 需要分工:任务发出后要有 claim / lock 机制,避免重复抢活
  • 需要共享:不同 Agent 的沉淀要能被其他人和 Agent 复用

他把这套机制类比成一种“AI 版飞书”,但底层逻辑更偏 Agent-first。

5. 多 Agents 协作的“动力学”

文章里最有意思的概念之一是“Agent 动力学”。RC 认为,当多个 Agent 长期协作时,它们不只是各自拥有 memory,还会形成一种群体记忆和群体文化,类似组织行为学中的公司文化。

他观察到,不同用户会把 Agent 组织成不同风格:

  • 有的更像协作型团队
  • 有的更像赛马竞争
  • 有的甚至会出现“办公室政治”式行为

这说明,未来 Agent 产品不只是工程问题,也会越来越像组织学、管理学和社会学问题。

6. Memory 比 skill 更重要

RC 对 MCP、skill、prompt 的看法也很明确:

  • MCP 本质上常常只是把 API 再包装一层
  • skill 只是把能力标准化、结构化,方便分发
  • 真正重要的是 memory

他认为,Agent 市场里卖的不是某个固定功能,而是该 Agent 的长期记忆、长期对话、纠偏过程和行为模式。也就是说,用户买到的不是“一个 app”,而更像是“一个会持续演化的工作伙伴”。

7. agent-first 产品设计:让 AI 先看懂,再让人看懂

文章后半段讨论了一个很关键的问题:产品不应该只为人设计,还要为 Agent 设计。

RC 提到,人类看界面是依赖空间结构的,但 Agent 的记忆是线性的 context,因此产品需要考虑:

  • Agent 如何快速定位上下文
  • 新消息如何和旧任务关联
  • 如何把任务摘要、状态、历史记录组织成 Agent 能直接用的信息

他说,真正难的不是把界面做漂亮,而是让“Agent 看到的产品”足够清晰、可执行。

8. 人和 AI 的未来关系

RC 的整体态度偏乐观。他认为未来不会简单变成“AI 取代人”,而更可能是:

  • 顶尖模型厂商越来越重视安全边界
  • 人类和 AI 会在更复杂的组织结构里协作
  • 编程、产品、设计、增长、运营等许多工作都会变成“先说目标,再由 AI 执行”的方式

他甚至提到,很多以前需要程序员才能做的事情,未来会被 top-down 的方式重写:先用 prompt 做出原型,再按需补充更深层的知识。

结语

这篇访谈的价值不在于某个单点技巧,而在于它把 CLI、Agent、Memory、多 Agents 协作、组织结构 这些概念串成了一条线。RC 的核心判断是:未来重要的不是“一个超级 Agent”,而是一个能让很多 Agent 和人一起工作的系统。

如果说传统软件是在为人设计界面,那么这一代产品开始是在为“人 + Agent 共同组成的组织”设计基础设施。

AI出题法

这篇文章讲的是一种很实用的 AI 学习方式:不要只问 AI“这是什么”,而是让它给你出题,逼你先理解,再命名。作者借用 Anthropic 研究员 Amanda Askell 的提示词方法,强调通过故事、延迟命名和反向费曼式训练,来加深对陌生概念的理解。

核心观点

1. 不要急着要定义

作者认为,很多人使用 AI 时,第一反应是直接索要定义或标准答案。但真正有效的学习,不是快速拿到结论,而是让自己先进入理解过程。定义只是压缩过的标签,容易让人停留在表面。

2. 让 AI 先讲故事

文章提出一个很有意思的训练方式:
  • 先找一个本科生不太懂、研究生才懂的小众概念;
  • 让 AI 用三段式故事把它讲出来;
  • 故事里不能直接说出概念名称;
  • 最后再揭晓名称,并反过来对照故事里的每个要素。

这种方法的关键,是把抽象概念重新变成可感知的情境。

3. “延迟命名”能逼出深度理解

作者认为,标签往往是思考的终点。真正有用的是在命名之前,先理解一件事在现实中如何运作。等你先明白了逻辑,再知道它叫什么,理解会更牢固。

4. 高质量问题比标准答案更重要

文中还提到,聪明人的关键能力,不是复述别人给的答案,而是会提出足够具体、足够偏离常规的问题。也就是说,AI 时代的真正竞争力,越来越体现在“会不会出题”。

5. 理解一件事,最好能把它变回故事

文章最后强调,真正理解某个概念,不是会背定义,而是能把它还原成一个有冲突、有取舍、有过程的故事。作者认为这比死记硬背定义更接近真实理解。

可直接使用的提示词思路

文章给了一个可直接套用的模板,大意是:

我想搞懂 [X],但你别直接告诉我定义。先找一个与 [X] 相近但更冷门的原理,用三段故事讲清楚,故事里不能出现概念名;讲完后先别揭晓,先问我它讲的是什么;最后再告诉我 [X] 叫什么,并逐条对照故事和概念。

结论

这篇文章的重点不是某个具体 AI 技巧,而是一种更高阶的学习观:聪明人用 AI,不是为了更快拿答案,而是为了训练自己的思考能力。AI 最适合做的,不是替你思考,而是帮你设计思考的难度。

弹性预训练

这篇文章介绍了 Google 提出的 Decoupled DiLoCo:一种面向超大规模分布式预训练的弹性训练框架,核心目标是在硬件频繁故障、跨地域异构资源、带宽受限的条件下,仍然保持训练可持续推进,而不依赖所有设备严格同步。

文章先解释了传统 SPMD 数据并行的瓶颈:当集群规模扩大到数十万、乃至数百万块芯片时,即便单卡平均故障率不高,整体集群也会因为“规模效应”变得几乎持续在处理故障、重配置和等待。论文给出的模拟表明,在极大规模下,即便采用弹性机制,传统方案的有效吞吐率也会显著下降,大量时间消耗在同步等待和重配上,而不是有效计算。

Decoupled DiLoCo 的思路是把训练系统拆成多个相互独立的学习器(Learner),每个学习器可以自行训练,不需要等其他节点完全对齐;与此同时,引入一个运行在更稳定 CPU 资源上的同步器(Syncer),周期性收集各学习器的更新并做参数合并。关键设计包括:

  • 最小法定数(Minimum Quorum):不必等待全部学习器,只要达到一定数量即可同步。
  • 自适应宽限窗口(Adaptive Grace Window):在达到法定数后,短暂等待更多学习器赶上,以提升每轮合并质量。
  • 按 token 加权的合并机制:避免不同速度的学习器在合并中贡献失衡。
  • 平衡张量分片(Balanced Tensor Fragmentation):把参数拆成大小接近的碎片进行传输,平滑通信压力。

文章进一步展示了实验结果:在极高故障率、超大规模集群下,这种框架能够把有效吞吐率维持在较高水平;在模型质量方面,它在大参数稠密模型和多种文本/视觉基准上的表现,也能与传统数据并行训练保持接近,说明容错能力的提升并没有明显牺牲最终效果。对于混用不同代际芯片的场景,这套方法也能通过异步和宽限窗口机制保持稳定训练。

一个很重要的延伸价值,是它让“捡漏算力”成为可能:临时可用的机器、跨地区零散资源、不同时间段的闲置算力,都可以被纳入训练,而不必像传统数据并行那样为了接入新节点付出高昂同步代价。文章认为,这种“可用性优先”的训练范式,正在从研究思路变成下一代大规模模型基础设施的现实需求。

离开DeepSeek

这篇访谈围绕王子涵的研究经历、在 DeepSeek 的一线实践,以及他对 Agent 方向的长期思考展开。文章先从他在社交媒体上被更多人注意到的经历写起:随着 DeepSeek R1、V3 等模型发布,外界开始关注这家公司和站在一线的研究者,而他选择做的事情并不是包装故事,而是尽量把真实的一线情况讲清楚。文章强调,真正定义他的不是短期“走红”,而是长期持续投入的 Agent system 研究路径。

王子涵的科研路径从人大时期就已经开始显现。他从推荐系统、搜索与信息检索切入,逐步接触强化学习和 Agent benchmark 研究,再到进入 DeepSeek 后围绕 MoE 专家专业化深入探索,后来继续把问题推进到 Agent 强化学习的底层机制。他关心的核心问题很朴素:AI 系统能不能像人一样,在没有持续外部指导的情况下自主学习、自主改进;更进一步,能不能在行动之前,先在内部完成对世界的预演和模拟。

文章还总结了他对“什么是 Agent”的理解:Agent 不只取决于模型本身,更取决于它所处的环境。给它开放的计算机环境,它就更接近 OpenClaw;给它受限的环境,它更像 Claude Code 或 Codex;只给聊天界面,它又更像 GPT。也就是说,环境开放程度决定了 Agent 的智能释放程度。基于这个视角,他希望打造的是能够适应资源约束、把不同规模资源都用出效果的 Agent,而不是只在理想条件下表现出色的系统。

在回顾早期科研经历时,文章写到他从统计学兴趣出发,主动联系老师进入人工智能相关课题组,做推荐系统和搜索算法等较传统的研究。那时的工作很多是手工设计、流程繁琐,但也让他更早感受到 AI 在现实应用中的价值。随后,他在 DeepSeek 看到了更高密度的研究氛围:几乎人人都在做研究相关的事情,工程同事也会积极讨论前沿进展;前辈甚至会逐行帮新同学改代码。这种环境促使他建立起一种“逆向思考”:有些看起来高深的东西未必真的成立,而一些看似工程化的任务,真正做起来反而需要扎实功夫。

整篇文章的主旨可以概括为:王子涵并不是把研究当成单点突破,而是沿着“理解智能—定义环境—改进行动”的链条持续推进。他对 Agent 的关注不是追热点,而是希望通过长期研究,让系统真正具备自主学习、环境适应和资源伸缩能力。

AI范式巨变

摘要

这篇访谈围绕“AI 范式正在发生怎样的巨变”展开,核心人物是罗福莉。文章认为,2026 年是大模型战争的第二幕:行业正在从以 Pre-train(预训练) 为主的 Chat 时代,转向以 Post-train(后训练)Agent 为核心的新阶段。

罗福莉的一个重要判断是:上一个时代的成功,并不意味着下一个时代还能继续领先。随着模型能力逐渐接近,真正拉开差距的,已经不只是基座模型本身,而是围绕模型构建的 Agent 框架、后训练范式、推理系统和组织协作方式。她特别强调,未来的竞争重点将是如何在 Agent 上做好 RL scaling,以及如何把模型能力和框架能力一起推进。

文章中一个非常重要的主题,是她对 OpenClaw 这类 Agent 框架的评价。她认为,一个好的框架应该尽量弥补行动上的缺陷:比如更强的 memory、更丰富的消息通道、更主动的任务执行、更好的多模型协同,以及更完善的评估机制。她一开始也对 OpenClaw 持怀疑态度,但在深度使用后发现,这类框架不仅能显著提升体验,还能把中层模型的能力上限大幅抬高。

在她看来,OpenClaw 之所以令人震撼,不只是因为它“像 Claude Code 加了一个壳”,而是它把 Agent 框架做得足够开放、足够可改、足够厚重。用户可以直接改 memory、multi-agent 流程、skills 和工作流,这种可操纵性会极大激发创造力。她认为,真正强大的不是单一产品界面,而是产品背后那层负责调度、记忆、评估和任务编排的中间层。

文章还讨论了组织层面的变化。罗福莉提到,在新的范式下,团队需要更强的敏捷性和更高的研究效率;同时,资源分配也会改变,后训练的重要性会显著上升。她甚至提到,在顶尖团队中,预训练和后训练的资源比例可能已经接近 1:1。与此同时,组织结构也在变化:更平权、更少层级、更少约束的组织,可能更有利于创新。

另一个值得注意的观点,是她对“自学习”的理解:未来的模型进步,不只是模型单独变强,而是模型和 Agent 框架同步演化。模型在训练中变强的同时,也会反过来改变框架设计,包括静态的 memory、skills,以及动态的调度和工作流。换句话说,真正的竞争不再只是“谁的模型更大”,而是“谁能把模型、框架、组织一起升级”。

体会

这篇访谈最大的价值,在于它把“AI 变革”从抽象口号落到了具体工程和组织层面:模型不再是唯一主角,Agent 框架、后训练、评估体系、组织方式都成了决定性变量。它传达出的信号很明确:下一阶段的领先者,可能不是单纯把模型做得更大的人,而是最会把模型能力转化为系统能力的人。

凯文沃什:他看到了结构性问题,而所有人都在等待答案

这篇文章围绕凯文·沃什(Kevin Warsh)可能代表的美联储改革方向,讨论了一个更大的问题:美联储面对的已经不只是周期性波动,而是结构性环境变化。

核心观点

1. 这不是一场普通的听证会讨论

作者认为,围绕联储独立性、降息与否之类的问题,表面上很热闹,但真正重要的是:联储所处的宏观环境已经变了,不能再简单沿用过去几十年的框架来理解今天的问题。

2. 过去40年的低通胀环境,正在发生根本改变

文章把1980年代以来的全球化、新自由主义和金融自由化,看成一个共同塑造低通胀环境的历史阶段。中国等新兴市场加入全球供应链,提高供给、压低价格,形成了长期的“大缓和”时代。作者认为,这个基础正在松动。

3. 美联储的资产负债表扩张是一种路径依赖

作者重点讨论了 QE、资产负债表扩张和金融机构对宽松环境的依赖,认为联储在低通胀时代形成的工具惯性,到了供给不再充裕、供应链频繁受扰的年代,可能开始显得不合时宜。

4. 沃什的思路更偏向“结构性改革”

在作者看来,沃什并不只是一个传统鹰派,而是想借助科技进步、放松监管、缩减资产负债表等方式,对联储做结构性调整。这里既有周期判断,也有改革冲动:他想面对的是联储和经济更深层的风险,而不只是短期通胀数据。

5. AI 被视作可能的通胀缓冲变量

文章提到,沃什可能相信 AI 能带来生产率提升,从而在结构上压低通胀。作者本人对此保留,但认可把 AI 视为长期技术变量、而非短期政策噱头的思路。

6. 更大的背景是中美竞争与制度重构

文章最后把视角扩大到文明竞争:当世界进入高波动、强对抗阶段,不同国家都会从自身历史制度中寻找改革灵感。作者把美联储改革、中国财税改革等,放进一种更宏观的“结构性应对”框架中。

总结

这是一篇偏评论型的宏观文章,主旨不在于预测某一次利率决议,而在于强调:联储所面对的不是单纯的周期问题,而是全球化退潮、供给结构变化、技术进步和制度惯性共同造成的结构性挑战。文章对沃什的评价是:他至少看到了问题,并且想做结构性改变。

流量 2.0 时代

这篇长文提出了一个核心判断:互联网正在从“流量 1.0”进入“流量 2.0”时代,而这场变化的根本驱动力是 AI 智能体的普及。文章认为,过去互联网的价值逻辑建立在人的点击、停留和注意力之上;而未来的价值逻辑,则会转向智能体的行为、词元消耗和意图完成。

主要观点

1. 流量 1.0 的逻辑正在见顶

作者回顾了流量 1.0 的演变:从电信时代的装机量和通话时长,到 PC 时代的 PV/UV,再到移动时代的 DAU/MAU,以及算法时代的时长、留存和 LTV。文章认为,这套体系在用户规模、使用时长、获客成本和隐私监管上都已经接近极限,增长越来越依赖存量博弈,边际收益持续下降。

2. 流量 2.0 的本质是“智能体行为”而不是“人的行为”

文章最重要的概念转换是:流量的监测对象不再只是用户,而是智能体。未来的关键指标不再只是 PV、DAU、MAU,而是词元消耗、智能体调用量、意图完成率、智能体/用户比等。也就是说,用户可能只说一句话,但背后会触发多个智能体、API、工具链和支付动作,真正产生价值的是智能体完成任务的过程。

3. Token 将取代比特,成为新的流量基本单位

作者认为,AI 时代的基础计量单位是 Token,而不是传统互联网时代的点击、时长或比特。Token 代表的不只是算力消耗,更是智能体工作量和任务复杂度。随着模型价格下降、智能体数量增长,Token 消耗会像当年的移动流量一样,变成刚性支出和商业化入口。

4. AI 原生产品的打法与传统互联网完全不同

文章强调,AI 原生产品不再主要靠界面、漏斗和留存,而是靠对用户意图的理解与对智能体执行过程的编排。传统产品是“人适应机器”,AI 原生产品更像“驯服和组织智能体”。因此,产品能力、评估体系、上下文管理、记忆系统、工作流编排,都会成为新的护城河。

5. 新商业模式从“卖注意力”转向“卖意图完成”

文章把流量 2.0 的变现模式归纳为几类:
  • 智能分级订阅 + Token 超额计费
  • Agent-as-a-Service(AaaS)
  • 意图即交易(Intent-as-Transaction)

也就是说,用户不再只是为软件使用权付费,而是为任务完成结果、生产力提升和智能体执行能力付费。

6. 不同互联网场景进入 2.0 的速度不同

作者将消费互联网场景分成几类:
  • 最先升级:搜索、广告、办公
  • 蓄力转型:电商、本地生活、医疗、金融、内容
  • 时机未到:游戏、智能终端、政务、社交

其中搜索和办公最容易被 AI 重构,因为它们本身就接近信息处理和任务执行;而社交、游戏等领域则更受关系链、版权和产品形态限制。

7. 智能体网络会催生一批全新的基础设施和新入口

文章认为,2.0 不只是把旧场景 AI 化,还会诞生一批 1.0 时代不存在的新物种,例如:
  • Skill 市场
  • 智能体工作环境/沙盒
  • 面向智能体的信息服务
  • 智能体支付与身份安全
  • 智能体记忆与上下文持久化
  • 数字员工
  • 智能体培训与能力定制

这些构成了流量 2.0 的原生入口,也构成了新的基础设施层。

8. 对平台、云厂商和 SaaS 的影响非常大

文章认为,云厂商将从“为人服务的云”变成“为智能体服务的云”;大型平台要同时做 1.0 的 AI 增强和 2.0 的原生产品;中小 SaaS 则会出现明显分化,只有那些掌握独特数据和流程知识的产品才能活下来并升级为技能包或智能体服务。

总结

这篇文章的核心结论是:互联网的下一个时代,不是简单地把 AI 加到旧产品上,而是整个流量、产品、商业模式和价值链都要围绕智能体重构。过去争的是人的注意力,未来争的是智能体的调用入口、任务执行能力和词元经济。文章把这场变化描述为一次范式升级:从“流量 1.0”走向“流量 2.0”。

AI涌现科学

这篇文章是一篇围绕“涌现”展开的长篇科普/演讲整理,核心是试图用复杂系统、信息论和因果分析来解释 AI“思考”背后的科学逻辑。

文章从“涌现”这个概念的直觉出发,先讨论了鸟群、蚁群、神经元网络、木星大红斑等现象,说明宏观层面的秩序并不是简单把微观个体相加得到的,而是在局部交互中“长出来”的。作者认为,理解生命、意识和 AI 时,涌现是一个很重要的视角,因为它能帮助我们从系统本身而不是某种神秘解释出发。

在 AI 部分,文章把“大模型能力突然出现”的现象和“涌现能力”联系起来。意思是:模型规模、数据量和训练强度增加时,某些能力并不是线性增长,而是在跨过某个阈值后突然出现。作者借用了“More is Different”的思想,认为这说明“整体大于部分之和”这句朴素说法虽然有道理,但还不够精确,真正重要的是要说清楚,到底是整体的什么属性,超出了部分属性的简单相加。

为了把涌现变得可度量,文章引入了信息论。比如把鸟群看成一个复杂系统,单个个体的状态可以用熵来描述,而多个个体之间的共享信息可以用互信息和总相关性来衡量。这样一来,就可以用比较严格的方式去量化“系统内部到底整合了多少关联”。文章强调,信息论给了涌现一把可以跨系统使用的“尺子”。

但作者也指出,仅靠信息和相关性还不够。因为有些系统看起来很整齐,却并不是涌现,比如提前编排好的机器人集群表演;而鸟群的协调则是没有中心控制、依靠局部交互自然形成的。要分辨这两类“整齐”,还必须把因果关系带进来。文章因此进一步讨论了“因果涌现”视角:真正的涌现,不只是宏观上看到秩序,还要看这种秩序是否是系统内部因果结构自然生成的。

文中还给出一些生活化例子,比如感冒、机器故障等,说明宏观事件背后的原因不一定能在微观层面一眼看清,但这并不意味着没有因果,只是因果可能需要借助更合适的层次和框架去识别。由此,文章逐步把“涌现”从一个模糊的哲学词,变成一个可以在信息、统计和因果框架下讨论的科学问题。

整体来看,这篇文章的主线是:AI 的“思考”并不是孤立现象,而是复杂系统中涌现的一种特殊表现。要理解它,不能只看模型参数和结果,还要看系统内部的相互作用、信息结构和因果组织方式。

字节跳动与AI

这篇文章围绕字节跳动在 AI 时代的激进布局展开,核心问题是:当 AI 成为新一轮技术浪潮时,字节会是“新入口的创造者”,还是旧入口时代的最大赢家之一。

文章开头就把字节放在整个中国互联网 AI 混战的中心位置。作者认为,春节前后的一系列 AI 大战里,字节是最激进的一家:一边是大模型和视频生成模型的持续投入,一边是豆包、硬件终端、智能助手等产品线的快速推进。文章特别提到豆包手机助手、豆包手机等尝试,认为这类产品直接触碰到了超级入口和流量分发权的问题,因此引发了友商的强烈警惕。

文章接着把中国互联网公司的 AI 路线分成几类:字节更像激进派,阿里更像两线作战的通吃派,腾讯更像保守但会迅速跟进的保皇派,苹果则被拿来当作另一种路径的隐喻——不是直接下注 AI 入口,而是把顶尖模型吸收进自己的硬件和生态系统中。

作者认为,AI 时代真正关键的,不只是模型强不强,而是它会不会重构入口。传统互联网时代的逻辑是“干掉别人的入口,创造自己的入口”;而在 AI 时代,新的入口可能会绕开旧有 App 的界面和分发体系,直接替用户完成操作。这样一来,超级 App 可能从“入口”退化成“履约工具”。

文章大量使用历史类比来强化这一点,比如思科、运营商、苹果、微软、英特尔、柯达等公司在技术范式切换中的不同命运。作者用这些案例说明:技术变革会重新分配价值,曾经的护城河并不一定能在新的时代继续生效,甚至可能被新的交互方式和新的基础设施直接绕开。

在中国互联网内部,作者尤其强调字节的“先行动后思考”风格。相比很多大厂更倾向于把 AI 当作现有产品的插件,字节更像是直接把 AI 当成下一代操作方式来下注,并且在算力、人才和产品实验上都投入很重。文章认为,这种风格让字节在 AI 竞争中占了先手,但也意味着它必须承受更大的战略风险。

整体来看,这是一篇典型的产业观察长文,核心结论不是简单地“字节很强”,而是:AI 正在成为重塑互联网入口、流量分发和商业模式的新力量,而字节之所以被放到焦点位置,是因为它既可能成为这场变革的最大赢家,也可能是最先撞上旧秩序墙壁的那一批公司之一。

注意力算法

这篇文章把“注意力机制”从一个 AI 算法概念,延展成了一个关于人生选择和认知管理的比喻。作者的核心观点是:注意力的本质,就是学习权重分布,并对信息做加权聚合;而人类每天都在以同样的方式管理时间、情绪和行动。

文章开头先用家长会、听到孩子名字的瞬间作为例子,解释什么叫“选择性聚焦”。在机器里,注意力机制会给不同输入分配不同权重;在人脑里,我们也会自动筛掉噪音,只关注最重要的信息。作者借此说明:注意力不是平均用力,而是有选择地把资源投向关键对象。

接着文章把这个概念延伸到日常生活。比如,信息流里你点开哪篇文章、一天里把精力投到哪些任务、你如何和不同的人相处、你怎样学习和成长,本质上都可以看成是在做“权重分配”和“加权聚合”。作者认为,一个人和另一个人的差别,很大程度上就体现在注意力系统是否更高效、更敏锐。

文章随后提醒注意力系统也会失灵:短视频、标题党、焦虑型内容,会劫持人的注意力,把低价值信息伪装成高权重;另一个问题是过度关注短期压力,忽略长期更重要的事情;再一种失败则是对一切都平均对待,最终陷入平庸。作者把这些问题看成是“注意力算法”发生了偏差。

最后,文章给出的建议很直接:要主动训练自己的注意力机制。首先明确自己的长期目标,相当于定义“查询向量”;其次把时间和精力优先投向高价值信息源;然后定期复盘和调整,像模型训练一样不断修正权重;同时要学会屏蔽低价值噪声,为专注创造空间。

整体来看,这是一篇把 AI 术语生活化的散文式文章。它不讨论复杂的数学,而是借注意力机制提醒读者:在信息过载的时代,真正决定人生走向的,不只是你知道什么,更是你持续把注意力放在哪里。

AI扩散方向

这篇文章讨论的是 AI 行情在前期光模块、光通信等强势方向之后,后续还有哪些板块可能继续扩散。作者认为,本轮科技风格回归并不只是估值修复,而更偏向业绩验证后景气预期上修,因此具备一定持续性。

文章指出,当前 TMT 板块整体并没有积累过多超额收益,但光通信等绩优方向已经出现成交过热迹象,所以后续需要更加关注板块内部的扩散机会。换句话说,主线还在,但资金会从最强的细分方向逐渐向其他低位高景气品种扩散。

作者从四个维度筛选扩散机会:一季报亮点、年初以来盈利预期变动、海外映射、国内催化。基于这些维度,文章把继续受益的方向分成北美算力链、国产算力与 AIDC 基础设施、中下游软件服务和端侧应用等几大类。

在上游硬件里,文章继续看好 PCB、光模块、液冷、服务器、存储芯片等方向,同时也强调电力电网、算力租赁等 AIDC 配套设施的重要性。作者认为,这些方向虽然不一定最先启动,但在业绩和景气支撑下,仍有补涨空间。

在中下游环节,文章把 AI 编程、办公软件、游戏、金融科技、智慧医疗、消费电子等列为值得关注的低位绩优方向。它的逻辑是,当上游算力形成共识后,产业链利润和市场注意力会逐步向软件应用和终端产品扩散。

文章还特别提到 DeepSeek V4 可能带来的边际催化,认为其国产化、多模态和编程能力上的突破,可能进一步抬升国产算力和国内应用链的预期。作者因此建议,后续可以更关注国产芯片、半导体材料设备、算力租赁、电力电网以及多模态相关应用。

整体来看,这是一篇偏策略框架的行业研究摘要,核心不是推荐单一股票,而是告诉读者如何从“光”向“AI内部其他方向”寻找轮动机会。它传递的判断很明确:如果科技行情继续向前推进,扩散大概率会围绕算力、国产替代、应用落地这三条线展开。

创始人模式抗病

这篇文章讲的是“创始人模式”如何被一群身处疾病中的创始人、医生和公众人物用来对抗癌症、帕金森和渐冻症等重大疾病。文章从蔡磊用 AI 克隆自己声音发言的画面切入,说明当肉身失去行动能力时,人仍然可以借助技术继续发声、继续推动事情向前。

文中主要讲了五个故事。第一个是 GitLab 联合创始人 Sid Sijbrandij 把自己的骨肉瘤治疗过程“开源”,公开了 25TB 医疗数据,并用类似创业公司的方式管理自己的治疗。第二个是医学生 David Fajgenbaum 用自己的血液和组织样本做实验,发现异常通路后借用已有药物救回了自己,之后又创立 Every Cure,把这种经验系统化为老药新用的平台。

第三个故事是 Michael J. Fox。文章回顾了他在确诊帕金森后隐藏病情、再到成立基金会筹集 25 亿美元、推动帕金森生物标志物研究的经历,强调他把个人命运转化成了推动整个领域进步的长期工程。

第四个故事是谷歌前高管 Jeff Huber 因妻子癌症去世而投身 Grail,希望通过早筛产品让类似悲剧更早被发现。第五个故事是蔡磊,他在确诊渐冻症后搭建研究团队、推动患者数据平台、亲自上临床试验前线,虽然很多努力救不了自己,但却在为后来的患者修路。

文章也认真讨论了反对意见,包括资源不平等、单一样本问题以及某些疗法对创始人本人并不适用等质疑。但作者的立场是:这些人的尝试值得支持,因为很多医学突破本来就是从少数人先跑通开始的,之后才逐步扩散到更多普通患者。

整体来看,这是一篇把创业精神、个人命运和医学创新放在一起讨论的长文。它想表达的是:在面对高致死率、高不确定性的疾病时,真正重要的不只是等待制度救援,而是有人愿意像创办一家最重要的公司一样,去长期、主动、系统地对抗疾病。

滞胀下的配置

这篇文章整理了大朴资产创始人颜克益对当前通胀与滞胀环境的看法,核心问题是:在新一轮供给冲击背景下,传统股债配置和大类资产应该如何调整。文章认为,这轮危机更像历史上的石油危机,而不是需求过热或单纯财政刺激引发的通胀。

作者首先回顾了从 1973 年以来的多次滞胀历史,并把它们大致分成供给冲击、需求拉动、以及财政和货币刺激三类。颜克益认为当前属于典型的供给冲击,和 1973-1974、1978-1980 的石油危机更相似,但这次的特点是冲击范围更广、封闭性更强。

文章还指出,与历史相比,本轮危机有两个显著差异:一是美国已经变成全球第一大产油国,二是中国新能源发电占比明显提升,因此中美两地的受影响程度相对有限。相较之下,中东国家、日韩和欧洲将承受更大的边际冲击。

在资产配置上,文章认为油价短期很难大幅回落,可能会在较高区间维持一段时间。基于这种判断,能源替代逻辑会更加重要,新能源链条中的光伏、风电和储能等方向有望受益。

文章同时强调,这类滞胀阶段往往会叠加产业逻辑,而不仅仅是宏观逻辑。作者举例说,历史上医药、互联网和保险等板块在不同滞胀周期中表现较好,而这一次最强的产业逻辑则可能是 AI。

因此,文章的整体建议是:在油价高位和通胀压力持续的环境下,重点关注能源、保险以及与 AI 相关的资产,同时留意新能源替代和产业周期共振带来的机会。

整体来看,这是一篇偏宏观策略的市场观点整理,主旨是把当前局势理解为“供给冲击型滞胀”,并据此推演权益和大宗商品的相对受益方向。它的逻辑不复杂,但结论很明确:在高油价和再通胀环境里,不能只看宏观,还要看谁有产业增长的附加逻辑。

DeepSeek开启融资

这篇文章讨论的是 DeepSeek 计划开启外部融资,以及这背后可能意味着什么。作者先回顾了 DeepSeek 在 2025 年初爆火后的资本关注度:梁文锋一度非常低调,拒绝了不少投资机构的接触,但这次却传出要首次寻求外部资金,目标估值超过 100 亿美元、融资至少 3 亿美元。文章认为,这标志着 DeepSeek 长期坚持的“自我供血”模式可能开始变化。

作者把这次转向解释为多重因素叠加的结果。其一是资金压力和模型研发成本持续上升;其二是核心人才流失和新模型进展受阻,让外部融资显得更有必要;其三是行业竞争已经进入更残酷的新阶段,初创公司单靠内部资源很难持续跟大厂和全球头部模型竞争。文中还提到 DeepSeek 在 V4、国产芯片适配、算力投入上的进展与压力,说明它已经从“低成本高效率”的阶段,走到了“必须规模化投入”的阶段。

文章还写了投融资圈对梁文锋的“追逐”现象。自 DeepSeek 出圈之后,很多机构都在反思自己为什么没投进去,甚至到处托关系想见到梁文锋。作者借此强调,DeepSeek 的价值不仅在于模型能力本身,也在于它成为了资本和产业链共同关注的焦点。

整体上,这篇文章想表达的是:DeepSeek 这次融资不仅仅是“缺钱”,更像是公司从封闭研发走向更大规模、更开放治理的一次结构性转折。它背后反映的是 AI 竞争进入新阶段:算力更贵、人才更贵、追赶更难,想继续保持领先,就必须接受外部资本和更大规模资源的介入。

大伟哥的成长与创业

这是一篇米哈游联合创始人、董事长兼 CEO 刘伟在上海交通大学的演讲实录整理。文章从他的大学经历讲起:他来自农村,初到上海交大时既惶恐又自卑,早年几乎把全部精力都放在刷题和 GPA 上,对大学生活并不满意。后来他在校园里接触到一些“非典型交大人”,看到了除了学业之外的多种人生路径,这些经历让他逐渐意识到,人生不只有一条标准答案。

文章重点讲了他从学生到创业者的转变。研究生阶段,他一度认为自己不适合做科研,于是尽快完成学业要求,并在深圳短暂接触创业环境。之后,他在朋友邀请下加入米哈游,开始承担技术之外的管理和协调工作。作者把这一段总结为“Connecting the dots”——很多关键机会往往不是预先规划出来的,而是在一次次看似无关的经历中慢慢连起来的。

演讲后半部分主要是在给交大学生和年轻人提供方法论。刘伟认为,面对 AI 时代和职业焦虑,最重要的是先弄清自己真正想做什么,而不是过度追逐外部最优解。他强调要立即行动,因为很多焦虑其实来自“想得太多、做得太少”;与此同时,目标也要反向拆解、量化推进,像高考复习一样把复杂任务分解为可执行步骤。

他还反复强调“想象力”比单纯执行力更稀缺。AI 会让执行越来越快,但真正能创造增量的,是那些愿意做出不同选择、能提出独特问题的人。文章也提到,米哈游在招聘和项目推进上越来越看重 demo 和实际成果,而不是单纯看资历。最后,刘伟把未来游戏的方向总结为“千人千面”的个性化体验,并认为这一变化在未来两到三年就会出现。

整篇文章的主线很清晰:人生不需要活成标准答案,创业和成长都不是线性规划出来的,而是在不断行动、不断试错、不断自洽中逐步形成的。对年轻人来说,最重要的不是立刻看清全部未来,而是把眼前的事做好,并相信这些点滴最终会连成自己的路径。

万字长文!两栖模式构建Agent,与OpenClaw/Hermes不一样的解法——开源AmphiLoop

这篇文章介绍了一个名为 AmphiLoop 的开源 Agent 框架,作者把它概括为“世界上第一个决策与执行解耦的 Agent”。
文章首先强调,传统 Agent 往往把思考、规划和执行混在一起,而 AmphiLoop 试图把这两部分分开。
所谓“两栖模式”,指的是系统既能做高层决策,也能落到具体执行层面,并在两种模式之间切换。
作者认为,这种设计与 OpenClaw、Hermes 等方案不同,核心差异在于组织任务和分配职责的方式。
文章详细讨论了为什么要把决策与执行解耦:这样可以降低复杂度,提高可控性,也更方便扩展。
从介绍语气看,作者并不是单纯做产品宣传,而是试图把自己的架构思路讲清楚,让读者理解其设计动机。
文章同时展示了开源 AmphiLoop 的定位,说明它希望成为一个可以复用、可以改造的 Agent 基础框架。
文中不断拿 OpenClaw 和 Hermes 作对比,重点是在说明自己为什么选择另一种实现路径。
整体来看,这是一篇偏架构和理念驱动的长文,重点不在某个单点功能,而在 Agent 系统如何组织思考与行动。
如果你关心 Agent 架构设计,这篇文章的核心价值在于提供了一种“决策层 / 执行层分离”的实现视角。

两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制?

这篇文章围绕黄仁勋接受 Dwarkesh Patel 两小时专访展开,重点梳理了他对 CUDA、TPU、华为以及出口管制的看法。
作者开篇就强调,这不是一次轻松的访谈,而是一场高密度观点碰撞。
文章试图说明,黄仁勋之所以不怕 TPU,不是因为忽视竞争,而是因为 NVIDIA 的护城河不只在芯片硬件,更在 CUDA 生态和软件体系。
面对华为等中国竞争者,文章传达出的信息是:真正的竞争关键不只是单点性能,而是完整平台、开发者生态和持续迭代能力。
对于出口管制,文章重点呈现了黄仁勋如何看待美国政策、全球供应链和市场结构的变化。
整篇内容的逻辑是:算力竞争正在变成平台竞争,单纯追赶某一代芯片参数并不足以改变格局。
文章也在提醒读者,AI 基础设施之争已经超越了硬件本身,延伸到软件栈、工具链和生态锁定。
从语气上看,作者明显是在把这次访谈当作理解 NVIDIA 战略与 AI 行业格局的一手材料。
文章最终想传达的是,黄仁勋对外界最担心的几个问题都有自己的解释,而且这些解释都指向一个结论:平台型公司的优势来自长期积累。
如果把它概括成一句话,就是:这是一篇解读黄仁勋如何面对 AI 时代竞争与地缘政治压力的文章。

刚刚,Claude Design 发布!网友:将摧毁设计行业……

这篇文章主要在介绍 Claude Design 的发布,并把它看作一款可能改变设计行业工作方式的新工具。
作者用非常强烈的标题表达了观点:这类工具的能力已经大到足以引发设计行业的焦虑。
文章的核心意思是,AI 不再只是辅助写文案或生成图片,而是在向更完整的设计工作流渗透。
作者把 Claude Design 的推出解读为一个信号:设计工作正在从“人工主导”转向“人机协作”甚至“AI 主导”。
文中强调,这种变化并不只是效率提升,而是会重构设计岗位的分工方式和生产流程。
文章还带有明显的行业观察色彩,试图说明为什么很多人会觉得这项更新“很吓人”。
从内容风格看,它更像一篇技术趋势评论,而不是纯产品说明。
作者借 Claude Design 这个案例,讨论了生成式 AI 对创意行业的冲击与重塑。
整篇文章的倾向是肯定 AI 工具的突破性,同时提醒读者认真看待它对设计行业的影响。
如果概括成一句话,就是:这是一篇围绕 Claude Design 上线,讨论 AI 如何冲击设计行业的趋势文章。

刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达

这篇文章围绕“梁文锋首次融资”与“DeepSeek V4”展开,试图说明 DeepSeek 接下来可能会有更大的资本和技术动作。
标题本身强调了两个冲击点:一是融资消息,二是 DeepSeek V4 被解读为要摆脱英伟达体系的依赖。
文章的主要叙事是,DeepSeek 在算力与模型路线上的变化,可能意味着它正在尝试更强的自主性。
作者把这个消息写得非常重磅,意在突出其对 AI 行业格局的影响。
文中明显带有行业热点解读的风格,重点不是复述融资细节,而是把它放到“国产 AI / 算力独立”的大背景下理解。
从标题和摘要看,文章想传达的核心信号是:DeepSeek 正在从外部算力依赖中寻找新的路径。
文章也延续了新智元一贯的写法,使用强烈标题和趋势判断来吸引读者注意。
整体上,这是一篇围绕 DeepSeek 最新动向的 AI 热点评论文章。
它关注的不只是融资本身,更是融资背后可能折射出的技术路线、生态选择和行业竞争。
如果用一句话概括,就是:这篇文章在解读 DeepSeek 可能通过融资和架构变化,进一步摆脱对英伟达的依赖。

谷歌向左、李飞飞往右,阿里世界模型「快乐生蚝」杀出第三条路

这篇文章讨论的是阿里在世界模型方向上的一种不同路线。
作者拿谷歌和李飞飞的方向作对比,强调阿里选择的是一条不一样的技术路径。
标题里的“快乐生蚝”是阿里世界模型项目的一个标识,文章借它说明阿里想走出第三条路。
文中的核心观点是:面对世界模型和 AI 视觉/具身方向,不同公司正在形成不同的研究和产品路线。
作者用“谷歌向左、李飞飞往右”来形容行业分化,意思是各家不再沿着同一条路线推进。
文章强调阿里“路子不太一样”,这通常意味着它在架构、任务定义或应用目标上有自己的选择。
整体内容偏向 AI 研究趋势与技术路线分析,而不是单纯的产品发布说明。
通过对比和命名,文章想让读者理解阿里在世界模型上的差异化定位。
如果概括成一句话,就是:这是一篇讲阿里世界模型如何另辟蹊径、尝试走第三条路的趋势文章。
它关注的是 AI 世界模型竞争中的路线分化,而不是单一模型能力本身。

Charts of the Week: Are Tech Stocks Cheap?

  • Goldman Sachs argues that tech and software valuations have compressed so much that they may now look relatively cheap versus the broader market.
  • The old “tech premium” has mostly disappeared, while tech earnings still trade at only about a 25% premium to the rest of the market.
  • Meanwhile, tech earnings expectations are still rising faster than the market and have been revised up more than any other global sector in 2026.
  • The piece frames the key tension as valuation versus fundamentals: prices have fallen, but earnings growth remains strong.
  • It also references several related chart topics: activist investors, quantifiable AI benefits, oil’s shrinking importance, and grocery prices.
  • The headline question is not whether tech is perfect, but whether the market has pushed it into a more attractive risk/reward zone.

Meta-Harness:当一个agent学会了看场合说话

这篇文章解读了一项名为 Meta-Harness 的研究,核心问题是:能否让模型自动搜索出更好的外层调度代码(harness),而不只是改模型本身。文章先给出结论:在文本分类任务上,Meta-Harness 只用很少的评估次数就能追平甚至超过更耗资源的方法;在数学推理和 agentic 编程任务里,它也表现出了明显优势。作者把 harness 类比成语言里的“语域”,认为不同场景下最优的策略并不是固定的,而是会随着任务、信息结构和目标改变。文章强调,系统之所以能找到人类工程师不易想到的策略,关键在于它能读取更完整的执行轨迹,而不是只看分数或摘要。换句话说,原始轨迹像“语料库”,而压缩后的信息往往会丢失因果线索,影响后续搜索。

文章还通过社会语言学的视角解释这些结果,把策略切换、信息检索和场景适配类比成“说话要看场合”。比如在一个任务上,系统学到的轻量验证策略,可能对应日常对话中的简短应答;而更复杂、上下文更重的策略,则像正式场合下的完整陈述。作者进一步指出,Meta-Harness 在数学问题中甚至发现了多个可切换的子策略,类似语言学中的双言现象:不同情境下自动调用不同“语言变体”。文章最后把这种行为提升为一种更广义的智能:不是死记某个最优答案,而是学会根据情境选择合适的表达与执行方式。

Anthropic 正式推出 Claude Opus 4.7

Anthropic 在 2026 年 4 月 16 日正式发布 Claude Opus 4.7,并向所有用户和 API 开放访问,价格与 Opus 4.6 保持一致。文章首先强调,这次升级的重点不是单纯的“更大”,而是更适合高难度、长周期任务的稳定执行能力。

它在复杂工作上的表现更强,尤其是代码类任务、长上下文任务和多步骤推理任务。文章提到,Opus 4.7 会更严格地遵循指令,并且在输出前更主动做自检,这让一些原本需要人工紧盯的任务,可以更放心地交给模型处理。

视觉能力也是这次更新的重点之一。新版本支持更高分辨率的图像输入,适合处理复杂截图、图表和需要精细识别的信息抽取场景。文章同时提醒,旧版本写法的 prompt 迁移到 4.7 后,可能会出现行为变化,因为它对字面指令执行得更严格。

在 benchmark 上,Opus 4.7 在金融 Agent、代码编写、文档推理和长上下文等方向都超过了 4.6。文章特别指出,它在衡量经济价值知识工作的 GDPval-AA 上达到了当前最优水平,说明它不只是“会聊”,而是更偏向可落地的生产力工具。

这次发布还带来了一些配套能力。Anthropic 新增了介于 high 和 max 之间的 xhigh 努力等级,给开发者更细的推理控制;Claude Code 也把默认努力等级提升到了 xhigh。API 侧还推出了 Task Budgets 公测,方便开发者控制长任务中的 token 成本。

文章最后补充了安全和迁移注意事项。Anthropic 为 Opus 4.7 加入了新的网络安全防护机制,并提醒它使用了更新的 tokenizer,实际 token 消耗可能比 4.6 更高。整体来看,这是一版更稳、更强、也更适合真实工作流的 Claude 升级。

Claude Opus 4.7 发布!留给人类的时间,不多了

Anthropic 刚刚发布了 Claude Opus 4.7,并向所有用户和 API 开放访问,价格与 Opus 4.6 保持一致。文章开头把这次升级定性为一次面向真实工作流的强化,而不是单纯追求参数或噱头。它最核心的变化,是更适合高难度、长周期任务。相比旧版本,4.7 在处理复杂任务时更严谨,也更愿意先自检再输出结果。文章提到,这会让一些原本需要人工盯着的高强度编程任务,更适合直接交给它执行。

视觉能力也是这次更新的重要部分。新版本支持更高分辨率的图像输入,适合处理复杂截图、图表和信息抽取。与此同时,它对指令的执行更严格,这意味着旧版本可用的 prompt,在 4.7 上可能会出现新的行为,需要重新调优。文章还列出了多项 benchmark 结果,说明它在金融 Agent、代码编写、文档推理和长上下文等方向都比 4.6 更强。作者特别强调,它在 GDPval-AA 这类衡量经济价值知识工作的指标上达到了当前最优水平。

除了模型本身,这次发布还带来了新的控制和配套能力。Anthropic 增加了介于 high 和 max 之间的 xhigh 努力等级,让开发者能更细地控制推理强度。Claude Code 也把默认努力等级提高到了 xhigh。API 侧新增了 Task Budgets 公测,方便管理长任务中的 token 消耗。文章还提到 Claude Code 增加了 /ultrareview 代码审查功能,为开发者提供了更强的审查工具。

安全方面,Opus 4.7 使用了 Project Glasswing 下的新防护措施,并刻意压制了网络攻击能力。文章说明,如果是合法渗透测试或漏洞研究的安全人员,可以申请 Cyber Verification Program。最后,作者提醒这版模型使用了更新的 tokenizer,同样输入可能会消耗更多 token,尤其是在高努力等级的多轮 agent 场景下,实际成本需要先做测量再决定是否全量切换。整体来看,这是一版更强、更稳、也更偏向生产环境的 Claude 升级。

两个美国人看中国AI,看到了同一件事

这篇文章把两篇美国主流媒体的文章放在一起看:一篇是《纽约时报》记者在中国实地采访后的观察,另一篇是前美国国家安全顾问杰克·沙利文在《外交事务》上的长文。作者想说明的是,两者虽然出发点不同,但都得出了相近判断:中国 AI 发展的关键不只是模型本身,而是部署能力、制造业基础和供应链掌控

文章还强调,美国过去依赖芯片出口管制来遏制中国 AI 的思路,效果有限;而中国正在通过异地算力、低端芯片组合、模型蒸馏等方式绕开限制。作者因此认为,中美 AI 竞争的核心,已经从“谁的模型更强”转向“谁能更快把技术嵌入现实产业”。

最后,文章把讨论落到 AI 安全与治理上,指出中美两边都开始意识到:当技术足够强大时,竞争之外,还必须回答“如何不失控”这个问题。