2026-05-06

共 3 篇

DeepMind CEO谈AI健康

微信公众号 - Z Potentials 原文链接

这篇访谈围绕 Google DeepMind CEO Demis Hassabis 对 AI 未来用途的看法展开，核心观点是：AI 最有价值的方向不是简单的聊天或生成内容，而是帮助人类理解现实世界，并优先改善健康、科学和医学。

文章首先回顾了 Hassabis 对 AlphaFold 的思考路径。早在本科时期，他就对蛋白质折叠问题着迷，因为蛋白质的三维结构决定功能，而传统实验方法既慢又贵。AlphaFold 的突破在于，它把原本需要几十万美元、耗费多年才能得到的结构预测，压缩到几秒钟完成，并且可以把大量已知蛋白结构免费开放给全球科学家使用。作者强调，这使得 AlphaFold 不只是一个模型，而是一次彻底改变科研流程的基础设施升级。

接着，访谈讨论了 AlphaFold 在科研中的具体价值。它帮助研究者更快理解蛋白结构、探索药物靶点，也让研究冷门物种、植物、疟疾、查加斯病等“低商业回报”疾病的团队拥有了更好的工具。Hassabis 认为，AI 应该先解决这些能显著改善人类健康和基础科学的问题，而不是等到所谓的 AGI 完全成熟后才开始发挥作用。

文章随后转向药物发现。Hassabis 认为，知道蛋白结构只是第一步，真正的目标是把 AI 用在药物设计、分子筛选和副作用预测上。DeepMind 及其孵化公司 Isomorphic Labs 正在构建一整套相邻系统，尝试在计算机中完成尽可能多的药物发现流程：设计候选化合物、预测它们与目标蛋白的结合强度、快速检查是否会误伤其他蛋白，再把最有希望的结果送入湿实验室验证。这样的流程有望把现在动辄十年的药物研发周期大幅缩短。

文章还介绍了 AlphaGenome 的意义。它试图解码基因组中大量不编码蛋白质的区域，尤其是帮助识别哪些突变会导致疾病。Hassabis 认为，未来 AI 可能能更准确地指出疾病的关键突变，再和 CRISPR 这类基因编辑技术结合，直接修复问题位点，从而为遗传病治疗打开新路径。

最后，文章讨论了 AI 发展节奏的变化。Hassabis 承认，如果按他的个人意愿，他希望把 AI 更长时间留在实验室里，优先做科学和医学方向的工作；但现实中，ChatGPT 之后的产业竞争显著加速了 AI 的公众化和产品化。他认为自己始终最关心的仍然是“用 AI 理解世界”，而他希望这份技术力量最终能被用于科学发现、疾病治疗和人类认知边界的拓展。

How SSA Makes Long Context Practical

Subquadratic 原文链接

这篇文章介绍了 SubQ 提出的 SSA（Subquadratic Sparse Attention）架构，以及它为什么能让长上下文在实际生产中更可用。文章的核心观点是：企业 AI 真正困难的问题，往往不是“没有答案”，而是答案分散在超长上下文里，需要模型把多个片段同时纳入视野才能做出可靠判断。

作者先指出，代码库、合同、研究语料、数据库和长期运行的智能体会话，本质上都是长上下文问题。传统的 dense attention 让每个 token 与所有其他 token 两两计算，虽然能力强，但时间和计算开销会随着序列长度呈平方增长，因此在几十万到百万 token 规模上很快变得昂贵。文章强调，长上下文不仅仅是“更大的窗口”，而是“更可靠的推理窗口”。

随后文章对比了现有系统级补丁的局限。RAG 能按语义召回相关内容，但往往会丢失位置、层级、邻近上下文和引用结构；agent 流程可以把大任务拆开，但会带来多次压缩、误差累积和手工编排。FlashAttention 虽然优化了实现方式，减少了显存和内存搬运成本，但并没有改变 attention 仍然是平方级计算这一根本事实。

文章接着解释 SSA 的思路：它通过内容相关的选择机制，把注意力路由到真正重要的位置，而不是强迫每个 token 与所有 token 交互。这样做的目标不是牺牲检索能力去换速度，而是在保留长上下文检索能力的同时，把计算复杂度降下来。作者把它描述为一种更接近“功能性长上下文”的方案，而不是单纯扩大上下文窗口。

在效果上，文章声称 SubQ 在 MRCR v2 等长上下文任务上能跟前沿 dense-attention 模型保持竞争力，并在 100 万 token 下实现 52.2 倍的 prefill 加速。作者据此认为，SSA 让百万 token 上下文更便宜、更快，也更适合企业场景中的代码理解、文档检索和长任务推理。

文章最后的结论是：长上下文真正需要的是能稳定在大规模输入下保持检索与推理质量的架构，而 SSA 的意义就在于尽量减少围绕 dense attention 叠加的大量工程补丁，让模型本身更适合长上下文生产部署。

long-context attention SSA enterprise-ai retrieval2026-05-06

英伟达想革光模块的命

微信公众号 - 远川研究所原文链接

这篇文章围绕“英伟达为什么想改造光模块产业链”展开，核心是在解释 AI 数据中心互连需求、光模块的作用，以及英伟达推动 CPO（光电共封装）背后的产业影响。

文章先从中际旭创、新易盛、天孚通信等光模块龙头的高景气写起，说明在 AI 数据中心建设和资本开支持续扩张的背景下，光模块行业一度成为市场焦点。随后作者解释了数据中心内部通信为何重要：GPU 需要通过服务器、机柜、交换机等多个层级互联，才能把算力组织起来，而光模块正是把电信号转换为光信号、支撑长距离高速传输的关键器件。

接着，文章比较了铜缆与光缆的特点：铜缆便宜、低延迟，但距离受限；光纤能传得更远、功耗更低，但需要额外的光模块完成“翻译”。随着 GPU 集群规模变大、传输速率提升到 800G、1.6T，光模块的功耗和系统复杂度也越来越高，行业逐渐暴露出“中间环节太多”的问题。

英伟达的思路是把光模块拆解重组，推动 CPO 技术落地：把光引擎等器件直接放到交换机芯片甚至 GPU 附近，缩短电/光转换路径，降低功耗，并提升对整个系统的控制力。文章指出，英伟达与台积电在先进封装上的合作，以及后续在交换机、机架级系统中的布局，都说明它并不满足于只卖芯片，而是想进一步掌控“计算系统”的整体形态。

文章也重点分析了这一变化对中国光模块厂商的冲击。当前中国企业在光模块“系统集成”环节占据很强地位，但 CPO 如果普及，最先被削弱的恰恰是这类集成型价值；而高端激光器、探测器、DSP/AFE 等核心器件主要仍掌握在美日厂商手中。换句话说，CPO 可能会把产业链利润进一步向上游核心器件和大客户集中，挤压中国厂商擅长的中间层。

最后，文章认为短期内 CPO 仍受成本、工艺和量产节奏限制，光模块行业不会立刻被颠覆，但中长期看，英伟达、台积电、博通等玩家正在重新定义数据中心互连的技术路线，光模块行业的竞争格局也因此面临重塑。

微信文章英伟达光模块 CPO AI数据中心2026-05-06