DeepSeek万亿战略
文章摘要
这篇文章围绕 DeepSeek 的商业路径展开推演,核心观点是:DeepSeek 表面上似乎没有像其他模型厂商那样全力做编程订阅、多模态或语音视频应用,但这并不意味着它缺乏商业化方向;相反,作者认为它是在通过模型架构、推理优化与开源策略,推动一整套更宏大的 AI 硬件与算力生态。
文章首先从 KV Cache 的压缩与长上下文成本谈起,强调 DeepSeek 在减少显存压力方面的创新会显著降低长程推理和长上下文智能体的成本。作者认为,这类技术不仅能提升模型推理效率,还会间接扩大 SSD、NAND、LPDDR 等存储与内存组件的需求,因为更便宜、更小的缓存让“把数据转存到更低成本介质上”变得更可行。
接着,文章把这种技术路线放到更大的产业图景里解读:如果模型对 HBM 的依赖下降,那么中国本土的 NAND、LPDDR 供应链就有机会成为 AI 时代的重要受益者。作者认为,DeepSeek 的一系列选择并非单纯为了做应用层收入,而是在降低 AI 使用门槛的同时,推动一套可由中国本土硬件支撑的替代性生态。
文章还提到 DeepSeek 的一些研究方向,例如 MoE、MLA、mHC、CSA/HSA 等,认为这些创新共同指向一个目标:以更低的计算和通信成本提升模型能力,压缩推理开销,并让国产 GPU/ASIC 与网络芯片更“够用”,从而在现实产业中形成联动效应。
最后,作者将这一切总结为一盘“10 万亿美元大棋”:DeepSeek 的目标不只是单一模型产品的收入,而是借由开源、架构创新和推理优化,推动 AI 成本下降,进而带动存储、内存、芯片、封装、网络等上下游产业链的发展,并在中西方 AI 硬件竞争中形成新的力量平衡。