← 所有标签

# 上下文

百万上下文普惠时代

摘要

DeepSeek 发布了全新系列模型 DeepSeek-V4 的预览版,并同步开源。文章强调,这一代模型的最大亮点是“百万字级上下文”,意味着模型在处理超长文本、长链路任务和复杂 Agent 工作流时,能保持更强的记忆与理解能力。官方希望借此把百万上下文能力进一步普惠化,让更多用户和开发者可以直接使用。

文章把 DeepSeek-V4 分成两个版本:V4-ProV4-Flash。其中,V4-Pro 面向更高质量任务,重点强调推理、知识和 Agent 能力;V4-Flash 则主打更快、更经济,适合高频调用和成本敏感场景。两者都支持 1M 上下文,并可通过官网 App、chat.deepseek.com 以及 API 方式调用。

在能力表现上,V4-Pro 被描述为在 Agent 能力上有显著增强,尤其是在 Agentic Coding 场景中表现突出,已经接近或超过多款主流闭源模型的部分非思考模式体验。文章还强调,它在世界知识和推理方面也取得了较强成绩:在知识测评上大幅领先其他开源模型;在数学、STEM 和竞赛代码等任务上,则达到了比肩顶级闭源模型的水平。

对普通用户来说,这篇文章传递出的信号很直接:DeepSeek 希望把“超长上下文 + 强推理 + 强 Agent”组合,做成一个可以实际落地的大模型能力栈。V4-Pro 适合追求效果的复杂任务,V4-Flash 更适合强调速度、性价比和批量使用的场景。对于开发者而言,API 的 model_name 也已经更新,可以直接切换到对应型号进行调用。

体会

这篇发布信息最值得注意的,不只是模型性能数字本身,而是 DeepSeek 明确把“百万上下文”从实验性能力推进到了可使用、可调用、可普及的产品阶段。未来如果长文档理解、代码仓库级别 Agent、跨文档推理等场景进一步成熟,这类模型可能会显著改变大模型应用的工作方式。