上下文 - 古法信息流

百万上下文普惠时代

wechat - DeepSeek 原文链接

摘要

DeepSeek 发布了全新系列模型 DeepSeek-V4 的预览版，并同步开源。文章强调，这一代模型的最大亮点是“百万字级上下文”，意味着模型在处理超长文本、长链路任务和复杂 Agent 工作流时，能保持更强的记忆与理解能力。官方希望借此把百万上下文能力进一步普惠化，让更多用户和开发者可以直接使用。

文章把 DeepSeek-V4 分成两个版本：V4-Pro 和 V4-Flash。其中，V4-Pro 面向更高质量任务，重点强调推理、知识和 Agent 能力；V4-Flash 则主打更快、更经济，适合高频调用和成本敏感场景。两者都支持 1M 上下文，并可通过官网 App、chat.deepseek.com 以及 API 方式调用。

在能力表现上，V4-Pro 被描述为在 Agent 能力上有显著增强，尤其是在 Agentic Coding 场景中表现突出，已经接近或超过多款主流闭源模型的部分非思考模式体验。文章还强调，它在世界知识和推理方面也取得了较强成绩：在知识测评上大幅领先其他开源模型；在数学、STEM 和竞赛代码等任务上，则达到了比肩顶级闭源模型的水平。

对普通用户来说，这篇文章传递出的信号很直接：DeepSeek 希望把“超长上下文 + 强推理 + 强 Agent”组合，做成一个可以实际落地的大模型能力栈。V4-Pro 适合追求效果的复杂任务，V4-Flash 更适合强调速度、性价比和批量使用的场景。对于开发者而言，API 的 model_name 也已经更新，可以直接切换到对应型号进行调用。

体会

这篇发布信息最值得注意的，不只是模型性能数字本身，而是 DeepSeek 明确把“百万上下文”从实验性能力推进到了可使用、可调用、可普及的产品阶段。未来如果长文档理解、代码仓库级别 Agent、跨文档推理等场景进一步成熟，这类模型可能会显著改变大模型应用的工作方式。

大模型 Agent 上下文2026-04-24

# 上下文

百万上下文普惠时代

摘要

体会