2026-04-24

共 9 篇

AI范式巨变

wechat - 张小珺原文链接

摘要

这篇访谈围绕“AI 范式正在发生怎样的巨变”展开，核心人物是罗福莉。文章认为，2026 年是大模型战争的第二幕：行业正在从以 Pre-train（预训练） 为主的 Chat 时代，转向以 Post-train（后训练） 和 Agent 为核心的新阶段。

罗福莉的一个重要判断是：上一个时代的成功，并不意味着下一个时代还能继续领先。随着模型能力逐渐接近，真正拉开差距的，已经不只是基座模型本身，而是围绕模型构建的 Agent 框架、后训练范式、推理系统和组织协作方式。她特别强调，未来的竞争重点将是如何在 Agent 上做好 RL scaling，以及如何把模型能力和框架能力一起推进。

文章中一个非常重要的主题，是她对 OpenClaw 这类 Agent 框架的评价。她认为，一个好的框架应该尽量弥补行动上的缺陷：比如更强的 memory、更丰富的消息通道、更主动的任务执行、更好的多模型协同，以及更完善的评估机制。她一开始也对 OpenClaw 持怀疑态度，但在深度使用后发现，这类框架不仅能显著提升体验，还能把中层模型的能力上限大幅抬高。

在她看来，OpenClaw 之所以令人震撼，不只是因为它“像 Claude Code 加了一个壳”，而是它把 Agent 框架做得足够开放、足够可改、足够厚重。用户可以直接改 memory、multi-agent 流程、skills 和工作流，这种可操纵性会极大激发创造力。她认为，真正强大的不是单一产品界面，而是产品背后那层负责调度、记忆、评估和任务编排的中间层。

文章还讨论了组织层面的变化。罗福莉提到，在新的范式下，团队需要更强的敏捷性和更高的研究效率；同时，资源分配也会改变，后训练的重要性会显著上升。她甚至提到，在顶尖团队中，预训练和后训练的资源比例可能已经接近 1:1。与此同时，组织结构也在变化：更平权、更少层级、更少约束的组织，可能更有利于创新。

另一个值得注意的观点，是她对“自学习”的理解：未来的模型进步，不只是模型单独变强，而是模型和 Agent 框架同步演化。模型在训练中变强的同时，也会反过来改变框架设计，包括静态的 memory、skills，以及动态的调度和工作流。换句话说，真正的竞争不再只是“谁的模型更大”，而是“谁能把模型、框架、组织一起升级”。

体会

这篇访谈最大的价值，在于它把“AI 变革”从抽象口号落到了具体工程和组织层面：模型不再是唯一主角，Agent 框架、后训练、评估体系、组织方式都成了决定性变量。它传达出的信号很明确：下一阶段的领先者，可能不是单纯把模型做得更大的人，而是最会把模型能力转化为系统能力的人。

AI Agent 罗福莉2026-04-24

DeepSeek-V4论文解读

wechat - 刘聪NLP 原文链接

摘要

这篇文章是对 DeepSeek-V4 开源发布的论文细节解读与实测对比。作者首先介绍了这次开源的两个版本：DeepSeek-V4-Pro 和 DeepSeek-V4-Flash，并给出了模型规模、激活参数以及对应的 Hugging Face 链接，整体语气是“终于等到，但也有一点小失望”。

文章明确指出，DeepSeek-V4 依然是纯文本模型，不是多模态模型，这让作者感到略微遗憾。不过他也强调，DeepSeek 作为国内团队仍然保持了很强的工程和研究自洽性，并继续坚持一种“不诱于誉，不恐于诽，率道而行”的路线。

在技术层面，文章重点讲解了 DeepSeek-V4 论文中的关键改进。作者提到，V4 在模型结构上引入了一些此前已有但实现细节不同的技术，其中包括 流形约束超连接（mHC），其目标是把残差映射约束到双随机矩阵流形上，从而增强跨层信号传播的稳定性。文章还讨论了混合压缩稀疏注意力（CSA）与重度压缩注意力（HCA）等机制，以及 DeepSeek 稀疏注意力 DSA 的延续和扩展。

作者的整体判断是：DeepSeek-V4 在架构和训练策略上继续推进了长上下文、稀疏注意力和高效推理方向，但它并不是一次“颠覆式改变”，而更像是对前代思路的系统性加强和工程化收敛。文章也通过论文细节和图示，帮助读者理解 DeepSeek 为什么能在开源大模型领域持续保持领先或接近领先的位置。

在评测与实测对比部分，作者结合公开论文内容和实际体验，认为 V4-Pro 的能力更偏向高质量推理和复杂任务处理，而 V4-Flash 则更适合成本敏感、效率优先的使用场景。虽然这次没有带来多模态能力上的惊喜，但从纯文本模型的角度看，DeepSeek 依旧展示了很强的研究深度和工程一致性。

体会

这篇文章的重点不只是“DeepSeek-V4 发布了什么”，更是“为什么它这样设计”。作者用比较细的论文解读告诉读者：DeepSeek 的优势并不只来自参数规模，而来自它在架构、注意力机制和训练稳定性上的持续打磨。对于关注开源大模型的人来说，这是一篇偏技术向、适合理解 V4 设计逻辑的解读文章。

DeepSeek 大模型论文解读2026-04-24

DeepSeek救恒科

wechat - 25号观察原文链接

摘要

这篇文章把 DeepSeek-V4 的发布，放在港股和恒生科技指数的大背景下来看，认为它不仅是一次模型发布，更是一次对市场预期和产业链信心的“点火”。作者的核心观点是：DeepSeek 又一次在关键时点救了恒科一命。

文章开头提到，DeepSeek V4 预览版官宣上线后，港股市场迅速反应，芯片制造环节和互联网 AI 相关公司都出现明显上涨，恒生科技指数也从下跌中拉回。作者认为，这背后反映的不只是题材炒作，而是市场开始真正把 DeepSeek 视为推动 AI 产业链重估的关键变量。

文章用一句话概括 DeepSeek V4 的价值：它把“长上下文”的成本打到了地板，把多领域能力融合做到天花板，并且主动拥抱国产芯片，让好用的 AI 变得更便宜、更普惠。这一代模型延续了 DeepSeek 一贯的低价策略，也因此让更多原本无法成立的应用场景变得商业可行，尤其是长文档分析、Agent 任务、跨会话记忆等方向。

更重要的是，作者把焦点从“模型能力”进一步延伸到“算力国产化”。文中强调，DeepSeek V4 已全面适配华为昇腾芯片，底层从 CUDA 迁移到 CANN，并在昇腾 950PR 上实现大幅推理提速。这被作者视为一个非常强的信号：国产大模型并不一定只能依赖英伟达生态，国产算力也可以承载顶级模型，并且形成自己的产业闭环。

文章还提到，华为通过“超节点”这种系统级互联方式，把大量昇腾芯片组织成更强的整体算力平台；而 DeepSeek 则用极低成本的大模型能力，进一步放大了这种国产算力的商业价值。两者结合起来，意味着 AI 推理成本有机会继续下降，千行百业真正接入 AI 的门槛也会继续降低。

作者的最终判断是：DeepSeek 不只是“救了恒科”，更是在推动整个 AI 产业从“概念阶段”进入“普惠阶段”。它带来的不是单一股价波动，而是对成本结构、技术路径、算力生态和行业预期的一次重构。

体会

这篇文章的重点不在模型细节，而在宏观影响：DeepSeek 这类低成本、高性能、国产适配的大模型，正在成为港股 AI 资产和国产算力链条的重要催化剂。它体现出的趋势是——未来 AI 的竞争，除了模型参数和 benchmark，更是成本、生态和产业协同的竞争。

DeepSeek 恒生科技港股2026-04-24

GPT-5.5来了

wechat - 极客公园原文链接

摘要

这篇文章围绕 OpenAI 新发布的 GPT-5.5 展开，核心想表达的不是“又更聪明了”这么简单，而是 OpenAI 试图证明：模型不仅可以更强，还可以更快。文章一开始就强调，这是一轮不同寻常的迭代——GPT-5.4 发布仅六周后，GPT-5.5 就已经推送给付费用户，节奏非常紧凑。

作者指出，GPT 系列长期以来面临一个行业悖论：模型越聪明，通常越慢、越贵。想获得更深的推理、更复杂的任务处理能力，就往往要接受更高的延迟和计算成本。GPT-5.5 的定位，就是试图打破这个默认取舍，在保持接近 GPT-5.4 推理延迟的同时，让智能水平再上一个台阶。

文章的核心判断是，OpenAI 这次不仅想证明“更聪明”，还想证明“更快”和“更强”可以同时成立。作者把 GPT-5.5 视为一次面向实际服务体验的升级，而不是单纯的参数炫技或 benchmark 冲榜。对于用户而言，这意味着更好的日常可用性；对于行业而言，这意味着模型迭代速度和产品体验可能再次被拉高。

文章还提到，目前不少体验反馈都认为 GPT-5.5 的综合表现很强，甚至让人感觉 OpenAI 可能在这一轮竞争中重新占到上风。整体来看，这篇内容是在强调一个信号：OpenAI 正在把竞争重点从单点“智力”扩展到速度、效率和服务体验的统一。

体会

这篇文章最值得关注的，不只是 GPT-5.5 本身，而是它背后的方向：大模型竞争正在从“谁更强”走向“谁能在可用延迟内更强”。如果这一方向持续成立，未来的胜负手可能不再只是模型能力上限，而是把高智能稳定交付给用户的能力。

OpenAI GPT-5.5 大模型2026-04-24

一个散户自学量化

wechat - 量化Quantide 原文链接

摘要

这篇文章记录了一位散户自学量化 20 个月的经历，核心不是“如何快速赚钱”，而是“量化如何重塑一个人理解市场的方式”。作者一开始也抱着很典型的散户幻想：学 Python、做机器学习、写策略，就能预测涨跌、稳定盈利。但在不断亏损和反复试错之后，他逐渐意识到，量化的重点不是写代码本身，而是从“猜涨跌”转向“算概率”，从绝对判断转向条件判断。

文章首先强调，散户常常只盯着单个信号、单只股票、某根 K 线，而量化思维要求先理解条件概率：一个现象在什么条件下才有意义？孤立事件本身通常没交易价值，真正有价值的是它背后的统计关系。作者认为，这种转变是量化学习中最重要的一步，因为它意味着你不再把“肯定”当成答案，而是开始接受市场中的不确定性。

接着，文章讨论了“写策略之前先学会怀疑自己”。作者发现，回测中的最优解并不一定能在实盘中兑现，原因包括滑点、手续费、执行问题、样本外失效等。量化并不是把公式算出来就结束，而是一个持续验证、不断修正、承认误差的过程。尤其到了期权和更复杂的衍生品阶段，变量更多，波动本身也会成为成本的一部分。

文章还提到，量化不仅仅是研究单只股票，而是要在更大的资产和组合维度上思考；同时，估算误差会越来越成为真正的瓶颈。也就是说，模型本身未必是最难的，难的是你如何正确估计参数、如何处理偏差、如何面对现实世界里的噪声和约束。

整体来看，这篇文章更像是一份普通投资者的量化学习笔记：它没有夸张的收益承诺，而是强调量化是一种认知升级——让人从凭感觉交易，转向用概率、验证和风险约束来理解市场。

体会

这篇文章最有价值的地方，是它把量化从“高薪职业幻想”拉回到“方法论训练”。对普通人来说，真正值得学的不是某个神奇策略，而是概率思维、怀疑精神、组合意识和对实盘约束的尊重。

量化投资 Python2026-04-24

两种身份

wechat - 戴汨原文链接

摘要

这篇文章围绕“知识”和“智慧”、“确定性”和“不确定性”展开，核心是在提醒读者：投资不应只依赖知识堆砌和概念化分析，而要承认未来的复杂性，并用更谦逊的方式面对概率和时间。

作者先从教育切入，指出教育的好处是获得知识，但坏处也可能只是停留在知识层面。知识更像地图，能帮助我们理解世界；但智慧更像地形本身，是真实世界中不断变化的结构。知识多的人，容易把地图误当成地形，把模型当成现实。

接着，文章把这个观点延伸到投资。作者认为，投资不是简单套用金融理论，也不是只谈阿尔法和贝塔；投资本质上是在面对看不见的众多人、不断变化的外部环境，以及未来可能出现的新变量时，做出的判断。未来并不是可以完全被地图化的对象，因为未来由时间、变化和不确定性共同构成。

文章强调，不确定性才是常态，而且是普遍、宏大、长期存在的；相对而言，确定性只是局部、微小、短暂的。作者用宇宙、星空、熵增等比喻来说明，人类虽然擅长处理眼前可见、结构清晰的问题，但面对更大的未来时，往往会暴露出直觉的局限。真正理解未来，需要更深层的思考能力，而不是单纯的直觉反应。

在自我认知上，作者更认同“偶尔聪明的愚蠢人”这一身份，而不是“偶尔愚蠢的聪明人”。前者承认自己的局限，知道真正重要的判断来自对不确定性的尊重；后者则更容易沉迷于知识与思辨的优越感，以为自己已经掌握了未来。

文章最后引用 Howard Marks 的话：“巴菲特一生 70 年靠 12 个想法挣了绝大部分的钱。芒格用了 4 个。”这句话进一步强化了文章的主旨：真正高质量的投资决策并不依赖频繁行动，而往往来自少数几次深思熟虑、抓住关键确定性的判断。

体会

这篇文章的重点不在于提供具体投资技巧，而在于重塑投资心态：少一点自信过度，多一点对不确定性的敬畏；少一点把知识当答案，多一点把知识当工具。

投资思考2026-04-24

地平线三把火

wechat - 极客公园原文链接

摘要

这篇文章围绕地平线在一次高密度发布会上推出的三项核心产品展开：星空芯片、咖咖虾操作系统、HSD V1.6 辅助驾驶系统。作者认为，这不是一次普通的产品发布，而是地平线在智能汽车时代完成关键拼图的重要节点，标志着它正从“芯片公司”向“整车智能底层构建者”转型。

文章首先聚焦于地平线的新芯片方案。此次发布的两款芯片 Starry 6P 和 Starry 6H，核心卖点是舱驾融合：把座舱与智能驾驶两套原本割裂的计算体系，尽可能整合到同一套架构中，以降低成本、减少延迟、提升资源利用率。作者指出，这个概念行业里喊了很多年，但真正做到量产落地并不容易，因为它必须同时解决安全隔离和算力共享之间的矛盾。

文章强调，舱驾融合最大的挑战在于汽车安全等级要求极高，尤其智驾部分要满足 ASIL-D 级别，而座舱系统又是高度开放、容易受第三方应用干扰的消费电子环境。如果两者跑在同一芯片上，如何保证座舱异常不会影响智驾安全，是所有厂商都必须跨过的门槛。地平线这次的方案，被作者视为在工程和量产层面迈出关键一步。

除了芯片，文章也提到地平线在操作系统和辅助驾驶上的完整布局。咖咖虾 OS 让其不再只是提供单点硬件能力，而是进一步进入整车系统层；HSD V1.6 则体现出地平线希望把硬件、系统和智驾能力打包成一整套可交付方案。换言之，地平线不再只是卖“算力”，而是在提供面向整车智能时代的系统级能力。

文章的整体判断是：地平线这次“三把火”意味着它正在从传统认知里的芯片供应商，升级为更完整的智能汽车基础设施玩家。对于行业来说，这种转变的意义不仅在于产品更多，而在于它代表了一种新的底层整合方向：未来竞争的关键，可能不只是单颗芯片的性能，而是谁能把芯片、系统和智驾能力更好地打通。

体会

这篇文章最值得关注的地方，是它把“舱驾融合”从概念拉到了更接近量产和系统落地的层面。对智能汽车行业来说，真正的门槛已经不是单点能力，而是系统级协同、量产可靠性和工程闭环能力。

自动驾驶芯片车载OS2026-04-24

现代化的悖论

wechat - 力哥原文链接

摘要

这篇文章从房地产、人口结构、以色列政治和全球少子化等多个角度，讨论作者所说的“现代化悖论”：越现代化、越受教育、越追求个人自由的社会，往往越不愿意生育，最终会反过来改变社会结构和政治走向。

文章先从中国房地产切入，认为很多人只看到房子总量过剩，却忽略了住房供给的结构性稀缺。作者强调，大量农村房、小城镇房和老旧远郊住房在未来可能逐步失去价值，而真正有价值的，是一二线核心区、较新的、带电梯和车位的“好房子”。在这个意义上，普通人买房更适合作为改善生活的消费决策，而不是投资决策。

接着，文章把讨论扩展到全球少子化。作者认为，现代教育、女性独立、生活成本上升和个人主义价值观，共同推动了生育率下降。这种变化在中国、东亚、欧洲和中东都有体现，只是表现方式不同。文章特别以伊朗和以色列为例，试图说明宗教、教育、经济条件和人口结构如何共同决定一个社会的政治走向。

关于以色列，作者认为，真正改变政治路线的不是抽象意识形态，而是人口结构本身。随着更保守、更高生育率的群体在总人口中的占比上升，国家政治会越来越偏向强硬和民族主义，这种变化很难通过程序正义逆转。文章把这种现象视为“文明在绝育、野蛮在繁衍”的一部分证据。

文章最后把希望寄托在 AI 与科技进步上。作者认为，如果未来 AI 真能显著降低知识门槛、提升生产力，并推动更广泛的现代化，那么人类社会也许能进入更稳定的低生育均衡状态。但他同时承认，这个过程需要时间，而现实世界在等到那一天之前，可能会经历更长时间的冲突、撕裂和极化。

体会

这篇文章的核心不是单一议题，而是把房产、人口、宗教、现代性和技术进步串成一个大框架：现代化会带来自由，也会带来生育率下滑；生育率下滑会重塑政治；而技术也许是唯一能缓解这一悖论的长期变量。

房地产生育率现代化2026-04-24

百万上下文普惠时代

wechat - DeepSeek 原文链接

摘要

DeepSeek 发布了全新系列模型 DeepSeek-V4 的预览版，并同步开源。文章强调，这一代模型的最大亮点是“百万字级上下文”，意味着模型在处理超长文本、长链路任务和复杂 Agent 工作流时，能保持更强的记忆与理解能力。官方希望借此把百万上下文能力进一步普惠化，让更多用户和开发者可以直接使用。

文章把 DeepSeek-V4 分成两个版本：V4-Pro 和 V4-Flash。其中，V4-Pro 面向更高质量任务，重点强调推理、知识和 Agent 能力；V4-Flash 则主打更快、更经济，适合高频调用和成本敏感场景。两者都支持 1M 上下文，并可通过官网 App、chat.deepseek.com 以及 API 方式调用。

在能力表现上，V4-Pro 被描述为在 Agent 能力上有显著增强，尤其是在 Agentic Coding 场景中表现突出，已经接近或超过多款主流闭源模型的部分非思考模式体验。文章还强调，它在世界知识和推理方面也取得了较强成绩：在知识测评上大幅领先其他开源模型；在数学、STEM 和竞赛代码等任务上，则达到了比肩顶级闭源模型的水平。

对普通用户来说，这篇文章传递出的信号很直接：DeepSeek 希望把“超长上下文 + 强推理 + 强 Agent”组合，做成一个可以实际落地的大模型能力栈。V4-Pro 适合追求效果的复杂任务，V4-Flash 更适合强调速度、性价比和批量使用的场景。对于开发者而言，API 的 model_name 也已经更新，可以直接切换到对应型号进行调用。

体会

这篇发布信息最值得注意的，不只是模型性能数字本身，而是 DeepSeek 明确把“百万上下文”从实验性能力推进到了可使用、可调用、可普及的产品阶段。未来如果长文档理解、代码仓库级别 Agent、跨文档推理等场景进一步成熟，这类模型可能会显著改变大模型应用的工作方式。

大模型 Agent 上下文2026-04-24