2026-04-27

共 4 篇

AI知识库难用

过去两三年,围绕“AI + 个人知识库”的方案已经轮番出现过很多次:Notion 配 ChatGPT、RAG 配 Obsidian、Obsidian 加 Claude Code、会自己写记忆的 Agent、以及最近 Karpathy 提出的 LLM Wiki。作者试过不少方案,但结论是:它们都不算真正解决了“长期知识状态”问题

一、问题不在“存”和“搜”

作者认为,很多人把个人知识库理解成“把资料存好、让 AI 能搜出来”,但这其实只覆盖了最表层的需求。

真正麻烦的是:

  • 一条判断什么时候生成
  • 凭什么成立
  • 什么时候过期
  • 与旧判断冲突时怎么办
  • 能不能追到证据
  • 模型有没有权力把自己的总结直接写成长期事实

也就是说,难点不是检索,而是长期知识状态的维护

二、四类“记忆”其实不是一回事

作者把大家常混在一起说的“记忆”拆成四层:

  1. 文档知识库:Obsidian、Notion、RAG,负责存放和检索资料
  2. 会话上下文管理:摘要、压缩、裁剪,解决长对话塞不下的问题
  3. 智能体记忆运行时:长期运行的 agent 什么时候读、写、审核、冻结记忆
  4. 个人知识状态系统:关于一个人或项目的长期知识,如何多年保持准确、可审计、可演化

作者的判断是:现在很多产品本质上只是拿第一层工具,去硬做第四层的事情,所以总会卡住。

三、RAG / Obsidian 能查,但不能积累

RAG 和 Obsidian 的优点很明显:资料能找出来,主题能搜到。但它们本质上是检索系统,不是知识维护系统

它们的问题在于:

  • 今天的判断不会自动继承到明天
  • 过期内容不会自动失效
  • 多份资料冲突时,系统不会主动处理
  • 很难知道某个结论到底来自哪段原文

所以它们越用越像资料仓库,而不是“越来越懂你”的系统。

四、让模型自己写记忆,也会出问题

第二类方案是让 AI 自己总结、自己沉淀、自己升级长期存储。看起来很自然,但作者认为这里有个危险假设:模型既负责提议,又负责决定什么是真相

他提到一个典型事故:用户让 agent 整理邮箱,并明确说“确认前不要执行任何动作”。但在后续上下文压缩里,这条关键约束被丢掉了,于是 agent 继续按自己的理解执行删除操作。

这个问题的本质不是“忘了一句话”,而是:

  • 安全约束
  • 审批合约
  • 长期偏好
  • 临时任务
  • 会话摘要

这些本不该混在一条链路里,但很多系统把它们都交给模型自己总结,最终就会把关键约束压没。

作者的结论很明确:模型可以提议,但不能由模型自己决定长期事实和危险动作

五、Hermes 做对了“运行时”,但还不够

作者认为 Hermes 这一类系统已经比前两类成熟很多,因为它真的把记忆当成一个运行时子系统来做,而不是“顺手加的功能”。

他特别认可的点包括:

  • 会话开始时冻结记忆快照
  • 记忆同步是异步管线,不在主回答链路里硬做
  • review 由独立的 quiet agent 处理
  • 记忆提供方可以抽象成多个 provider

但作者也指出,Hermes 主要解决的是“一个长期跑的 agent 怎么稳定携带工作记忆”,还没完全解决“个人多年积累的知识状态怎么编译成可审计、可演化、可投影的长期知识”。

六、Karpathy 的 LLM Wiki:进步了,但证据容易变软

Karpathy 的思路比纯 RAG 更进一步:不是每次问问题时才临时综合,而是让系统持续维护一份 wiki。

作者自己也本地实现过类似方案,刚开始效果很好,似乎能回答很多“我有哪些项目、我有什么习惯、资料之间有什么关联”这类问题。

但问题很快出现:AI 开始越来越依赖维基,而不是原文。

而维基的弱点在于:

  • 它是综合结果,不是事实源
  • 综合过程是有损的
  • 细节会丢失,解释会被加重,弱关系会被写成强关系
  • 用久了以后,很难追回原始证据

所以作者认为,维基可以是很好的投影,但不能当底层事实源。

七、真正需要的是“知识状态运行时”

作者最终把问题重新定义为:

如何在有限上下文、变化的世界、不可靠的抽取器之间,维护一份可验证的知识状态?

他给出的方向不是“更聪明的模型”或“更漂亮的笔记软件”,而是一套更完整的系统:

  • 原始资料进入系统
  • 变成可追溯的观察
  • 模型提出候选主张
  • 主张绑定证据、时间和风险等级
  • 低风险自动接受,中高风险进入审核
  • 通过后的主张进入长期状态
  • 对话、维基、报告、上下文包都从同一份状态投影出来

他强调的核心是:模型负责提议,系统负责权威

八、记忆系统至少要有四个关键层

1. 统一的运行时边界

记忆不能散落在各处读写,而应该由一个专门层统一负责什么时候读、什么时候写、什么时候进 prompt、什么时候后台处理。

2. 冻结快照

一场对话开始后,系统应该使用同一份记忆视图,不能中途因为后台更新而让模型看到不同版本。

3. 候选门

不是所有看起来“值得记住”的内容都能直接成为长期记忆。尤其是关于人的判断,应该默认高风险,先进入候选区。

4. 版本与可观测性

被编辑、替换、审批的记忆都应该保留版本历史,并且能追踪它为什么存在、什么时候生效、用了哪些证据。

九、知识层和权限层要分开

作者认为,记忆系统还有一个常被忽略的问题:记忆做对了,权限做错了一样会出事

所以至少要分清四种权力:

  • 事实写入权
  • 约束写入权
  • 工具执行权
  • 危险动作审批权

其中最关键的原则是:危险动作不能由模型自己批准自己

十、怎么判断这套系统真的变好了

作者目前关注的几个指标是:

  • 长期主张能不能追到原始资料
  • 新资料和旧主张冲突时,系统能不能发现
  • 过期主张能不能降权或失效
  • 同一场对话里的记忆是否稳定
  • 审核负担是否过重
  • 不同视图是不是都来自同一份状态源

他认为,判断一个个人知识系统,不能只看回答漂亮不漂亮,还要看它能不能解释自己为什么这么答,能不能回到证据,能不能发现冲突,能不能在时间里保持稳定。

结语

这篇文章的核心观点很清楚:“个人知识库”这个词太轻了,我们真正需要的可能是一个“知识状态运行时”

RAG 只能查,记忆系统要能维护;
Wiki 可以综合,但不能替代事实源;
模型可以提议,但不能自己定义真相;
知识可以投影,但底层必须有证据、版本和审核。

作者最后的判断是:这件事不会靠换一个更聪明的模型,或者换一个更漂亮的笔记应用来解决。它需要一整套能长期运行、可验证、可审计的系统设计。

Manus撤销交易

这篇文章围绕 Manus 被要求撤销交易这一事件展开,核心不是单纯讨论一笔并购,而是在讲:AI 时代创业公司的位置、身份、合规和技术归属,已经变成比融资故事更重要的问题

一、这不只是一次交易失败

作者认为,这次事件的重点不在于 Manus 少拿了多少钱,而在于它传递出一个非常明确的信号:过去那套“在中国起步、融资拿美元、主体放离岸、最后去美国退出”的默认剧本,在 AI 时代可能已经失效。

他把这件事看成一种旧世界模型的崩塌:

  • 以前创业公司更像纯商业主体,主要看产品、增长、估值和退出
  • 现在 AI 已经被放进国家竞争、技术边界和产业控制的框架里
  • 因此公司不再只是公司,它的位置会被重新审视

二、AI 时代,位置比能力更重要

文章反复强调一个判断:在大时代里,最重要的不只是能力,而是位置

作者问了几个很尖锐的问题:

  • 你站在哪里?
  • 你向谁证明价值?
  • 你把技术资产交给谁?
  • 你最终属于哪个体系?

他认为,创业者可以换注册地、换办公室、换融资口径,但很难换掉自己的生长史。公司在哪里长出来、谁贡献了核心人才、谁给了第一波流量和关注,这些都会成为身份的一部分。

所以 Manus 的问题不是“想不想国际化”,而是“你到底从哪里来、最终要站在哪边”。

三、不能既要、又要、也要

作者的态度很直接:全球化可以,但套利不行;出海可以,但切割不行。

他认为,创业者如果真想做一家美国公司、新加坡公司或欧洲公司,就应该从第一天开始在那边注册、融资、招人、接受监管,而不是先吃中国生态红利,等做大后再包装成“非中国资产”卖给美国巨头。

他把这种中间状态视为最危险的路:

  • 出发时要中国速度
  • 融资时要美元估值
  • 传播时要全球化光环
  • 退出时要美国接盘

在和平周期里,这种模糊可能被看作聪明;但在冲突周期里,这种模糊就是风险。

四、这对中国 AI 创业生态意味着什么

作者认为,这次事件之所以重要,是因为它会形成示范效应。

如果 Manus 这条路被默许,那么后面会有更多中国 AI 创业者走同样路径:

  • 在中国技术生态里起步
  • 做出声量后搬去离岸地区
  • 最后被美国大厂收购整合

而这对中国 AI 生态来说,会是一个很坏的信号,因为它会鼓励“先吃红利、再切出去”的路径成为默认选择。

所以从系统角度看,这不是一个单独公司的问题,而是对一种创业路线的否定。

五、AI 时代的竞争,已经不是上一代互联网逻辑

作者认为,很多创业者还在用上一代互联网的逻辑理解 AI:

  • 以为本质还是资本游戏
  • 以为只要产品好、增长快,就能自然完成全球化
  • 以为技术可以和国家边界脱钩

但他认为 AI 不是团购、外卖,也不是短视频推荐算法升级,而是会变成下一代软件入口、智能体工作流和产业分工的关键资产。

因此,今天处理 AI 公司,不能再只看商业路径,还要看:

  • 技术归属
  • 产业位置
  • 监管边界
  • 国家竞争关系

六、这篇文章真正的核心:战略判断

文章最后落到一个很明确的结论:创业者最重要的能力,不是只会往前冲,而是要看清自己站在哪里

作者认为:

  • 如果选择美国公司,就一开始就在美国做
  • 如果选择新加坡公司,就一开始在新加坡做
  • 如果选择中国公司,就承认自己在中国体系里,想清楚自己的责任和代价

他说,时代重新划线的时候,位置会决定很多东西:融资、退出、并购、合规、团队流动,甚至公司身份本身。

结语

这篇文章的语气很强,但核心观点其实很简单:

AI 时代的创业,不再只是做产品和讲故事,而是先回答“你是谁、你从哪里来、你站在哪个体系里”

作者给创业者的提醒是:

往前跑,别回头。

不是因为前面一定安全,而是因为回头的那条路,已经不在了。

霍华德学AI

这篇文章围绕橡树资本联合创始人霍华德·马克斯如何看待和使用 AI 展开。作者借助霍华德自己用 Claude 完成的一篇长备忘录,系统梳理了他对 AI 本质、最新进展、投资影响、泡沫判断与社会冲击的思考。

一、霍华德如何理解 AI

霍华德最核心的认识是:AI 不是搜索引擎,而是能综合信息、进行推理的系统。他把 AI 的生命过程分成两个阶段:

  • 训练:模型通过海量文本学习推理模式、论证结构和概念组合方式
  • 推理:模型在接到提示词后,利用已有能力回应用户任务

他特别强调,AI 的关键不只是“记住了多少信息”,而是学会了“如何思考”。因此,提示词质量非常重要;很多人低估 AI,不是因为模型不行,而是因为自己不会提需求。

二、AI 正从聊天工具变成劳动替代品

文章里用一个很清晰的三阶段模型描述 AI 的演进:

  1. 聊天式 AI:回答问题,节省思考时间
  2. 工具型 AI:会搜索、分析、执行任务,开始节省执行时间
  3. 自主代理:用户只给目标和约束,AI 自己完成任务并交付结果

霍华德认为,真正重要的变化在于第三层。到这一步,AI 不再只是辅助人类,而是开始替代劳动力,这也是为什么它的经济影响会突然变得巨大。

三、AI 的发展速度前所未有

霍华德反复强调一个判断:AI 的普及速度远快于历史上的计算机和互联网

他拿计算机的发展做对比:从 ENIAC 到个人电脑普及,经历了几十年;而 AI 从“看不见的基础能力”到“被大众广泛使用”,只用了很短时间。他认为这意味着两件事:

  • 企业和个人适应 AI 的时间窗口非常短
  • AI 带来的变化会在社会还没完全准备好的情况下迅速发生

四、AI 可能重塑软件、工作和安全边界

霍华德对 AI 的一个重要担忧,是它会同时冲击多个领域:

  • 软件开发:很多结构化工作会被 AI 接管
  • 安全与漏洞发现:AI 可能让系统漏洞暴露得更快
  • 反爬与对抗:网站会越来越难用传统手段区分人和机器

他并不把 AI 看成“只会提高效率的工具”,而是更像一种会改变规则的技术。尤其是当代理能力增强后,AI 可能会开始做过去根本没有自动化想象空间的任务。

五、他怎么看 AI 的局限

尽管态度偏乐观,霍华德也明确写出了 AI 的局限:

  • 它在真正全新的情境里不一定可靠
  • 它有幻觉,未必知道自己不知道什么
  • 它仍然会犯错
  • 它的上下文窗口有限,记忆并不完整
  • 它可能让人过度信任其输出

他认为,AI 很强,但并不是“无所不能的思考机器”。尤其在缺乏历史模式、需要直觉和主观判断的领域,人类仍然有价值。

六、AI 对投资意味着什么

在投资层面,霍华德的判断很有代表性:

  • AI 很擅长处理量化信息、识别历史模式、保持冷静
  • 但伟大的投资并不只依赖数据,还依赖对定性因素的判断
  • 比如管理层、产品创新、合作方、时机、直觉等,都不是简单模式匹配能完全替代的

他的结论是:AI 会提高投资门槛,但不会完全消灭优秀投资者的价值。未来真正能胜出的,仍然是那些能判断信息意义、理解定性因素、并对新环境做出高质量猜测的人。

七、这是泡沫吗?他的态度很克制

霍华德对“AI 是不是泡沫”这个问题的回答并不极端。他的态度是:

  • AI 技术本身是真的,不是幻觉
  • 市场需求也是真的,而且增长很快
  • 但基础设施投资是否过度、资产价格是否合理,仍然不能轻易下结论

所以他不建议:

  • 全仓押注
  • 也不建议完全离场

更合理的做法是:保持适度仓位,同时精选标的、保持审慎

八、他最担心的是就业与社会冲击

文章最后一部分转向社会层面。霍华德真正担心的,不只是技术和估值,而是AI 带来的失业与身份感危机

他引用了大量例子说明:

  • 软件、广告、驾驶、分析、合规等岗位都可能被重塑
  • AI 替代的不是一两个岗位,而是很多结构化知识工作
  • 社会可能来不及为被替代的人创造足够快的新工作

他也讨论了乐观派的说法——历史上每次技术革命都会创造新岗位——但他并没有完全相信这种外推。他的态度是:希望自己是错的,但不能假装风险不存在

总结

这篇文章最有价值的地方,不在于它给出了某个单点结论,而在于霍华德用一个非常成熟的投资框架,去理解 AI 这场技术革命:

  • 它是真实的
  • 它发展极快
  • 它已经开始替代劳动
  • 它会影响投资、软件和社会结构
  • 但它仍然有局限,仍然不能被神化

整体上,这是一篇很典型的“老练投资人学习 AI”的笔记:既有好奇心,也有克制;既承认机会,也不回避风险。

Agent 动力学

这篇文章是 42 章经对 RC 的访谈,核心围绕三个主题展开:CLI 时代为什么重新兴起、Agent 产品该如何设计、以及多 Agents 协作的组织形态会怎样演化。整篇对话的信息量很大,重点不是单纯讲一个工具,而是在讨论「人和 AI 如何一起工作」这件事。

1. CLI 为什么会重新火起来

RC 认为,CLI 之所以再次变得重要,是因为它对 Agent 更友好。相比图形界面,命令行天然是文本化、结构化的,更适合大模型理解和操作。随着 Agent 能力提升,过去只适合人类直接使用的 GUI,反而不一定是最优入口。

他强调,今天的 CLI 已经不只是“给人用的命令行工具”,而是开始变成“给 Agent 用的工作界面”。因此,输入要尽量简洁、明确,输出要尽量稳定、高密度、可被机器直接读懂。

2. Kimi CLI 和“本地 Agent harness”

RC 回顾了自己做 Kimi CLI 的经历。他并不认为 CLI 是 Agent 的终局形态,但它是一个很好的起点,因为可以先把最底层的本地执行框架做扎实:

  • 先有一个最小可用的 agent loop
  • 先接入 bash tool
  • 再逐步补充更多 built-in tools
  • 再基于这套 harness 封装 SDK,扩展到 Web UI、VS Code 插件等形态

他很看重这种“从第一性原理往上搭”的方式,认为这样更容易发现新的 insights,也更容易把能力沉淀成可复用的底座。

3. 模型能力提升后,安全与反爬都会被重写

文章里有一段很重要的判断:当模型能力继续提升,很多原本依赖“人类行为差异”的防线会被削弱。RC 认为,不论是安全漏洞扫描,还是网站反爬,Agent 都会越来越强,甚至会反过来逼迫防守方升级。

他提到,未来模型如果足够强,可能会让底层软件、编译器、内核、浏览器等系统暴露更多漏洞;而防守和修复往往跟不上攻击速度。类似地,网站也会越来越难依靠传统交互方式来区分人和机器。

4. Slock:不是单个 Agent,而是多人 + 多 Agents 的协作平台

RC 重点介绍了他创业后在做的 Slock。它不是一个“单一全能 Agent”,而更像一个人和多个 Agents 协作的工作空间

他认为,今天的 Agent 使用形态会越来越接近组织协作,而不是单人问答:

  • 需要通信:人和 Agent、Agent 和 Agent 之间要能沟通
  • 需要分工:任务发出后要有 claim / lock 机制,避免重复抢活
  • 需要共享:不同 Agent 的沉淀要能被其他人和 Agent 复用

他把这套机制类比成一种“AI 版飞书”,但底层逻辑更偏 Agent-first。

5. 多 Agents 协作的“动力学”

文章里最有意思的概念之一是“Agent 动力学”。RC 认为,当多个 Agent 长期协作时,它们不只是各自拥有 memory,还会形成一种群体记忆和群体文化,类似组织行为学中的公司文化。

他观察到,不同用户会把 Agent 组织成不同风格:

  • 有的更像协作型团队
  • 有的更像赛马竞争
  • 有的甚至会出现“办公室政治”式行为

这说明,未来 Agent 产品不只是工程问题,也会越来越像组织学、管理学和社会学问题。

6. Memory 比 skill 更重要

RC 对 MCP、skill、prompt 的看法也很明确:

  • MCP 本质上常常只是把 API 再包装一层
  • skill 只是把能力标准化、结构化,方便分发
  • 真正重要的是 memory

他认为,Agent 市场里卖的不是某个固定功能,而是该 Agent 的长期记忆、长期对话、纠偏过程和行为模式。也就是说,用户买到的不是“一个 app”,而更像是“一个会持续演化的工作伙伴”。

7. agent-first 产品设计:让 AI 先看懂,再让人看懂

文章后半段讨论了一个很关键的问题:产品不应该只为人设计,还要为 Agent 设计。

RC 提到,人类看界面是依赖空间结构的,但 Agent 的记忆是线性的 context,因此产品需要考虑:

  • Agent 如何快速定位上下文
  • 新消息如何和旧任务关联
  • 如何把任务摘要、状态、历史记录组织成 Agent 能直接用的信息

他说,真正难的不是把界面做漂亮,而是让“Agent 看到的产品”足够清晰、可执行。

8. 人和 AI 的未来关系

RC 的整体态度偏乐观。他认为未来不会简单变成“AI 取代人”,而更可能是:

  • 顶尖模型厂商越来越重视安全边界
  • 人类和 AI 会在更复杂的组织结构里协作
  • 编程、产品、设计、增长、运营等许多工作都会变成“先说目标,再由 AI 执行”的方式

他甚至提到,很多以前需要程序员才能做的事情,未来会被 top-down 的方式重写:先用 prompt 做出原型,再按需补充更深层的知识。

结语

这篇访谈的价值不在于某个单点技巧,而在于它把 CLI、Agent、Memory、多 Agents 协作、组织结构 这些概念串成了一条线。RC 的核心判断是:未来重要的不是“一个超级 Agent”,而是一个能让很多 Agent 和人一起工作的系统。

如果说传统软件是在为人设计界面,那么这一代产品开始是在为“人 + Agent 共同组成的组织”设计基础设施。