返回列表

把公司的做事方式写进模型权重里

ai-insights2026-06-2810 min read
把公司的做事方式写进模型权重里

作者:王林Lincoln | MindsLeap创始人 | Founders Space合伙人 | 企业家AI俱乐部创始人

"我们不是站在预训练或后训练的视角看世界,我们的模型永远在训练。"

这句话出自 Engram 联合创始人 Dan Biderman,背景是红杉资本的一场对谈。Engram 是一家专注记忆与持续学习的新实验室,他们的判断很直接:今天 AI 落地的瓶颈,已经不再是模型有多聪明。

"让模型变得更有用的瓶颈,不是原始智能,而是理解新的、不断演化的上下文。"

这句话值得所有正在引入 AI 的企业负责人停下来想一想。

提示词塞不了一家公司的做事方式

过去两年,企业用 AI 的主流做法是"上下文工程":把公司文档灌进提示词,用检索增强生成让模型在回答前先去翻文件。这套方法有效,但有一个越来越明显的天花板。

Jessy Lin,Engram 的另一位联合创始人,说了一个朴素的比喻:"做笔记、贴便利贴当然有价值,但第二天回到工位时,我们脑子里总会留下某种记忆痕迹,对事情应该怎么做的新直觉,对应该去哪里找东西的直觉。"

现在的方案,更像是在给模型塞便利贴。而 Engram 想做的是,让模型长出那层"记忆痕迹"。

这个区别在商业上意味着什么?他们给出的数据是:某些任务可以把 token 消耗降低两个数量级,不是减半,是一百倍。那些涉及人员、团队、组织优先级的事,你很难在一份文档里找到完整答案,但模型可以通过训练隐式地学会,然后只用一百个 token 就回答出原本需要十万个 token 才能处理的问题。

事实记忆和技能学习,根本分不开

学术界一直有一种想法:模型把"法国首都是巴黎"这种事实写进权重里,是件坏事。理想状态是模型只学习抽象概念,事实应该靠检索。

Dan 的回答很干脆:"某种程度上,你需要记住一些东西,才能把它们组合成更复杂的概念。"

他进一步解释了一个反直觉的观察:有人尝试把模型里的事实全部剥离,只留下"纯核心",结果模型变得极不自然,连基本的东西都不知道。"如果你需要回忆基本事实才能迈出思考的下一步,你就走不了太远。"

这对企业的启示是:不要把"知识管理"和"能力培养"当成两件事。一个新员工,既需要知道公司的制度文件,也需要在实践中把这些制度内化为判断力。AI 也是一样,它需要先"知道",才能"理解"。

深度学习把算法和数据库揉在了一起

传统计算机科学里,数据库是数据库,算法是算法。一个存事实,一个处理事实。泾渭分明。

Dan 说了一段让技术出身的创始人会心一笑的话:"深度学习的魔力在于,这两样东西现在被揉在了一起。"

他说这正是当前 AI 在企业中落地的核心张力:公司有自己的上下文,处理得极其精细,而通用模型对这些上下文完全是陌生人。"对于我们来说,很明显,事实、故事和细节需要以某种节奏,被混合进模型里。"

这实际上在描述一种新的 IT 架构方向:不再把企业知识库当作一个被查询的外部系统,而是让模型本身成为组织记忆的载体。

AI 也需要"做梦"的时间

访谈中最有意思的一段,是关于睡眠和梦的讨论。

Jessy 描述了一个设想:"我们给模型留出时间,从实际交互中退回来,去实验它的能力边界,它能做什么?它知道什么?它能多快地调用这些知识?"

就像人类在睡眠中巩固记忆、在梦境中演练社交场景一样,Engram 认为模型也需要一段"离线消化"的时间,而不是永远在实时应答中疲于奔命。

这听起来有些科幻,但背后的商业逻辑是清晰的:如果 AI 智能体要成为团队里的"长期成员",它就不能只做即时问答机器,它需要有沉淀、有反思、有自我修正的周期。

从团队开始,而非从个人开始

有人问:为什么不先做个人级模型?

Dan 的回答很务实:"团队在收集上下文的纪律性和数据量上更成熟,从团队开始更容易。但每个人的电脑和手机,终有一天会是我们技术的目标。"

Engram 目前与 Notion、Microsoft、Harvey 等公司合作,为团队协作空间训练"专属模型"。技术路径主要是 adapter 微调,也就是在不改动大模型主干的情况下,为每个团队挂上可学习的适配器层。

这需要白盒权重访问,所以在开源模型上更容易实现。但对于正在评估 AI 基础设施的企业来说,这个方向已经足够清晰:未来的企业 AI 不是"一个通用模型加一套检索系统",而是"一个通用底座加无数个团队级个性化模型"。

判断与行动

Engram 的叙事传递了几个值得关注的信号。

第一,上下文窗口的竞赛可能正在触顶。当上下文膨胀到每天数千万 token 时,检索和重读的成本会变得不可持续。把知识编译进权重,可能比不断扩大上下文更经济。

第二,企业 AI 的竞争壁垒,将从"谁接入了哪个大模型"转向"谁的模型更懂自己的业务"。通用能力会越来越 commoditize,而组织知识的内化程度才是真正的护城河。

第三,持续学习的技术路径还在早期。adapter 微调、强化学习、策略蒸馏,这些工具已经存在,但如何把它们拼成一个能长期运行、自动筛选重要信息的系统,还没有标准答案。

对中国企业家而言,现在不需要押注某一种具体技术方案,但需要开始思考一个问题:你公司的"做事方式",那些没有写进 SOP 的经验、那些只有老员工才知道的上下文、那些反复出现但每次都要重新解释的问题,如果有一天,它们被写进了一个模型里,这个模型会是谁的?

也许答案不应该是某家通用 AI 公司的,而应该是你自己的。


来源说明

本文由Lincoln根据 Sequoia Capital 官方频道 2026 年 6 月 24 日发布的视频《Memory and Continual Learning: Engram's Dan Biderman and Jessy Lin》进行解读。


关于 MindsLeap 心智悦动

MindsLeap 是 AI 转型加速器,帮助传统企业家在 AI 时代找到转型路径。 与硅谷孵化器 Founders Space 合作,连接科技创业者与真实客户/场景, 连接国内外资本、硅谷科技圈,助力中国产业 AI 转型和出海。

返回列表
王林Lincoln · 2026-06-28