

你知说念吗,让 Agent记着你的技俩落魄文、技能决策和责任民风,这件事完全不错不花一分钱、不连任何云作事、数据全留在我方电脑上就作念到。
每次掀开 Hermes 或 OpenClaw 新建会话,你都得从头讲解注解一遍技俩用了什么框架、前次修 MCP 断线用的什么敕令、为什么选 jose 而不是 jsonwebtoken。不是模子不够灵巧,是落魄文窗口实质上是"一次性"的——会话收尾,牵记也随着清零。
开源社区早就盯上了这个问题。曩昔一年里,至少有六款专诚针对 Agent牵记彭胀的开源器具冒了出来——统统开源免费、统统不错土产货部署、并且功能少许不诳骗。
这篇著作就带你把这六款器具逐一看一遍:它们何如责任的、何如安安装置、各自有什么所长和短板、你的场景最合适哪个。
先搞清你需要哪种"牵记"
在聊具体器具之前,有一个关键分袂要先讲解显——AI 助手需要记的东西,其实分两种:
类型问的问题例如行为/情节牵记"我(Agent)前次何如操作的?""前次建立 MCP 断线用了什么敕令?"常识/文档牵记"我知说念什么尊府?""GEO 写稿程序第三条何如说的?"
前者记载 Agent 的操作历史,后者检索已有的文档常识库。两类需求合适不同的器具,最佳的决策是搭配使用。
一、行为牵记类:让 Agent 记着"我作念过什么"
1. agentmemory
GitHub:rohitg00/agentmemory(23,000+ Stars,MIT 契约)
agentmemory 是当今热心度最高的 AI 编程 Agent 握久牵记决策。它的中枢卖点就一个词:零纷扰。Agent 践诺器具调用时,它通过 Hook 机制自动静默拿获通盘操作,你什么都毋庸管。
责任旨趣
每次 Agent(Hermes、Claude Code 等)调用器具时,agentmemory 拿获一条 Observation 记载。
这些记载经由 iii-engine 压缩后存入土产货 SQLite。下次新建会话时,agentmemory 自动检索磋议历史落魄文并注入进去。
检索机制:三流交融
这是 agentmemory 最值得细说的所在。它不是绵薄地作念关键词搜索——它同期跑三路:BM25 全文检索、向量语义检索、常识图谱遍历,终末通过 RRF(Reciprocal Rank Fusion)交融排序。在 LongMemEval-S 基准测试上,调回率作念到了 95.2%,而 mem0 唯有 68.5%、Letta/MemGPT 是 83.2%。
典型使用场景
记着技俩里用了哪个库以及为什么选它("为什么用 jose 而不是 jsonwebtoken")
跨会话不竭前次没作念完的任务
自动遁藏仍是踩过的坑("这个 CORS 问题前次何如责罚的")
多个 Agent 实例(Hermes + OpenClaw)分享吞并份技能决策历史
优点
零纷扰,完全自动拿获,不需要手动贵重担何文献
零外部依赖,纯 SQLite,不需要 Docker 或特地作事
多 Agent 分享,一个作事同期作事多个 Agent 实例
MIT 契约,完全土产货运行,不连任何外部 LLM
调回精度在同类器具中最高(95.2% R@5)
❌ 缺陷
仅对接 Coding Agent,不合适通用 LLM 行使的用户画像场景
默许 Embedding 模子(all-MiniLM-L6-v2,80MB)对华文援手一般,华文技俩提议替换为 Qwen3-Embedding
依赖 iii-engine 版块锁定(v0.11.2),升级需严慎
值得在意的是,agentmemory 的牵记写入和检索均不调用任何 LLM,完全土产货计较。这是它和 mem0 最大的区别之一。
2. mem0
GitHub:mem0ai/mem0(41,000+ Stars,Apache 2.0)
mem0 和 agentmemory 定位不同。它面向的是 LLM 行使(聊天机器东说念主、个性化助手),从对话内容中自动提真金不怕火结构化用户事实——偏好、民风、身份信息——构建用户画像。
责任旨趣
每次对话收尾后,mem0 调用 LLM 分析对话内容,提真金不怕火出雷同"这个用户可爱 TypeScript、不可爱冗余注目"的事实,写入向量数据库。下次对话时检索注入,完毕个性化。
典型使用场景
记着用户的编码立场偏好("可爱函数式立场,毋庸 class")
跨会话保握用户画像("这个用户在作念 Electron 技俩")
构建面向末端用户的个性化 AI 居品
优点
自动从对话提真金不怕火事实,无需手动回归
援手 MCP 接入,可集成到 Hermes/OpenClaw
生态最训诫(YC 投资,14M+ 下载)
❌ 缺陷
部署较重:需要 Qdrant 或 Chroma 等向量数据库(特地 Docker 作事)
每次写入牵记时必须调用 LLM 提真金不怕火事实(援手土产货 Ollama/oMLX)
与 agentmemory 定位不同,不合适替代后者
二、常识检索类:让 Agent 找到"我存了什么"
3. QMD
GitHub:Shopify CEO Tobi Lütke 发起,OpenClaw 生态中枢器具(MIT 契约)
QMD(Quick Markdown Database)是专为 OpenClaw / Hermes 盘算的土产货 Markdown 常识库搜索引擎。它责罚的问题不是"前次何如作念的",而是"我的札记里写了什么"。
责任旨趣
QMD 对你 workspace 目次下的通盘 Markdown 文献建立双索引——BM25 倒排索引加向量索引——查询时两路打分,再经 Reranker 交融排序,复返最磋议的文本段落。三个土产货模子自动下载,所有这个词约 2.3GB:
模子变装默许模子大小Embeddingjina-embeddings-v3 (GGUF)330 MBRerankerjina-reranker-v2-base-multilingual (GGUF)640 MBQuery Expansion内置小 LLM1.3 GB
华文技俩可替换为 Qwen3-Embedding GGUF 以优化检索截止。
典型使用场景
搜索技能札记、架构盘算文档("这个接口的盘算原则")
检索 GEO 写稿程序("SEO 关键词密度条款")
查找已有代码片断的讲解("Aliyun OSS 签名上传的备注")
看成 NotebookLM 的土产货替代决策
优点
专为 Markdown 优化,OpenClaw 生态原生援手
三模子管线检索质地高(BM25 + 向量 + Reranker)
完全离线,模子下载一次后弥远缓存
援手多 Collection,不同技俩常识库相互防碍
❌ 缺陷
需要手动贵重 Markdown 文献,火狐官网不自动拿获 Agent 行为
初次 qmd embed 下载约 2.3GB 模子
对代码库和非 Markdown 文献援手有限
Query Expansion 阶段会调用内置小 LLM,增多查询蔓延约 300ms,无需特地配置。
4. Cognee
GitHub:topoteretes/cognee(Apache 2.0)
Cognee 从根底上区别于 QMD:它不作念文档不异度检索,而是从文档中提真金不怕火常识图谱,恢复"A 和 B 有什么关系"这类推感性问题。
责任旨趣:ECL 三阶段
Extract:识别文档中的实体(模块、东说念主员、成见、技能名词)
Cognify:用 LLM 揣测实体间关系(依赖/影响/属于),构建三元组
Load:写入土产货图数据库(默许 NetworkX 内存图,可换 Neo4j)
查询时通过图遍历而非向量不异度,能完毕多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些作事"——这种问题 QMD 是答不了的。
典型使用场景
表示代码库中模块之间的依赖关系
揣测"A 功能崩溃会影响哪些下流"
从多篇文档中空洞出共同论断
分析系统架构的影响链路
优点
❌ 缺陷
索引速率慢,每篇文档都要跑 LLM 提真金不怕火实体,约比 QMD 慢 5–10 倍
查询蔓延较高(图遍历 200ms–2s)
对绵薄的文档检索需求属于"杀鸡用牛刀"
实体提真金不怕火是 Cognee 的中枢体式,必须调用 LLM,但援手土产货 Ollama/oMLX,完全免费。
三、时序与用户画像类
5. Zep(Community Edition)
GitHub:getzep/zep(Apache 2.0)
Zep 专注于时序感知牵记——它不仅记着"说了什么",还记着"什么时候说的、这条信息是否已被更新遮盖"。2026 年与 LangGraph 深度整合后热心度大增。
典型使用场景
"上周我说用 Redis,这周改成了 SQLite,以最新的为准"
跟踪技俩决策的演化历史(某个技能决策资格了几次变更)
需要时刻线推理的复杂对话系统
优点
时序跟踪是稀奇才智,其他器具都莫得
2026 年 LangGraph 官方集成,生态好
企业级盘算,援手大边界部署
❌ 缺陷
需要 Postgres + pgvector,部署比拟重
对纯 Coding Agent 场景价值有限(agentmemory 更合适)
6. TencentDB Agent Memory
GitHub:Tencent/TencentDB-Agent-Memory(Apache 2.0,2026 年 4 月开源)
腾讯开源的四层渐进式牵记架构,完全 SQLite 土产货运行,对华文内容和国里面署环境针对性优化。
四层架构
层级内容L0 原始对话全量保存L1 原子牵记自动提真金不怕火事实、偏好、关键阻挡L2 场景分块按技俩聚类,落魄文精确调回L3 用户画像踏实个性化剖释
典型使用场景
华文环境的用户偏好牵记
国内信创/稀奇化部署场景
替代 mem0 的纯土产货华文决策
优点
零外部依赖,纯 SQLite
华文分词和语义表示针对性优化
Apache 2.0,国内社区贵重活跃
❌ 缺陷
生态相对较新,MCP 器具数目少于 agentmemory
文档和社区资源主要为华文
L1 层提真金不怕火事实需要长入 LLM(可配置土产货 Qwen3)
对比总览
功能与技能对比
器具定位写入神志检索神志土产货依赖需要 LLM开源契约agentmemoryCoding Agent 行为牵记自动 HookBM25+向量+图谱SQLite(零依赖)不需要MITmem0用户画像/个性化自动提真金不怕火向量检索需要 Qdrant需要Apache 2.0QMDMarkdown 文档检索手动写文献BM25+向量+Reranker土产货 GGUFQuery ExpansionMITCognee常识图谱/关系推理自动提真金不怕火三元组图遍历土产货(需 LLM)必须Apache 2.0Zep CE时序感知牵记自动提真金不怕火向量+时序索引Postgres+pgvector需要Apache 2.0TencentDB AM华文用户画像自动提真金不怕火向量检索SQLite(零依赖)L1 层需要Apache 2.0
土产货部署友好度
器具磁盘占用特地作事部署难度agentmemory~80–600 MB(Embedding)恶浊简QMD~2.3 GB(3个GGUF模子)恶浊简TencentDB AM极小(SQLite)恶浊简Cognee~500 MB SDK + LLM已有 Ollama/oMLX绵薄mem0~1 GBQdrant(Docker)中等Zep CE~2 GBPostgres + pgvector(Docker)较复杂
检索精度对比
器具评测得分备注agentmemory95.2%(LongMemEval-S R@5)三流交融检索Letta/MemGPT83.2%供参考mem068.5%不同场景盘算,不完全可比Zep75.14%(LOCOMO)不同基准,侧重时序推理
各器具使用不同评测基准,数字不行径直横向比拟,仅供参考。
何如选?场景决策树

保举的组合决策
关于 OpenClaw / Hermes 的个东说念主招引者,仙踪问说念团队在实验部署中考据了一个三层搭配决策:
第一层用 agentmemory,自动拿获 Agent 行为历史,零纷扰,关掉岂论它,它沉默在后台记载通盘的技能决策和操作。
第二层用 QMD,把热切的技能札记、技俩程序写成 Markdown,Agent 就能随时检索这些常识库。两个器具都看成 MCP Server 挂载,互不干扰,一个管"作念过什么",一个管"知说念什么"。
技俩复杂度上去之后——代码库有好几个微作事、模块之间依赖关系复杂——再加 Cognee,引入图谱推理才智。三层就皆了:行为牵记 + 文档检索 + 关系推理。
# ~/.hermes/config.yaml
mcp_servers:
agentmemory:
command: "npx"
args: ["@agentmemory/mcp"]
qmd_search:
command: "qmd"
args: ["serve", "--port", "7333"]
归根结底,Agent的"失忆症"不是技能作念不到,而是穷乏一个中间层——一个能在会话除外握久化常识、跨会话注入落魄文的牵记系统。开源社区给的这六款器具,等于在补这一层。它们通盘开源免费、统统不错土产货运行、数据留在我方的机器上。
还没下载使用Openclaw和Hermes, 快来仙踪问说念·智能助手启动你的智能之旅吧!



附录:关键术语
MCP(Model Context Protocol):Anthropic 推出的灵通契约,允许 LLM 通过尺度接口调用外部器具和作事。agentmemory、QMD 等器具均提供 MCP Server,可径直挂载到 Hermes/OpenClaw
BM25:经典全文检索算法,基于词频和逆文档频率打分,速率快
向量检索:将文本颐养为高维数字向量,基于语义不异度检索
Reranker:对初步检索截止从头打分排序的模子
常识图谱:以节点(实体)和边(关系)表见告识的图结构,援手多跳推理
LongMemEval-S:专诚评测 AI Agent 跨会话永恒牵记才智的尺度基准测试集火狐体育中国官网入口