火狐体育中国官网入口 Agent六款开源牵记器具大横评——统统能土产货跑, 统统不费钱

2026-06-19 00:53 点击次数：129

火狐体育中国官网入口 Agent六款开源牵记器具大横评——统统能土产货跑，统统不费钱

你知说念吗，让 Agent记着你的技俩落魄文、技能决策和责任民风，这件事完全不错不花一分钱、不连任何云作事、数据全留在我方电脑上就作念到。

每次掀开 Hermes 或 OpenClaw 新建会话，你都得从头讲解注解一遍技俩用了什么框架、前次修 MCP 断线用的什么敕令、为什么选 jose 而不是 jsonwebtoken。不是模子不够灵巧，是落魄文窗口实质上是"一次性"的——会话收尾，牵记也随着清零。

开源社区早就盯上了这个问题。曩昔一年里，至少有六款专诚针对 Agent牵记彭胀的开源器具冒了出来——统统开源免费、统统不错土产货部署、并且功能少许不诳骗。

这篇著作就带你把这六款器具逐一看一遍：它们何如责任的、何如安安装置、各自有什么所长和短板、你的场景最合适哪个。

先搞清你需要哪种"牵记"

在聊具体器具之前，有一个关键分袂要先讲解显——AI 助手需要记的东西，其实分两种：

类型问的问题例如行为/情节牵记"我（Agent）前次何如操作的？""前次建立 MCP 断线用了什么敕令？"常识/文档牵记"我知说念什么尊府？""GEO 写稿程序第三条何如说的？"

前者记载 Agent 的操作历史，后者检索已有的文档常识库。两类需求合适不同的器具，最佳的决策是搭配使用。

一、行为牵记类：让 Agent 记着"我作念过什么"

1. agentmemory

GitHub：rohitg00/agentmemory（23，000+ Stars，MIT 契约）

agentmemory 是当今热心度最高的 AI 编程 Agent 握久牵记决策。它的中枢卖点就一个词：零纷扰。Agent 践诺器具调用时，它通过 Hook 机制自动静默拿获通盘操作，你什么都毋庸管。

责任旨趣

每次 Agent（Hermes、Claude Code 等）调用器具时，agentmemory 拿获一条 Observation 记载。

这些记载经由 iii-engine 压缩后存入土产货 SQLite。下次新建会话时，agentmemory 自动检索磋议历史落魄文并注入进去。

检索机制：三流交融

这是 agentmemory 最值得细说的所在。它不是绵薄地作念关键词搜索——它同期跑三路：BM25 全文检索、向量语义检索、常识图谱遍历，终末通过 RRF（Reciprocal Rank Fusion）交融排序。在 LongMemEval-S 基准测试上，调回率作念到了 95.2%，而 mem0 唯有 68.5%、Letta/MemGPT 是 83.2%。

典型使用场景

记着技俩里用了哪个库以及为什么选它（"为什么用 jose 而不是 jsonwebtoken"）

跨会话不竭前次没作念完的任务

自动遁藏仍是踩过的坑（"这个 CORS 问题前次何如责罚的"）

多个 Agent 实例（Hermes + OpenClaw）分享吞并份技能决策历史

优点

零纷扰，完全自动拿获，不需要手动贵重担何文献

零外部依赖，纯 SQLite，不需要 Docker 或特地作事

多 Agent 分享，一个作事同期作事多个 Agent 实例

MIT 契约，完全土产货运行，不连任何外部 LLM

调回精度在同类器具中最高（95.2% R@5）

❌ 缺陷

仅对接 Coding Agent，不合适通用 LLM 行使的用户画像场景

默许 Embedding 模子（all-MiniLM-L6-v2，80MB）对华文援手一般，华文技俩提议替换为 Qwen3-Embedding

依赖 iii-engine 版块锁定（v0.11.2），升级需严慎

值得在意的是，agentmemory 的牵记写入和检索均不调用任何 LLM，完全土产货计较。这是它和 mem0 最大的区别之一。

2. mem0

GitHub：mem0ai/mem0（41，000+ Stars，Apache 2.0）

mem0 和 agentmemory 定位不同。它面向的是 LLM 行使（聊天机器东说念主、个性化助手），从对话内容中自动提真金不怕火结构化用户事实——偏好、民风、身份信息——构建用户画像。

责任旨趣

每次对话收尾后，mem0 调用 LLM 分析对话内容，提真金不怕火出雷同"这个用户可爱 TypeScript、不可爱冗余注目"的事实，写入向量数据库。下次对话时检索注入，完毕个性化。

典型使用场景

记着用户的编码立场偏好（"可爱函数式立场，毋庸 class"）

跨会话保握用户画像（"这个用户在作念 Electron 技俩"）

构建面向末端用户的个性化 AI 居品

优点

自动从对话提真金不怕火事实，无需手动回归

援手 MCP 接入，可集成到 Hermes/OpenClaw

生态最训诫（YC 投资，14M+ 下载）

❌ 缺陷

部署较重：需要 Qdrant 或 Chroma 等向量数据库（特地 Docker 作事）

每次写入牵记时必须调用 LLM 提真金不怕火事实（援手土产货 Ollama/oMLX）

与 agentmemory 定位不同，不合适替代后者

二、常识检索类：让 Agent 找到"我存了什么"

3. QMD

GitHub：Shopify CEO Tobi Lütke 发起，OpenClaw 生态中枢器具（MIT 契约）

QMD（Quick Markdown Database）是专为 OpenClaw / Hermes 盘算的土产货 Markdown 常识库搜索引擎。它责罚的问题不是"前次何如作念的"，而是"我的札记里写了什么"。

责任旨趣

QMD 对你 workspace 目次下的通盘 Markdown 文献建立双索引——BM25 倒排索引加向量索引——查询时两路打分，再经 Reranker 交融排序，复返最磋议的文本段落。三个土产货模子自动下载，所有这个词约 2.3GB：

模子变装默许模子大小Embeddingjina-embeddings-v3 (GGUF)330 MBRerankerjina-reranker-v2-base-multilingual (GGUF)640 MBQuery Expansion内置小 LLM1.3 GB

华文技俩可替换为 Qwen3-Embedding GGUF 以优化检索截止。

典型使用场景

搜索技能札记、架构盘算文档（"这个接口的盘算原则"）

检索 GEO 写稿程序（"SEO 关键词密度条款"）

查找已有代码片断的讲解（"Aliyun OSS 签名上传的备注"）

看成 NotebookLM 的土产货替代决策

优点

专为 Markdown 优化，OpenClaw 生态原生援手

三模子管线检索质地高（BM25 + 向量 + Reranker）

完全离线，模子下载一次后弥远缓存

援手多 Collection，不同技俩常识库相互防碍

❌ 缺陷

需要手动贵重 Markdown 文献，火狐官网不自动拿获 Agent 行为

初次 qmd embed 下载约 2.3GB 模子

对代码库和非 Markdown 文献援手有限

Query Expansion 阶段会调用内置小 LLM，增多查询蔓延约 300ms，无需特地配置。

4. Cognee

GitHub：topoteretes/cognee（Apache 2.0）

Cognee 从根底上区别于 QMD：它不作念文档不异度检索，而是从文档中提真金不怕火常识图谱，恢复"A 和 B 有什么关系"这类推感性问题。

责任旨趣：ECL 三阶段

Extract：识别文档中的实体（模块、东说念主员、成见、技能名词）

Cognify：用 LLM 揣测实体间关系（依赖/影响/属于），构建三元组

Load：写入土产货图数据库（默许 NetworkX 内存图，可换 Neo4j）

查询时通过图遍历而非向量不异度，能完毕多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些作事"——这种问题 QMD 是答不了的。

典型使用场景

表示代码库中模块之间的依赖关系

揣测"A 功能崩溃会影响哪些下流"

从多篇文档中空洞出共同论断

分析系统架构的影响链路

优点

❌ 缺陷

索引速率慢，每篇文档都要跑 LLM 提真金不怕火实体，约比 QMD 慢 5–10 倍

查询蔓延较高（图遍历 200ms–2s）

对绵薄的文档检索需求属于"杀鸡用牛刀"

实体提真金不怕火是 Cognee 的中枢体式，必须调用 LLM，但援手土产货 Ollama/oMLX，完全免费。

三、时序与用户画像类

5. Zep（Community Edition）

GitHub：getzep/zep（Apache 2.0）

Zep 专注于时序感知牵记——它不仅记着"说了什么"，还记着"什么时候说的、这条信息是否已被更新遮盖"。2026 年与 LangGraph 深度整合后热心度大增。

典型使用场景

"上周我说用 Redis，这周改成了 SQLite，以最新的为准"

跟踪技俩决策的演化历史（某个技能决策资格了几次变更）

需要时刻线推理的复杂对话系统

优点

时序跟踪是稀奇才智，其他器具都莫得

2026 年 LangGraph 官方集成，生态好

企业级盘算，援手大边界部署

❌ 缺陷

需要 Postgres + pgvector，部署比拟重

对纯 Coding Agent 场景价值有限（agentmemory 更合适）

6. TencentDB Agent Memory

GitHub：Tencent/TencentDB-Agent-Memory（Apache 2.0，2026 年 4 月开源）

腾讯开源的四层渐进式牵记架构，完全 SQLite 土产货运行，对华文内容和国里面署环境针对性优化。

四层架构

层级内容L0 原始对话全量保存L1 原子牵记自动提真金不怕火事实、偏好、关键阻挡L2 场景分块按技俩聚类，落魄文精确调回L3 用户画像踏实个性化剖释

典型使用场景

华文环境的用户偏好牵记

国内信创/稀奇化部署场景

替代 mem0 的纯土产货华文决策

优点

零外部依赖，纯 SQLite

华文分词和语义表示针对性优化

Apache 2.0，国内社区贵重活跃

❌ 缺陷

生态相对较新，MCP 器具数目少于 agentmemory

文档和社区资源主要为华文

L1 层提真金不怕火事实需要长入 LLM（可配置土产货 Qwen3）

对比总览

功能与技能对比

器具定位写入神志检索神志土产货依赖需要 LLM开源契约agentmemoryCoding Agent 行为牵记自动 HookBM25+向量+图谱SQLite（零依赖）不需要MITmem0用户画像/个性化自动提真金不怕火向量检索需要 Qdrant需要Apache 2.0QMDMarkdown 文档检索手动写文献BM25+向量+Reranker土产货 GGUFQuery ExpansionMITCognee常识图谱/关系推理自动提真金不怕火三元组图遍历土产货（需 LLM）必须Apache 2.0Zep CE时序感知牵记自动提真金不怕火向量+时序索引Postgres+pgvector需要Apache 2.0TencentDB AM华文用户画像自动提真金不怕火向量检索SQLite（零依赖）L1 层需要Apache 2.0

土产货部署友好度

器具磁盘占用特地作事部署难度agentmemory~80–600 MB（Embedding）恶浊简QMD~2.3 GB（3个GGUF模子）恶浊简TencentDB AM极小（SQLite）恶浊简Cognee~500 MB SDK + LLM已有 Ollama/oMLX绵薄mem0~1 GBQdrant（Docker）中等Zep CE~2 GBPostgres + pgvector（Docker）较复杂

检索精度对比

器具评测得分备注agentmemory95.2%（LongMemEval-S R@5）三流交融检索Letta/MemGPT83.2%供参考mem068.5%不同场景盘算，不完全可比Zep75.14%（LOCOMO）不同基准，侧重时序推理

各器具使用不同评测基准，数字不行径直横向比拟，仅供参考。

何如选？场景决策树