关于火狐体育
你的位置:火狐体育中国官网入口 > 关于火狐体育 > 火狐体育中国官网入口 Agent六款开源牵记器具大横评——统统能土产货跑, 统统不费钱

火狐体育中国官网入口 Agent六款开源牵记器具大横评——统统能土产货跑, 统统不费钱

2026-06-19 00:53    点击次数:129

火狐体育中国官网入口 Agent六款开源牵记器具大横评——统统能土产货跑, 统统不费钱

你知说念吗,让 Agent记着你的技俩落魄文、技能决策和责任民风,这件事完全不错不花一分钱、不连任何云作事、数据全留在我方电脑上就作念到。

每次掀开 Hermes 或 OpenClaw 新建会话,你都得从头讲解注解一遍技俩用了什么框架、前次修 MCP 断线用的什么敕令、为什么选 jose 而不是 jsonwebtoken。不是模子不够灵巧,是落魄文窗口实质上是"一次性"的——会话收尾,牵记也随着清零。

开源社区早就盯上了这个问题。曩昔一年里,至少有六款专诚针对 Agent牵记彭胀的开源器具冒了出来——统统开源免费、统统不错土产货部署、并且功能少许不诳骗。

这篇著作就带你把这六款器具逐一看一遍:它们何如责任的、何如安安装置、各自有什么所长和短板、你的场景最合适哪个。

先搞清你需要哪种"牵记"

在聊具体器具之前,有一个关键分袂要先讲解显——AI 助手需要记的东西,其实分两种:

类型问的问题例如行为/情节牵记"我(Agent)前次何如操作的?""前次建立 MCP 断线用了什么敕令?"常识/文档牵记"我知说念什么尊府?""GEO 写稿程序第三条何如说的?"

前者记载 Agent 的操作历史,后者检索已有的文档常识库。两类需求合适不同的器具,最佳的决策是搭配使用。

一、行为牵记类:让 Agent 记着"我作念过什么"

1. agentmemory

GitHub:rohitg00/agentmemory(23,000+ Stars,MIT 契约)

agentmemory 是当今热心度最高的 AI 编程 Agent 握久牵记决策。它的中枢卖点就一个词:零纷扰。Agent 践诺器具调用时,它通过 Hook 机制自动静默拿获通盘操作,你什么都毋庸管。

责任旨趣

每次 Agent(Hermes、Claude Code 等)调用器具时,agentmemory 拿获一条 Observation 记载。

这些记载经由 iii-engine 压缩后存入土产货 SQLite。下次新建会话时,agentmemory 自动检索磋议历史落魄文并注入进去。

检索机制:三流交融

这是 agentmemory 最值得细说的所在。它不是绵薄地作念关键词搜索——它同期跑三路:BM25 全文检索、向量语义检索、常识图谱遍历,终末通过 RRF(Reciprocal Rank Fusion)交融排序。在 LongMemEval-S 基准测试上,调回率作念到了 95.2%,而 mem0 唯有 68.5%、Letta/MemGPT 是 83.2%。

典型使用场景

记着技俩里用了哪个库以及为什么选它("为什么用 jose 而不是 jsonwebtoken")

跨会话不竭前次没作念完的任务

自动遁藏仍是踩过的坑("这个 CORS 问题前次何如责罚的")

多个 Agent 实例(Hermes + OpenClaw)分享吞并份技能决策历史

优点

零纷扰,完全自动拿获,不需要手动贵重担何文献

零外部依赖,纯 SQLite,不需要 Docker 或特地作事

多 Agent 分享,一个作事同期作事多个 Agent 实例

MIT 契约,完全土产货运行,不连任何外部 LLM

调回精度在同类器具中最高(95.2% R@5)

❌ 缺陷

仅对接 Coding Agent,不合适通用 LLM 行使的用户画像场景

默许 Embedding 模子(all-MiniLM-L6-v2,80MB)对华文援手一般,华文技俩提议替换为 Qwen3-Embedding

依赖 iii-engine 版块锁定(v0.11.2),升级需严慎

值得在意的是,agentmemory 的牵记写入和检索均不调用任何 LLM,完全土产货计较。这是它和 mem0 最大的区别之一。

2. mem0

GitHub:mem0ai/mem0(41,000+ Stars,Apache 2.0)

mem0 和 agentmemory 定位不同。它面向的是 LLM 行使(聊天机器东说念主、个性化助手),从对话内容中自动提真金不怕火结构化用户事实——偏好、民风、身份信息——构建用户画像。

责任旨趣

每次对话收尾后,mem0 调用 LLM 分析对话内容,提真金不怕火出雷同"这个用户可爱 TypeScript、不可爱冗余注目"的事实,写入向量数据库。下次对话时检索注入,完毕个性化。

典型使用场景

记着用户的编码立场偏好("可爱函数式立场,毋庸 class")

跨会话保握用户画像("这个用户在作念 Electron 技俩")

构建面向末端用户的个性化 AI 居品

优点

自动从对话提真金不怕火事实,无需手动回归

援手 MCP 接入,可集成到 Hermes/OpenClaw

生态最训诫(YC 投资,14M+ 下载)

❌ 缺陷

部署较重:需要 Qdrant 或 Chroma 等向量数据库(特地 Docker 作事)

每次写入牵记时必须调用 LLM 提真金不怕火事实(援手土产货 Ollama/oMLX)

与 agentmemory 定位不同,不合适替代后者

二、常识检索类:让 Agent 找到"我存了什么"

3. QMD

GitHub:Shopify CEO Tobi Lütke 发起,OpenClaw 生态中枢器具(MIT 契约)

QMD(Quick Markdown Database)是专为 OpenClaw / Hermes 盘算的土产货 Markdown 常识库搜索引擎。它责罚的问题不是"前次何如作念的",而是"我的札记里写了什么"。

责任旨趣

QMD 对你 workspace 目次下的通盘 Markdown 文献建立双索引——BM25 倒排索引加向量索引——查询时两路打分,再经 Reranker 交融排序,复返最磋议的文本段落。三个土产货模子自动下载,所有这个词约 2.3GB:

模子变装默许模子大小Embeddingjina-embeddings-v3 (GGUF)330 MBRerankerjina-reranker-v2-base-multilingual (GGUF)640 MBQuery Expansion内置小 LLM1.3 GB

华文技俩可替换为 Qwen3-Embedding GGUF 以优化检索截止。

典型使用场景

搜索技能札记、架构盘算文档("这个接口的盘算原则")

检索 GEO 写稿程序("SEO 关键词密度条款")

查找已有代码片断的讲解("Aliyun OSS 签名上传的备注")

看成 NotebookLM 的土产货替代决策

优点

专为 Markdown 优化,OpenClaw 生态原生援手

三模子管线检索质地高(BM25 + 向量 + Reranker)

完全离线,模子下载一次后弥远缓存

援手多 Collection,不同技俩常识库相互防碍

❌ 缺陷

需要手动贵重 Markdown 文献,火狐官网不自动拿获 Agent 行为

初次 qmd embed 下载约 2.3GB 模子

对代码库和非 Markdown 文献援手有限

Query Expansion 阶段会调用内置小 LLM,增多查询蔓延约 300ms,无需特地配置。

4. Cognee

GitHub:topoteretes/cognee(Apache 2.0)

Cognee 从根底上区别于 QMD:它不作念文档不异度检索,而是从文档中提真金不怕火常识图谱,恢复"A 和 B 有什么关系"这类推感性问题。

责任旨趣:ECL 三阶段

Extract:识别文档中的实体(模块、东说念主员、成见、技能名词)

Cognify:用 LLM 揣测实体间关系(依赖/影响/属于),构建三元组

Load:写入土产货图数据库(默许 NetworkX 内存图,可换 Neo4j)

查询时通过图遍历而非向量不异度,能完毕多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些作事"——这种问题 QMD 是答不了的。

典型使用场景

表示代码库中模块之间的依赖关系

揣测"A 功能崩溃会影响哪些下流"

从多篇文档中空洞出共同论断

分析系统架构的影响链路

优点

❌ 缺陷

索引速率慢,每篇文档都要跑 LLM 提真金不怕火实体,约比 QMD 慢 5–10 倍

查询蔓延较高(图遍历 200ms–2s)

对绵薄的文档检索需求属于"杀鸡用牛刀"

实体提真金不怕火是 Cognee 的中枢体式,必须调用 LLM,但援手土产货 Ollama/oMLX,完全免费。

三、时序与用户画像类

5. Zep(Community Edition)

GitHub:getzep/zep(Apache 2.0)

Zep 专注于时序感知牵记——它不仅记着"说了什么",还记着"什么时候说的、这条信息是否已被更新遮盖"。2026 年与 LangGraph 深度整合后热心度大增。

典型使用场景

"上周我说用 Redis,这周改成了 SQLite,以最新的为准"

跟踪技俩决策的演化历史(某个技能决策资格了几次变更)

需要时刻线推理的复杂对话系统

优点

时序跟踪是稀奇才智,其他器具都莫得

2026 年 LangGraph 官方集成,生态好

企业级盘算,援手大边界部署

❌ 缺陷

需要 Postgres + pgvector,部署比拟重

对纯 Coding Agent 场景价值有限(agentmemory 更合适)

6. TencentDB Agent Memory

GitHub:Tencent/TencentDB-Agent-Memory(Apache 2.0,2026 年 4 月开源)

腾讯开源的四层渐进式牵记架构,完全 SQLite 土产货运行,对华文内容和国里面署环境针对性优化。

四层架构

层级内容L0 原始对话全量保存L1 原子牵记自动提真金不怕火事实、偏好、关键阻挡L2 场景分块按技俩聚类,落魄文精确调回L3 用户画像踏实个性化剖释

典型使用场景

华文环境的用户偏好牵记

国内信创/稀奇化部署场景

替代 mem0 的纯土产货华文决策

优点

零外部依赖,纯 SQLite

华文分词和语义表示针对性优化

Apache 2.0,国内社区贵重活跃

❌ 缺陷

生态相对较新,MCP 器具数目少于 agentmemory

文档和社区资源主要为华文

L1 层提真金不怕火事实需要长入 LLM(可配置土产货 Qwen3)

对比总览

功能与技能对比

器具定位写入神志检索神志土产货依赖需要 LLM开源契约agentmemoryCoding Agent 行为牵记自动 HookBM25+向量+图谱SQLite(零依赖)不需要MITmem0用户画像/个性化自动提真金不怕火向量检索需要 Qdrant需要Apache 2.0QMDMarkdown 文档检索手动写文献BM25+向量+Reranker土产货 GGUFQuery ExpansionMITCognee常识图谱/关系推理自动提真金不怕火三元组图遍历土产货(需 LLM)必须Apache 2.0Zep CE时序感知牵记自动提真金不怕火向量+时序索引Postgres+pgvector需要Apache 2.0TencentDB AM华文用户画像自动提真金不怕火向量检索SQLite(零依赖)L1 层需要Apache 2.0

土产货部署友好度

器具磁盘占用特地作事部署难度agentmemory~80–600 MB(Embedding)恶浊简QMD~2.3 GB(3个GGUF模子)恶浊简TencentDB AM极小(SQLite)恶浊简Cognee~500 MB SDK + LLM已有 Ollama/oMLX绵薄mem0~1 GBQdrant(Docker)中等Zep CE~2 GBPostgres + pgvector(Docker)较复杂

检索精度对比

器具评测得分备注agentmemory95.2%(LongMemEval-S R@5)三流交融检索Letta/MemGPT83.2%供参考mem068.5%不同场景盘算,不完全可比Zep75.14%(LOCOMO)不同基准,侧重时序推理

各器具使用不同评测基准,数字不行径直横向比拟,仅供参考。

何如选?场景决策树

开元棋牌官方网站入口

保举的组合决策

关于 OpenClaw / Hermes 的个东说念主招引者,仙踪问说念团队在实验部署中考据了一个三层搭配决策:

第一层用 agentmemory,自动拿获 Agent 行为历史,零纷扰,关掉岂论它,它沉默在后台记载通盘的技能决策和操作。

第二层用 QMD,把热切的技能札记、技俩程序写成 Markdown,Agent 就能随时检索这些常识库。两个器具都看成 MCP Server 挂载,互不干扰,一个管"作念过什么",一个管"知说念什么"。

技俩复杂度上去之后——代码库有好几个微作事、模块之间依赖关系复杂——再加 Cognee,引入图谱推理才智。三层就皆了:行为牵记 + 文档检索 + 关系推理。

# ~/.hermes/config.yaml

mcp_servers:

agentmemory:

command: "npx"

args: ["@agentmemory/mcp"]

qmd_search:

command: "qmd"

args: ["serve", "--port", "7333"]

归根结底,Agent的"失忆症"不是技能作念不到,而是穷乏一个中间层——一个能在会话除外握久化常识、跨会话注入落魄文的牵记系统。开源社区给的这六款器具,等于在补这一层。它们通盘开源免费、统统不错土产货运行、数据留在我方的机器上。

还没下载使用Openclaw和Hermes, 快来仙踪问说念·智能助手启动你的智能之旅吧!

附录:关键术语

MCP(Model Context Protocol):Anthropic 推出的灵通契约,允许 LLM 通过尺度接口调用外部器具和作事。agentmemory、QMD 等器具均提供 MCP Server,可径直挂载到 Hermes/OpenClaw

BM25:经典全文检索算法,基于词频和逆文档频率打分,速率快

向量检索:将文本颐养为高维数字向量,基于语义不异度检索

Reranker:对初步检索截止从头打分排序的模子

常识图谱:以节点(实体)和边(关系)表见告识的图结构,援手多跳推理

LongMemEval-S:专诚评测 AI Agent 跨会话永恒牵记才智的尺度基准测试集火狐体育中国官网入口



Copyright © 1998-2026 火狐体育中国官网入口™版权所有

jmsthfz.com备案号 备案号: 

技术支持:®火狐体育中国 RSS地图 HTML地图