折腾 Agent 的朋友应该都有同感:AI 能记住对话上下文,但跨会话的知识管理是个坑。笔记散落在 OneDrive,公众号文章阅后即焚,抖音视频看了就忘。我花了三周,基于 Hermes Memory Installer 底座搭了一套 Knowledge-and-Memory-Management v0.0.2,解决的就是「知识从哪来、怎么存、如何找」这个闭环。

先说结论:40+ 采集工具 + 三层记忆检索 + 云盘双向同步,走通了。

三个核心模块

采集层整合了 40+ 引擎,按来源分成 9 组。网页有 Scrapling(可过 Cloudflare)和 Chrome DevTools 协议兜底;视频有 yt-dlp + Whisper ASR + EasyOCR 的多级降级链;文档有新增的 SenseNova 三件套(PDF/PPT/Word 全量提取,扫描件也能吃)。最实用的改进是 book_cache_manager——下载完书自动触发精炼管线,把 PDF 拆成章节、提取知识点、生成 Skill 和笔记,全程无人值守。

存储层是 Hot(Memory tool 即时注入)+ Warm(Hindsight 向量记忆,10K 节点)+ Cold(gbrain 知识图谱,11K 页)三层。lightweight_recall 自动走 FTS5 → 向量 → 图谱的降级检索,每条结果带来源标识。