LLM Wiki — 持久化知识库模式
Andrej Karpathy 提出的个人知识库构建模式。核心思想:放弃 RAG 每次从原始文档重新检索,改为让 LLM 增量维护一个持久的 wiki。
核心差异
| 传统 RAG | LLM Wiki | |----------|----------| | 每次查询重新检索原始文档 | 知识编译一次,持续累积 | | 片段级检索,上下文割裂 | 整页级阅读,全局推理 | | 无持久化,不积累 | 越用越丰富 | | 需要向量库/embedding | 纯 markdown, git 版本化 |
适用量级:文档总 token 数小于 20 万时,纯 context 方案比 RAG 更简单更可靠。
三层架构
- Raw sources (
raw/) — 原始资料,只读不改,是 source of truth - Wiki (
wiki/) — LLM 生成的 markdown 文件,LLM 全权维护 - Schema (
AGENTS.md) — 配置文件,定义 wiki 结构和工作流
三个核心操作
- Ingest — 新资料丢进 raw/,LLM 读取 → 写摘要 → 更新相关页面 → 维护 index
- Query — 搜索 wiki 回答问题;好答案归档成新页面
- Lint — 定期检查矛盾、孤立页面、过时断言
为什么有效
LLM 不嫌烦。人放弃 wiki 是因为维护成本 > 收益(更新交叉引用、保持一致性)。LLM 做这些零成本。
人的工作:选素材、问对的问题、判断什么重要。 LLM 的工作:所有整理、交叉引用、更新的脏活。
关联
- 仓库现有
raw/→wiki/→ 博客发布流程天然对齐三层架构 - 与 RAG 不是对立,是量级选择:小规模(< 20w tokens)LLM Wiki 更优,大规模用 RAG
- Vannevar Bush 的 Memex (1945) — 精神先驱,LLM 解决了"谁来维护"的问题