李纪

AI 产品 · 游戏开发

LLM Wiki — 持久化知识库模式

Andrej Karpathy 提出的个人知识库构建模式。核心思想:放弃 RAG 每次从原始文档重新检索,改为让 LLM 增量维护一个持久的 wiki。

核心差异

| 传统 RAG | LLM Wiki | |----------|----------| | 每次查询重新检索原始文档 | 知识编译一次,持续累积 | | 片段级检索,上下文割裂 | 整页级阅读,全局推理 | | 无持久化,不积累 | 越用越丰富 | | 需要向量库/embedding | 纯 markdown, git 版本化 |

适用量级:文档总 token 数小于 20 万时,纯 context 方案比 RAG 更简单更可靠。

三层架构

  1. Raw sources (raw/) — 原始资料,只读不改,是 source of truth
  2. Wiki (wiki/) — LLM 生成的 markdown 文件,LLM 全权维护
  3. Schema (AGENTS.md) — 配置文件,定义 wiki 结构和工作流

三个核心操作

  • Ingest — 新资料丢进 raw/,LLM 读取 → 写摘要 → 更新相关页面 → 维护 index
  • Query — 搜索 wiki 回答问题;好答案归档成新页面
  • Lint — 定期检查矛盾、孤立页面、过时断言

为什么有效

LLM 不嫌烦。人放弃 wiki 是因为维护成本 > 收益(更新交叉引用、保持一致性)。LLM 做这些零成本。

人的工作:选素材、问对的问题、判断什么重要。 LLM 的工作:所有整理、交叉引用、更新的脏活。

关联

  • 仓库现有 raw/wiki/ → 博客发布流程天然对齐三层架构
  • 与 RAG 不是对立,是量级选择:小规模(< 20w tokens)LLM Wiki 更优,大规模用 RAG
  • Vannevar Bush 的 Memex (1945) — 精神先驱,LLM 解决了"谁来维护"的问题