如何构建自己的知识库——第一步

背景

我在研究 ima.copilot 时,萌生了几个问题?

  • ima.copilot是什么,是用来做什么的?
  • 知识库里应该存储哪些内容?
  • 问知识库和问AI(比如豆包、元宝)的区别是什么?
  • 知识库能做自动化操作吗?

其实重要的问题只有两个:

  1. 有了 AI 为什么还要知识库?
  2. 知识库里应该存储哪些内容?

先来看第一个问题,有了 AI 为什么还要知识库?

对比维度 问知识库 (如 ima.copilot)​ 问AI (如 豆包、元宝)​
核心逻辑​ 检索:在你上传的资料里找答案 生成:基于AI训练的通用知识来编答案
信息来源​ 你上传的文档、网页、笔记(私有、可控) 互联网公开数据(公开、不可控)
答案特点​ 精准、可溯源:答案来自原文,会标注出处 通用、流畅:语言通顺,但可能“一本正经胡说八道”
适用场景​ 查合同条款、找项目资料、分析私有数据 写文案、学新知识、头脑风暴、闲聊
  • AI(大模型):它像是一个博学但健忘的教授。它的大脑里装满了训练时学到的海量知识,但它无法记住你给它的具体文件。你问它问题,它只能凭记忆和逻辑“编造”一个答案,所以有时会出错(幻觉)。
  • 知识库:它像是一个超级精准的档案管理员。它本身没有知识,但你把文件(博客、合同、PDF)交给它保管。当你提问时,它立刻去翻箱倒柜,找到最相关的那一页,把原文原封不动地指给你看。

结合自己最近遇到的问题,我觉得有必要构建自己的知识库,并且希望是可成长型的知识库。

接下来的问题就是,什么样的问题要放入知识库?或者更准确的说,是什么样的知识要放入知识库?

我首先想到的就是自己遇到的线上问题的反思和总结,但是如果只放这个,内容太少了。所以问题还是:什么样的知识要放入知识库。

我带着这个问题去问 ChatGPT,我描述了我的日常,然后让他帮忙给出一个判断标准,下面是它的回答:

你以后只要 10 秒按这个流程判断即可。

🌳 第一层判断:有没有“认知变化”?

问自己:

这件事有没有改变我的看法、判断方式或工作方式?

  • ❌ 没有 → 不记录(纯操作层)
  • ✅ 有 → 进入第二层

🌳 第二层判断:改变发生在哪一层?

分三层:

🟢 Level 1:操作层(通常不记录)

  • 调整一个 prompt 表达
  • 改一个参数
  • 语法优化
  • 单次修复小 bug
  • 单点 API 使用技巧

👉 这些属于“技能熟练度”,不是成长轨迹。

🟡 Level 2:策略层(选择性记录)

发生了以下变化:

  • 工作流调整
  • Prompt 结构升级
  • Skill 组织方式改变
  • 开始用 checklist
  • 开始延迟提交

问自己:

这个改变会长期影响我未来的做法吗?

  • ❌ 只影响一次 → 不记录
  • ✅ 会改变以后行为 → 记录

🔴 Level 3:认知层(必须记录)

出现以下任意情况,直接记录:

  • 我误判了系统结构
  • 我低估了复杂度
  • 我忽略了入口差异
  • 我对生命周期理解有误
  • 我过度信任 AI
  • 我因为情绪跳过验证
  • 我发现重复模式

这些属于:

思维模型升级

必须记录。

🌳 第三层判断:是否满足“长期价值条件”?

问:

1️⃣ 这个问题可能再次发生吗?

如果会 → 记录

2️⃣ 它暴露了我的某种模式吗?

如果是 → 记录

3️⃣ 它影响的是结构或状态,而不是单点逻辑吗?

如果是 → 记录

4️⃣ 它让我建立了新原则吗?

如果是 → 记录

满足任一条 → 写。

🧠 快速版本(10秒判断法)

出现以下情况,直接写:

  • “原来我一直理解错了”
  • “这个结构其实不是我想的那样”
  • “我又犯了类似错误”
  • “这个以后一定要注意”
  • “AI 在这里不可靠”
  • “这个地方风险比我想象大”

只要脑子里出现这些想法,就写。

🚫 不必记录的内容

  • 一次普通 bug 修复
  • 单次接口字段错误
  • 简单 UI 偏差
  • 纯熟练度提升
  • 无认知变化的重复工作

🎯 一个更高级的判断方式

问自己:

如果半年后回看,我会感谢现在记录这件事吗?

  • 如果答案是“会”
  • 那一定写

🔥 最重要的一句话

不要记录“发生了什么”。

记录:

我是如何改变看问题方式的。

🧠 一个升级版思维模型

以后不要问:

“要不要记录?”

改成问:

“如果半年后回看,我会感谢现在记录这件事吗?”
“会长期影响我未来的做法吗?”
“可能再次发生吗”
“暴露了我的某种模式吗”
“影响的是结构或状态,而不是单点逻辑吗”
“让我建立了新原则吗?”

只记录后两层。