如何构建自己的知识库——第一步
如何构建自己的知识库——第一步
背景
我在研究 ima.copilot 时,萌生了几个问题?
- ima.copilot是什么,是用来做什么的?
- 知识库里应该存储哪些内容?
- 问知识库和问AI(比如豆包、元宝)的区别是什么?
- 知识库能做自动化操作吗?
其实重要的问题只有两个:
- 有了 AI 为什么还要知识库?
- 知识库里应该存储哪些内容?
先来看第一个问题,有了 AI 为什么还要知识库?
| 对比维度 | 问知识库 (如 ima.copilot) | 问AI (如 豆包、元宝) |
|---|---|---|
| 核心逻辑 | 检索:在你上传的资料里找答案 | 生成:基于AI训练的通用知识来编答案 |
| 信息来源 | 你上传的文档、网页、笔记(私有、可控) | 互联网公开数据(公开、不可控) |
| 答案特点 | 精准、可溯源:答案来自原文,会标注出处 | 通用、流畅:语言通顺,但可能“一本正经胡说八道” |
| 适用场景 | 查合同条款、找项目资料、分析私有数据 | 写文案、学新知识、头脑风暴、闲聊 |
- AI(大模型):它像是一个博学但健忘的教授。它的大脑里装满了训练时学到的海量知识,但它无法记住你给它的具体文件。你问它问题,它只能凭记忆和逻辑“编造”一个答案,所以有时会出错(幻觉)。
- 知识库:它像是一个超级精准的档案管理员。它本身没有知识,但你把文件(博客、合同、PDF)交给它保管。当你提问时,它立刻去翻箱倒柜,找到最相关的那一页,把原文原封不动地指给你看。
结合自己最近遇到的问题,我觉得有必要构建自己的知识库,并且希望是可成长型的知识库。
接下来的问题就是,什么样的问题要放入知识库?或者更准确的说,是什么样的知识要放入知识库?
我首先想到的就是自己遇到的线上问题的反思和总结,但是如果只放这个,内容太少了。所以问题还是:什么样的知识要放入知识库。
我带着这个问题去问 ChatGPT,我描述了我的日常,然后让他帮忙给出一个判断标准,下面是它的回答:
你以后只要 10 秒按这个流程判断即可。
🌳 第一层判断:有没有“认知变化”?
问自己:
这件事有没有改变我的看法、判断方式或工作方式?
- ❌ 没有 → 不记录(纯操作层)
- ✅ 有 → 进入第二层
🌳 第二层判断:改变发生在哪一层?
分三层:
🟢 Level 1:操作层(通常不记录)
- 调整一个 prompt 表达
- 改一个参数
- 语法优化
- 单次修复小 bug
- 单点 API 使用技巧
👉 这些属于“技能熟练度”,不是成长轨迹。
🟡 Level 2:策略层(选择性记录)
发生了以下变化:
- 工作流调整
- Prompt 结构升级
- Skill 组织方式改变
- 开始用 checklist
- 开始延迟提交
问自己:
这个改变会长期影响我未来的做法吗?
- ❌ 只影响一次 → 不记录
- ✅ 会改变以后行为 → 记录
🔴 Level 3:认知层(必须记录)
出现以下任意情况,直接记录:
- 我误判了系统结构
- 我低估了复杂度
- 我忽略了入口差异
- 我对生命周期理解有误
- 我过度信任 AI
- 我因为情绪跳过验证
- 我发现重复模式
这些属于:
思维模型升级
必须记录。
🌳 第三层判断:是否满足“长期价值条件”?
问:
1️⃣ 这个问题可能再次发生吗?
如果会 → 记录
2️⃣ 它暴露了我的某种模式吗?
如果是 → 记录
3️⃣ 它影响的是结构或状态,而不是单点逻辑吗?
如果是 → 记录
4️⃣ 它让我建立了新原则吗?
如果是 → 记录
满足任一条 → 写。
🧠 快速版本(10秒判断法)
出现以下情况,直接写:
- “原来我一直理解错了”
- “这个结构其实不是我想的那样”
- “我又犯了类似错误”
- “这个以后一定要注意”
- “AI 在这里不可靠”
- “这个地方风险比我想象大”
只要脑子里出现这些想法,就写。
🚫 不必记录的内容
- 一次普通 bug 修复
- 单次接口字段错误
- 简单 UI 偏差
- 纯熟练度提升
- 无认知变化的重复工作
🎯 一个更高级的判断方式
问自己:
如果半年后回看,我会感谢现在记录这件事吗?
- 如果答案是“会”
- 那一定写
🔥 最重要的一句话
不要记录“发生了什么”。
记录:
我是如何改变看问题方式的。
🧠 一个升级版思维模型
以后不要问:
“要不要记录?”
改成问:
“如果半年后回看,我会感谢现在记录这件事吗?”
“会长期影响我未来的做法吗?”
“可能再次发生吗”
“暴露了我的某种模式吗”
“影响的是结构或状态,而不是单点逻辑吗”
“让我建立了新原则吗?”
只记录后两层。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 今是昨非的博客!