一次对话 2265 条信息，我和 AI 都经历了什么？

正文

你好，朋友。

见信如晤。

中午抽空开发了一个日志保存的功能，和AI聊了两个版小时，也吵了两个半小时。

不是那种真的吵架，而是：我以为我说清楚了，它理解偏了；我以为这个很简单，它搞复杂了；我以为快好了，它又错了。

下午1点开始的时候，我是信心满满的：就一个自动汇总的脚本，估计半小时能搞定？
下午2点左右的时候，我是困惑不解的：怎么连"所有对话"这种词还能理解错？
下午2点半的时候，我是有点火的：我要的是叙述文，你给我个统计报表干嘛？
下午3点半，我是长舒一口气的：终于，对上了。

事后统计了一下，这两个半小时下来，总共 2265条消息。

平均每分钟15条，全程高强度的来回（当然，是AI反馈得多）。

现在我把全程摊开来讲：所有节点由Claude code提取真实会话里的信息。有真实的对话、真实的情绪、真实的教训。

不是要吐槽AI，是想聊聊：为什么和AI沟通这么难？以及，怎么才能少走弯路？

01.

我们从一个信心满满开始

事情要从今天下午说起。

我想自动化一个重复性工作：每天把和AI的对话记录，自动汇总到我的Obsidian日记里，作为记忆系统的一部分，后续会导入MemOS中（这个后面会展开来讲）。

于是我打开Claude Code，输入了需求：

我：写一个规则，每天晚上1点时帮我操作，将前一天所有的对话记录信息更新到日志文件中

那时候的我，信心满满。心想：这还不简单？写个脚本解析一下前一天的会话记录，加上OpenClaw的定时心跳触发，半小时搞定。

AI 也很干脆：

AI ：我来帮你创建一个自动化脚本，每天凌晨1点自动运行...

然后就开始写代码了。

一切看起来都很顺利。

问题恰恰就出在"看起来"这三个字上。

02.

第一次误解——"所有"不等于"所有"

大概半小时后，Claude说测试完成了，给我看了输出：

AI：测试：处理今天的会话 (2026-03-09) 日记路径: /Users/XXXX/00-Daily/2026-03-09.md 找到 10 个会话文件

会话列表：

[13:02] 9ac9087d... 问题: 根据这篇文章提供的信息... [13:59] 5ba28cda... 问题: 检查一下本地MemOS... [11:15] 18eb9f38... 问题: 将所有的claude code配置打包... ...

？？？

这不对啊。

我说的"所有对话"，是指我每天开的 10个会话窗口，每个窗口都要处理，合并到一起。

但AI理解的"所有对话"，是当前会话的所有消息，然后列了个会话目录。

我立刻指出问题：

我：这个是记录一个会话，还是说前一天的所有对话过程都记录？我需要记录所有对话过程，而不是某一个对话。我每次和claude code沟通都是一个新窗口

AI赶紧道歉：

AI：抱歉误解了。你需要汇总所有会话的内容，而不仅仅是列出会话列表...

然后开始库库改代码。

这么简单的"所有"，怎么还能理解错？

03.

第二次误解——"汇总"不等于"统计"

AI：分析日期: 2026-03-09 总共提取 2265 条消息识别 9 类任务

任务分类:

代码开发: 588 个对话

安装配置: 491 个对话

数据分析: 89 个对话

测试验证: 88 个对话

配置同步: 82 个对话

调试修复: 62 个对话

系统维护: 34 个对话

文档写作: 24 个对话

✅ 已更新日记

我整个人都不好了。

这哪是我要的"汇总"？

我要的是：把同类型的任务合并，用叙述性语言写出背景、过程、结果。

它给我的：一个统计报表，数了数代码开发有588条、安装配置有491条...

这完全不是一回事啊！

我开始意识到，这不是AI"笨"，而是我的语言有歧义——我的脑子有语境，AI都没有。

我：注意看我的要求。是需要完整的背景、过程、结果和待完成事项。而不是日志的数据输出。写到openclaw的日志，是由openclaw启动心跳系统来完成这个任务，对claude code和openclaw的对话都进行。

然后我意识到，描述了半天不如给个例子。

于是我直接贴了我要的格式：

软件安装任务一：根据 XXX 文章的内容，安装文章中到的skills过程：分析文章，梳理出XXX、XXXX等插件，并通过github安装，目前均已安装完毕结果：安装了XXX、XXXX等X个Skills

我：这是完整的案例，照这个格式来。

04.

然后，AI 给我整了个大的

AI说"✅ 已更新日记"后，我打开日记一看，整个人都不好了。

原来的日记内容没了，取而代之的是一堆格式错乱的东西：

分析日期: 2026-03-09 总共提取 2265 条消息代码开发: 588 个对话 ...

我那天上午的工作笔记、待办事项、重要记录，全没了。

那一瞬间，我是真的慌了。

（介个，忘记截图了）

那一刻我的大脑一片空白：

今天的工作笔记没了
待办事项没了
一些临时记下的想法、思路，全没了

我能回忆起来多少？估计10%都不到

我骂了它一顿，然后让AI给我找回来（说不定人家有备份呢）

然后它又开始干活了

结果整了半天，还是没弄出来。

还好，我想到了Dropbox有历史版本功能。

赶紧打开Dropbox，找到那个文件，右键 → 查看历史版本。

看到了！几分钟前的版本还在。

再晚一点，我云端的记录都被覆盖掉了

我恢复了原来的内容，然后立刻给AI发了消息：

我：你的测试不能直接覆盖我的日记！这是我的真实数据！

以后测试，先写入临时文件，我检查确认后，再正式写入。

这次幸好有Dropbox历史版本，不然我真的GG了。

05.

终于完成了

经历了刚才的惊险时刻，我意识到不能再让AI"猜"了。我直接贴了完整的案例格式：

我：这是完整的案例，照这个格式来。写到openclaw的日志，是由openclaw启动心跳系统来完成这个任务，对claude code和openclaw的对话都进行。

这次，AI终于明白了：

AI：明白了！你需要的是：

扫描前一天的jsonl文件

按任务类型分类并合并同类项

每个任务包含：背景、过程、结果、待办事项

使用叙述性语言，不是统计数据

现在开始执行...先写入临时文件，你检查后再正式写入。

你终于知道是要AI来理解会话内容，不是关键词匹配了

早给案例不就完了？前前后后折腾了这么久。

那一刻我突然明白：自然语言描述，每个词都能理解，但合起来有歧义；具体案例，格式结构一目了然，没有歧义。

06.

复盘一下：2265条记录来自哪里

事情搞定后，我让AI统计了一下，发现那天总共产生了 2265条消息。

从下午1点到3点半，两个小时36分钟，全程高强度的来回。

我把它们拆开来看：

轮次消息数占比结果第一轮（"所有"误解）~500条22%失败第二轮（"汇总"误解+日记被覆盖）~1200条53%失败第三轮（给案例对齐）~400条18%成功技术实现~165条7%完成

消息数

占比

结果

第一轮（"所有"误解）

~500条

22%

失败

第二轮（"汇总"误解+日记被覆盖）

~1200条

53%

失败

第三轮（给案例对齐）

~400条

18%

成功

技术实现

~165条

完成

有效消息大概只有30%，剩下70%都在来回修正、误解、调试。

最讽刺的是：如果我从一开始就给案例，预估500-800条消息就能搞定。

多出来的1500条，完全是因为：

我以为"所有"这个词很清楚，但AI理解成"当前"
我以为"汇总"这个词很清楚，但AI理解成"统计"
我一直在描述需求，但从来没有给过具体格式

07.

我学到了什么

这两个半小时 + 一次数据危机，换来了三个教训。

教训一：把AI当实习生——任务要明确、要具体、要给案例

我之前的认知是：AI很聪明，说个大概应该能懂。

现在的认知是： AI就像实习生，你要交代清楚。

（其实这个认知很早就有AI大牛说过，但自己没经历过，总觉得问题不大。果然有些坑还是要自己踩）

2265条消息里，前1700条都是在"误解-修正"的循环里。

最大的问题就是：我以为我在"沟通"，其实我一直在"让AI猜"。

我说"所有"，我脑子里有画面，AI没有
我说"汇总"，我脑子里有格式，AI没有
我说"分类"，我脑子里有标准，AI没有

解决方案：第一轮就给案例。

你想想，你让一个实习生"做个总结"，他做出来的和你想要的能一样吗？肯定不一样。你要给示例、给模板、给标准。AI也一样。

❌ 别说： "汇总对话，提炼要点，分类整理"

✅ 改说： "复制这个格式，填入内容：[完整案例]"

多花1分钟准备案例，省2小时来回修正。这账怎么算都划算。

教训二：AI不会自我怀疑——你必须做验收

AI说"已更新日记"，这句话听起来很笃定、很自信。

但它的自信是建立在"我执行了代码"的基础上，不是建立在"结果是正确的"基础上。

AI不会自我怀疑。它错了也不知道，它不知道自己不知道。

这次如果没有Dropbox历史版本，我真的GG了。

所以你必须做验收：检查、测试、验收，一步都马虎不得。

这不是不信任AI，这是基本的工作流程。就像实习生交给你代码，你会直接上线吗？肯定要先跑一遍测试。AI也一样，甚至更要测试——因为它更"自信"，错了也面不改色。

教训：任何AI输出的内容，尤其是要写入文件、修改配置的，先看一眼，先测试一下。

教训三：自动化越强，安全意识要越高

日记被覆盖这件事让我深刻意识到：自动化越强，一旦出错的破坏力就越大。

AI不知道"危险"：覆盖文件？它觉得没问题
自动化 ≠ 安全：自动化脚本出错，破坏力更大
你要做安全阀：测试、备份、分阶段写入

我现在改的流程是：

先写入临时文件
检查格式和内容
确认无误后再追加到日记

类比一下：给实习生数据库权限，你会让他直接在正式环境操作吗？肯定先在测试环境，验证通过了再上生产。

AI操作你的重要文件，也一样要谨慎。

08.

更大的反思

这2265条消息，让我对"和AI沟通"这件事有了更深的理解。

AI很强大，但它不是你。

你的常识，AI没有
你的经验，AI没有
你的判断，AI没有
你的语境，AI没有

我们人类沟通，很多时候依赖的是"潜台词"和"共同语境"。

我说"汇总所有对话"，你脑子里立刻有画面：多个窗口、合并、提炼。因为你也是人类，你也有类似的场景和经验。

但AI没有。

它看到的只有字面意思："所有" = "all"，"当前会话的所有消息"也是"all"。

沟通的本质，是把脑子里的画面，投射到对方的脑子里。

面对AI，这个任务反而更难，因为：

AI没有你的人生经验
AI没有你的语境背景
AI不会主动问你"你确定吗"
AI很自信，错了也面不改色

所以和AI沟通，要更清晰、更具体、更可验证。

不要说"所有"，说"10个会话窗口"
不要说"汇总"，给一个完整案例
不要说"测试"，说"写入临时文件，我检查后再正式写入"

这不是啰嗦，这是必要的成本。

多花1分钟说清楚，省2小时改错。这账怎么算都划算。

2265条消息的两个半小时，有点折腾，但值得。

希望我的经历，能帮你省下那1500条。

Vol.006

祝好

陆离敬上

2026/03/09 写于深圳