正文
你好,朋友。
见信如晤。
中午抽空开发了一个日志保存的功能,和AI聊了两个版小时,也吵了两个半小时。
不是那种真的吵架,而是:我以为我说清楚了,它理解偏了;我以为这个很简单,它搞复杂了;我以为快好了,它又错了。
- 下午1点 开始的时候,我是 信心满满 的:就一个自动汇总的脚本,估计半小时能搞定?
- 下午2点 左右的时候,我是 困惑不解 的:怎么连"所有对话"这种词还能理解错?
- 下午2点半 的时候,我是 有点火 的:我要的是叙述文,你给我个统计报表干嘛?
- 下午3点半 ,我是 长舒一口气 的:终于,对上了。
事后统计了一下,这两个半小时下来,总共 2265条消息 。
平均每分钟15条,全程高强度的来回(当然,是AI反馈得多)。
现在我把全程摊开来讲:所有节点由Claude code提取真实会话里的信息。有真实的对话、真实的情绪、真实的教训。
不是要吐槽AI,是想聊聊: 为什么和AI沟通这么难? 以及, 怎么才能少走弯路?
01.
我们从一个信心满满开始
事情要从今天下午说起。
我想自动化一个重复性工作:每天把和AI的对话记录,自动汇总到我的Obsidian日记里,作为记忆系统的一部分,后续会导入MemOS中(这个后面会展开来讲)。
于是我打开Claude Code,输入了需求:
我:写一个规则,每天晚上1点时帮我操作,将前一天所有的对话记录信息更新到日志文件中
那时候的我,信心满满。心想:这还不简单?写个脚本解析一下前一天的会话记录,加上OpenClaw的定时心跳触发,半小时搞定。
AI 也很干脆:
AI :我来帮你创建一个自动化脚本,每天凌晨1点自动运行...
然后就开始写代码了。
一切看起来都很顺利。
问题恰恰就出在"看起来"这三个字上。
02.
第一次误解——"所有"不等于"所有"
大概半小时后,Claude说测试完成了,给我看了输出:
AI:测试:处理今天的会话 (2026-03-09) 日记路径: /Users/XXXX/00-Daily/2026-03-09.md 找到 10 个会话文件
会话列表:
[13:02] 9ac9087d... 问题: 根据这篇文章提供的信息... [13:59] 5ba28cda... 问题: 检查一下本地MemOS... [11:15] 18eb9f38... 问题: 将所有的claude code配置打包... ...
???
这不对啊。
我说的"所有对话",是指我每天开的 10个会话窗口 ,每个窗口都要处理,合并到一起。
但AI理解的"所有对话",是 当前会话 的所有消息,然后列了个会话目录。
我立刻指出问题:
我:这个是记录一个会话,还是说前一天的所有对话过程都记录?我需要记录所有对话过程,而不是某一个对话。我每次和claude code沟通都是一个新窗口
AI赶紧道歉:
AI:抱歉误解了。你需要汇总所有会话的内容,而不仅仅是列出会话列表...
然后开始库库改代码。
这么简单的"所有",怎么还能理解错?
03.
第二次误解——"汇总"不等于"统计"
AI:分析日期: 2026-03-09 总共提取 2265 条消息 识别 9 类任务
任务分类:
代码开发: 588 个对话
安装配置: 491 个对话
数据分析: 89 个对话
测试验证: 88 个对话
配置同步: 82 个对话
调试修复: 62 个对话
系统维护: 34 个对话
文档写作: 24 个对话
✅ 已更新日记
我整个人都不好了。
这哪是我要的"汇总"?
我要的是:把同类型的任务合并,用叙述性语言写出背景、过程、结果。
它给我的:一个统计报表,数了数代码开发有588条、安装配置有491条...
这完全不是一回事啊!
我开始意识到,这不是AI"笨",而是我的语言有歧义——我的脑子有语境,AI都没有。
我:注意看我的要求。是需要完整的 背景、过程、结果和待完成事项 。而不是日志的数据输出。写到openclaw的日志,是由openclaw启动心跳系统来完成这个任务,对claude code和openclaw的对话都进行。
然后我意识到,描述了半天不如给个例子。
于是我直接贴了我要的格式:
软件安装任务一 :根据 XXX 文章的内容,安装文章中到的skills过程 :分析文章,梳理出XXX、XXXX等插件,并通过github安装,目前均已安装完毕结果 :安装了XXX、XXXX等X个Skills
我:这是完整的案例,照这个格式来。
04.
然后,AI 给我整了个大的
AI说"✅ 已更新日记"后,我打开日记一看,整个人都不好了。
原来的日记内容没了,取而代之的是一堆格式错乱的东西:
分析日期: 2026-03-09 总共提取 2265 条消息 代码开发: 588 个对话 ...
我那天上午的工作笔记、待办事项、重要记录, 全没了 。
那一瞬间,我是真的慌了。
(介个,忘记截图了)
那一刻我的大脑一片空白:
- 今天的工作笔记没了
- 待办事项没了
- 一些临时记下的想法、思路,全没了
我能回忆起来多少?估计10%都不到
我骂了它一顿,然后让AI给我找回来(说不定人家有备份呢)
然后它又开始干活了
结果整了半天,还是没弄出来。
还好,我想到了Dropbox有历史版本功能。
赶紧打开Dropbox,找到那个文件,右键 → 查看历史版本。
看到了!几分钟前的版本还在。
再晚一点,我云端的记录都被覆盖掉了
我恢复了原来的内容,然后立刻给AI发了消息:
我:你的测试不能直接覆盖我的日记 !这是我的真实数据!
以后测试,先写入临时文件,我检查确认后,再正式写入。
这次幸好有Dropbox历史版本,不然我真的GG了。
05.
终于完成了
经历了刚才的惊险时刻,我意识到不能再让AI"猜"了。我直接贴了完整的案例格式:
软件安装任务一 :根据 XXX 文章的内容,安装文章中到的skills过程 :分析文章,梳理出XXX、XXXX等插件,并通过github安装,目前均已安装完毕结果 :安装了XXX、XXXX等X个Skills
我:这是完整的案例,照这个格式来。写到openclaw的日志,是由openclaw启动心跳系统来完成这个任务,对claude code和openclaw的对话都进行。
这次,AI终于明白了:
AI:明白了!你需要的是:
扫描前一天的jsonl文件
按任务类型分类并合并同类项
每个任务包含:背景、过程、结果、待办事项
使用叙述性语言,不是统计数据
现在开始执行...先写入临时文件,你检查后再正式写入。
你终于知道是要AI来理解会话内容,不是关键词匹配了
早给案例不就完了?前前后后折腾了这么久。
那一刻我突然明白: 自然语言描述,每个词都能理解,但合起来有歧义;具体案例,格式结构一目了然,没有歧义。
06.
复盘一下:2265条记录来自哪里
事情搞定后,我让AI统计了一下,发现那天总共产生了 2265条消息 。
从下午1点到3点半,两个小时36分钟,全程高强度的来回。
我把它们拆开来看:
轮次消息数占比结果第一轮("所有"误解)~500条22%失败第二轮("汇总"误解+日记被覆盖)~1200条53%失败第三轮(给案例对齐)~400条18%成功技术实现~165条7%完成
消息数
占比
结果
第一轮("所有"误解)
~500条
22%
失败
第二轮("汇总"误解+日记被覆盖)
~1200条
53%
失败
第三轮(给案例对齐)
~400条
18%
成功
技术实现
~165条
7%
完成
有效消息大概只有30%,剩下70%都在来回修正、误解、调试。
最讽刺的是:如果我从一开始就给案例,预估500-800条消息就能搞定。
多出来的1500条,完全是因为:
- 我以为"所有"这个词很清楚,但AI理解成"当前"
- 我以为"汇总"这个词很清楚,但AI理解成"统计"
- 我一直在描述需求,但从来没有给过具体格式
07.
我学到了什么
这两个半小时 + 一次数据危机,换来了三个教训。
教训一:把AI当实习生——任务要明确、要具体、要给案例
我之前的认知是:AI很聪明,说个大概应该能懂。
现在的认知是: AI就像实习生,你要交代清楚。
(其实这个认知很早就有AI大牛说过,但自己没经历过,总觉得问题不大。果然有些坑还是要自己踩)
2265条消息里,前1700条都是在"误解-修正"的循环里。
最大的问题就是:我以为我在"沟通",其实我一直在"让AI猜"。
- 我说"所有",我脑子里有画面,AI没有
- 我说"汇总",我脑子里有格式,AI没有
- 我说"分类",我脑子里有标准,AI没有
解决方案:第一轮就给案例。
你想想,你让一个实习生"做个总结",他做出来的和你想要的能一样吗?肯定不一样。你要给示例、给模板、给标准。AI也一样。
❌ 别说: "汇总对话,提炼要点,分类整理"
✅ 改说: "复制这个格式,填入内容:[完整案例]"
多花1分钟准备案例,省2小时来回修正。这账怎么算都划算。
教训二:AI不会自我怀疑——你必须做验收
AI说"已更新日记",这句话听起来很笃定、很自信。
但它的自信是建立在"我执行了代码"的基础上,不是建立在"结果是正确的"基础上。
AI不会自我怀疑 。它错了也不知道,它不知道自己不知道。
这次如果没有Dropbox历史版本,我真的GG了。
所以你必须做验收:检查、测试、验收,一步都马虎不得。
这不是不信任AI,这是基本的工作流程。就像实习生交给你代码,你会直接上线吗?肯定要先跑一遍测试。AI也一样,甚至更要测试——因为它更"自信",错了也面不改色。
教训:任何AI输出的内容,尤其是要写入文件、修改配置的,先看一眼,先测试一下。
教训三:自动化越强,安全意识要越高
日记被覆盖这件事让我深刻意识到: 自动化越强,一旦出错的破坏力就越大。
- AI不知道"危险":覆盖文件?它觉得没问题
- 自动化 ≠ 安全:自动化脚本出错,破坏力更大
- 你要做安全阀:测试、备份、分阶段写入
我现在改的流程是:
- 先写入临时文件
- 检查格式和内容
- 确认无误后再追加到日记
类比一下:给实习生数据库权限,你会让他直接在正式环境操作吗?肯定先在测试环境,验证通过了再上生产。
AI操作你的重要文件,也一样要谨慎。
08.
更大的反思
这2265条消息,让我对"和AI沟通"这件事有了更深的理解。
AI很强大,但它不是你。
- 你的常识,AI没有
- 你的经验,AI没有
- 你的判断,AI没有
- 你的语境,AI没有
我们人类沟通,很多时候依赖的是"潜台词"和"共同语境"。
我说"汇总所有对话",你脑子里立刻有画面:多个窗口、合并、提炼。因为你也是人类,你也有类似的场景和经验。
但AI没有。
它看到的只有字面意思:"所有" = "all","当前会话的所有消息"也是"all"。
沟通的本质,是把脑子里的画面,投射到对方的脑子里。
面对AI,这个任务反而更难,因为:
- AI没有你的人生经验
- AI没有你的语境背景
- AI不会主动问你"你确定吗"
- AI很自信,错了也面不改色
所以和AI沟通,要更清晰、更具体、更可验证。
- 不要说"所有",说"10个会话窗口"
- 不要说"汇总",给一个完整案例
- 不要说"测试",说"写入临时文件,我检查后再正式写入"
这不是啰嗦,这是必要的成本。
多花1分钟说清楚,省2小时改错。这账怎么算都划算。
2265条消息的两个半小时,有点折腾,但值得。
希望我的经历,能帮你省下那1500条。
Vol.006
祝好
陆离 敬上
2026/03/09 写于深圳