正文

你好,朋友。

见信如晤。

中午抽空开发了一个日志保存的功能,和AI聊了两个版小时,也吵了两个半小时。

不是那种真的吵架,而是:我以为我说清楚了,它理解偏了;我以为这个很简单,它搞复杂了;我以为快好了,它又错了。

  • 下午1点 开始的时候,我是 信心满满 的:就一个自动汇总的脚本,估计半小时能搞定?
  • 下午2点 左右的时候,我是 困惑不解 的:怎么连"所有对话"这种词还能理解错?
  • 下午2点半 的时候,我是 有点火 的:我要的是叙述文,你给我个统计报表干嘛?
  • 下午3点半 ,我是 长舒一口气 的:终于,对上了。

事后统计了一下,这两个半小时下来,总共 2265条消息 。

平均每分钟15条,全程高强度的来回(当然,是AI反馈得多)。

现在我把全程摊开来讲:所有节点由Claude code提取真实会话里的信息。有真实的对话、真实的情绪、真实的教训。

不是要吐槽AI,是想聊聊: 为什么和AI沟通这么难? 以及, 怎么才能少走弯路?

01.

我们从一个信心满满开始

事情要从今天下午说起。

我想自动化一个重复性工作:每天把和AI的对话记录,自动汇总到我的Obsidian日记里,作为记忆系统的一部分,后续会导入MemOS中(这个后面会展开来讲)。

于是我打开Claude Code,输入了需求:

我:写一个规则,每天晚上1点时帮我操作,将前一天所有的对话记录信息更新到日志文件中

那时候的我,信心满满。心想:这还不简单?写个脚本解析一下前一天的会话记录,加上OpenClaw的定时心跳触发,半小时搞定。

AI 也很干脆:

AI :我来帮你创建一个自动化脚本,每天凌晨1点自动运行...

然后就开始写代码了。

一切看起来都很顺利。

问题恰恰就出在"看起来"这三个字上。

02.

第一次误解——"所有"不等于"所有"

大概半小时后,Claude说测试完成了,给我看了输出:

AI:测试:处理今天的会话 (2026-03-09) 日记路径: /Users/XXXX/00-Daily/2026-03-09.md 找到 10 个会话文件

会话列表:

[13:02] 9ac9087d... 问题: 根据这篇文章提供的信息... [13:59] 5ba28cda... 问题: 检查一下本地MemOS... [11:15] 18eb9f38... 问题: 将所有的claude code配置打包... ...

???

这不对啊。

我说的"所有对话",是指我每天开的 10个会话窗口 ,每个窗口都要处理,合并到一起。

但AI理解的"所有对话",是 当前会话 的所有消息,然后列了个会话目录。

我立刻指出问题:

我:这个是记录一个会话,还是说前一天的所有对话过程都记录?我需要记录所有对话过程,而不是某一个对话。我每次和claude code沟通都是一个新窗口

AI赶紧道歉:

AI:抱歉误解了。你需要汇总所有会话的内容,而不仅仅是列出会话列表...

然后开始库库改代码。

这么简单的"所有",怎么还能理解错?

03.

第二次误解——"汇总"不等于"统计"

AI:分析日期: 2026-03-09 总共提取 2265 条消息 识别 9 类任务

任务分类:

代码开发: 588 个对话

安装配置: 491 个对话

数据分析: 89 个对话

测试验证: 88 个对话

配置同步: 82 个对话

调试修复: 62 个对话

系统维护: 34 个对话

文档写作: 24 个对话

✅ 已更新日记

我整个人都不好了。

这哪是我要的"汇总"?

我要的是:把同类型的任务合并,用叙述性语言写出背景、过程、结果。

它给我的:一个统计报表,数了数代码开发有588条、安装配置有491条...

这完全不是一回事啊!

我开始意识到,这不是AI"笨",而是我的语言有歧义——我的脑子有语境,AI都没有。

我:注意看我的要求。是需要完整的 背景、过程、结果和待完成事项 。而不是日志的数据输出。写到openclaw的日志,是由openclaw启动心跳系统来完成这个任务,对claude code和openclaw的对话都进行。

然后我意识到,描述了半天不如给个例子。

于是我直接贴了我要的格式:

软件安装任务一 :根据 XXX 文章的内容,安装文章中到的skills过程 :分析文章,梳理出XXX、XXXX等插件,并通过github安装,目前均已安装完毕结果 :安装了XXX、XXXX等X个Skills

我:这是完整的案例,照这个格式来。

04.

然后,AI 给我整了个大的

AI说"✅ 已更新日记"后,我打开日记一看,整个人都不好了。

原来的日记内容没了,取而代之的是一堆格式错乱的东西:

分析日期: 2026-03-09 总共提取 2265 条消息 代码开发: 588 个对话 ...

我那天上午的工作笔记、待办事项、重要记录, 全没了 。

那一瞬间,我是真的慌了。

(介个,忘记截图了)

那一刻我的大脑一片空白:

  • 今天的工作笔记没了
  • 待办事项没了
  • 一些临时记下的想法、思路,全没了

我能回忆起来多少?估计10%都不到

我骂了它一顿,然后让AI给我找回来(说不定人家有备份呢)

然后它又开始干活了

结果整了半天,还是没弄出来。

还好,我想到了Dropbox有历史版本功能。

赶紧打开Dropbox,找到那个文件,右键 → 查看历史版本。

看到了!几分钟前的版本还在。

再晚一点,我云端的记录都被覆盖掉了

我恢复了原来的内容,然后立刻给AI发了消息:

我:你的测试不能直接覆盖我的日记 !这是我的真实数据!

以后测试,先写入临时文件,我检查确认后,再正式写入。

这次幸好有Dropbox历史版本,不然我真的GG了。

05.

终于完成了

经历了刚才的惊险时刻,我意识到不能再让AI"猜"了。我直接贴了完整的案例格式:

软件安装任务一 :根据 XXX 文章的内容,安装文章中到的skills过程 :分析文章,梳理出XXX、XXXX等插件,并通过github安装,目前均已安装完毕结果 :安装了XXX、XXXX等X个Skills

我:这是完整的案例,照这个格式来。写到openclaw的日志,是由openclaw启动心跳系统来完成这个任务,对claude code和openclaw的对话都进行。

这次,AI终于明白了:

AI:明白了!你需要的是:

扫描前一天的jsonl文件

按任务类型分类并合并同类项

每个任务包含:背景、过程、结果、待办事项

使用叙述性语言,不是统计数据

现在开始执行...先写入临时文件,你检查后再正式写入。

你终于知道是要AI来理解会话内容,不是关键词匹配了

早给案例不就完了?前前后后折腾了这么久。

那一刻我突然明白: 自然语言描述,每个词都能理解,但合起来有歧义;具体案例,格式结构一目了然,没有歧义。

06.

复盘一下:2265条记录来自哪里

事情搞定后,我让AI统计了一下,发现那天总共产生了 2265条消息 。

从下午1点到3点半,两个小时36分钟,全程高强度的来回。

我把它们拆开来看:

轮次消息数占比结果第一轮("所有"误解)~500条22%失败第二轮("汇总"误解+日记被覆盖)~1200条53%失败第三轮(给案例对齐)~400条18%成功技术实现~165条7%完成

消息数

占比

结果

第一轮("所有"误解)

~500条

22%

失败

第二轮("汇总"误解+日记被覆盖)

~1200条

53%

失败

第三轮(给案例对齐)

~400条

18%

成功

技术实现

~165条

7%

完成

有效消息大概只有30%,剩下70%都在来回修正、误解、调试。

最讽刺的是:如果我从一开始就给案例,预估500-800条消息就能搞定。

多出来的1500条,完全是因为:

  • 我以为"所有"这个词很清楚,但AI理解成"当前"
  • 我以为"汇总"这个词很清楚,但AI理解成"统计"
  • 我一直在描述需求,但从来没有给过具体格式

07.

我学到了什么

这两个半小时 + 一次数据危机,换来了三个教训。

教训一:把AI当实习生——任务要明确、要具体、要给案例

我之前的认知是:AI很聪明,说个大概应该能懂。

现在的认知是: AI就像实习生,你要交代清楚。

(其实这个认知很早就有AI大牛说过,但自己没经历过,总觉得问题不大。果然有些坑还是要自己踩)

2265条消息里,前1700条都是在"误解-修正"的循环里。

最大的问题就是:我以为我在"沟通",其实我一直在"让AI猜"。

  • 我说"所有",我脑子里有画面,AI没有
  • 我说"汇总",我脑子里有格式,AI没有
  • 我说"分类",我脑子里有标准,AI没有

解决方案:第一轮就给案例。

你想想,你让一个实习生"做个总结",他做出来的和你想要的能一样吗?肯定不一样。你要给示例、给模板、给标准。AI也一样。

❌ 别说: "汇总对话,提炼要点,分类整理"

✅ 改说: "复制这个格式,填入内容:[完整案例]"

多花1分钟准备案例,省2小时来回修正。这账怎么算都划算。

教训二:AI不会自我怀疑——你必须做验收

AI说"已更新日记",这句话听起来很笃定、很自信。

但它的自信是建立在"我执行了代码"的基础上,不是建立在"结果是正确的"基础上。

AI不会自我怀疑 。它错了也不知道,它不知道自己不知道。

这次如果没有Dropbox历史版本,我真的GG了。

所以你必须做验收:检查、测试、验收,一步都马虎不得。

这不是不信任AI,这是基本的工作流程。就像实习生交给你代码,你会直接上线吗?肯定要先跑一遍测试。AI也一样,甚至更要测试——因为它更"自信",错了也面不改色。

教训:任何AI输出的内容,尤其是要写入文件、修改配置的,先看一眼,先测试一下。

教训三:自动化越强,安全意识要越高

日记被覆盖这件事让我深刻意识到: 自动化越强,一旦出错的破坏力就越大。

  • AI不知道"危险":覆盖文件?它觉得没问题
  • 自动化 ≠ 安全:自动化脚本出错,破坏力更大
  • 你要做安全阀:测试、备份、分阶段写入

我现在改的流程是:

  • 先写入临时文件
  • 检查格式和内容
  • 确认无误后再追加到日记

类比一下:给实习生数据库权限,你会让他直接在正式环境操作吗?肯定先在测试环境,验证通过了再上生产。

AI操作你的重要文件,也一样要谨慎。

08.

更大的反思

这2265条消息,让我对"和AI沟通"这件事有了更深的理解。

AI很强大,但它不是你。

  • 你的常识,AI没有
  • 你的经验,AI没有
  • 你的判断,AI没有
  • 你的语境,AI没有

我们人类沟通,很多时候依赖的是"潜台词"和"共同语境"。

我说"汇总所有对话",你脑子里立刻有画面:多个窗口、合并、提炼。因为你也是人类,你也有类似的场景和经验。

但AI没有。

它看到的只有字面意思:"所有" = "all","当前会话的所有消息"也是"all"。

沟通的本质,是把脑子里的画面,投射到对方的脑子里。

面对AI,这个任务反而更难,因为:

  • AI没有你的人生经验
  • AI没有你的语境背景
  • AI不会主动问你"你确定吗"
  • AI很自信,错了也面不改色

所以和AI沟通,要更清晰、更具体、更可验证。

  • 不要说"所有",说"10个会话窗口"
  • 不要说"汇总",给一个完整案例
  • 不要说"测试",说"写入临时文件,我检查后再正式写入"

这不是啰嗦,这是必要的成本。

多花1分钟说清楚,省2小时改错。这账怎么算都划算。

2265条消息的两个半小时,有点折腾,但值得。

希望我的经历,能帮你省下那1500条。

Vol.006

祝好

陆离 敬上

2026/03/09 写于深圳