洗车店就在家门口 50 米,我问 AI 怎么去,它说“走过去“—— 深入剖析为什么 AI 会集体翻车?

📅 发布时间:2026/7/4 19:57:37 👁️ 浏览次数:
洗车店就在家门口 50 米,我问 AI 怎么去,它说“走过去“—— 深入剖析为什么 AI 会集体翻车?
你会学到什么✅ 为什么 AI 给出正确但无用的答案✅ 大语言模型的实际工作原理以及它们做不到什么✅ 模式匹配与推理的区别✅ 为什么 AI 缺乏常识 真实案例一次翻车的对话让我分享昨天和 AI 的一段对话我洗车店距离我家 50 米我怎么过去ChatGPT很简单直接走过去就可以了50 米大约是 1 分钟的步行距离。我......听起来很合理对吧AI 给出了一个正确的答案。但问题是我问这个问题是因为我想开车去。我当时坐在车里准备导航去 50 米外的洗车店。我问 AI 怎么去期待它说太近了不需要导航。直接往前开就能看到。但它告诉我走过去。为什么 AI 在这么简单的问题上翻车了Part 1: AI 说对了但没想对理解的幻觉当 ChatGPT 告诉我走过去时它并没有错。走 50 米是完全合理的建议 ——如果你是个行人的话。问题是AI 没有理解上下文。它看到了• 距离50 米• 问题我怎么过去• 模式短距离 → 走路它匹配了模式。但它错过了我问题背后的意图。打个比方想象你问同学我怎么去食堂聪明的同学看着你注意到你坐轮椅说坐电梯。AI 同学不看你直接说走过去。为什么因为 AI 不会看你 —— 它只看到文字。Part 2: LLM 的工作原理 —— Token 预测机器AI 不是在思考而是在预测让我们理解当你和 ChatGPT、Claude 对话时实际发生了什么。AI 本质上是一个预测下一个词的机器。以下是它如何处理你的问题输入洗车店距离我家 50 米我怎么过去分词[洗车店, 距离, 我家, 50, 米, , 我, 怎么, 过去, ]AI 的内部处理Token 1: 洗车店 Token 2: 距离 Token 3: 我家 Token 4: 50 Token 5: 米 ← 哦短距离 ... Token 10: ← 问号 检测到模式 [短距离] [怎么去] 最可能的回复 → 走过去这不是推理。这是模式匹配。AI 看到的 vs. 你的意思当你输入洗车店距离我家 50 米我怎么过去你的意思• 我在车里• 我需要开车去• 我在问是否近到不需要导航AI 看到的• 距离 50 米• 问题词 怎么• 上下文 无人类推理 vs. AI 处理人类问题 → 上下文 → 意图 → 答案怎么去↓他在问洗车店↓可能想开车↓太近了直接开过去AITokens → 模式 → 最可能的 token[50, 米, 怎么, 去]↓模式short_distance travel↓最常见答案走过去看到区别了吗人类从意图推理。AI 匹配模式。Part 3: 为什么 AI 缺乏常识缺失的部分物理世界模型AI 读过数十亿个单词但它从未• 坐过车• 走过 50 米• 见过洗车店它没有物理世界的模型。让我们分解一下常识实际意味着什么常识 物理世界 社会规范 隐含知识1. 物理世界知识✅人类知道• 如果你已经在车里50 米也要用车• 走路是给行人的• 你不会下车走 50 米❌AI 不知道• 坐在车里是什么感觉• 下车会很不方便• 这个问题暗示我在车里2. 社会规范✅人类知道• 问怎么去一个 50 米的地方暗示特殊情况• 正常人不需要帮助走 50 米• 所以问题可能是关于开车❌AI 不知道• 问题的社会含义• 什么是显而易见vs需要问3. 隐含知识✅人类推断• 问洗车店 → 可能在开车• 已经知道位置 → 问的是导航• 50 米对导航应用来说很尴尬❌AI 推断• 什么都不推断。只处理明确的文字。⚠️常见误区❌ AI 可以从更多训练数据中学到常识。✅真相常识需要具身体验。你无法仅从文本中学会坐在车里是什么感觉。读再多关于游泳的文字都学不会游泳。Part 4: 更多翻车案例 —— 当模式匹配失败时案例 1草莓问题问题strawberry 这个词里有几个字母 rGPT-4 回答strawberry 里有两个 r。正确答案三个。(strawberry)为什么翻车AI 不看字母。它看 token。strawberry 是一个 token不是 10 个字母。案例 2反转文本问题问题反转单词 appleAI 回答elppa ✅问题反转单词 ChatGPTAI 回答经常答错 ❌为什么困难Token 级处理使字符操作变得困难。案例 3大小比较问题问题哪个更大9.11 还是 9.9早期 GPT 回答9.11 更大因为它有更多数字。正确答案9.99.11 九点一一不是九百一十一为什么翻车模式匹配更多数字 更大不理解小数。案例 450 米洗车店我们的案例问题洗车店距离我家 50 米我怎么过去AI 回答走过去。我的意思我在车里是不是太近了不需要导航模式短距离 怎么过去 → 走路Part 5: 这告诉我们什么AI 是学者综合症患者 —— 某些领域天才其他方面无知把 AI 想象成一个患有学者综合症的人 —— 在特定领域有非凡能力但缺乏基本常识。AI 的超能力✅ 写代码✅ 翻译语言✅ 总结文档✅ 回答事实性问题✅ 模式识别AI 的盲区❌ 物理世界推理❌ 上下文理解❌ 常识判断❌ 意图推断❌ 具身体验悖论更多数据 ≠ 更多理解OpenAI 用以下内容训练 GPT-4• 数十亿网页• 书籍、论文、代码• 对话但它仍然不知道当你已经在车里时你不会走 50 米去洗车店。为什么因为知道 ≠ 理解。设计背后的故事中文房间论证1980哲学家 John Searle 提出想象一个人在房间里有一本翻译中文的规则书。他们收到中文问题按照规则产生中文答案。他们理解中文吗不。他们只是在遵循规则。这就是 LLM 所做的。它们遵循统计规则但它们不理解。Part 6: 如何与 AI 的局限性共处给出明确的上下文❌之前洗车店距离我家 50 米我怎么过去✅现在我现在在车里洗车店距离我家 50 米。我需要导航吗明确说明• 你的当前状态我在车里• 你的意图我想开车去• 你的实际问题太近了需要导航吗理解 AI 擅长什么✅ 用 AI 来• 文本生成写代码、文案• 模式识别分类、总结• 知识检索查找信息• 翻译❌ 不要依赖 AI• 常识判断• 物理推理• 微妙的社交语境• 意图理解验证不要盲目信任当 AI 给你一个答案时问问自己• 这在上下文中合理吗• 我提供了足够的信息吗• AI 只是在匹配模式吗AI 是工具不是神谕。总结为什么 AI 在简单问题上翻车五个原因❶ AI 不理解上下文❷ AI 是模式匹配器不是推理器❸ AI 缺少物理世界模型❹ AI 无法推断隐含意图❺ 常识需要具身体验一句话总结AI 在模式匹配方面令人难以置信但在常识方面很糟糕 —— 因为它从未体验过物理世界。思考题下次你问 AI 一个问题时试着问问自己我是否给了它足够的上下文来理解我的意图而不仅仅是我的词语 最后的思考50 米洗车店问题不是一个 bug —— 这是一个特性。它提醒我们AI 是一个为模式匹配而构建的工具而不是一个理解世界的心智。当 AI 说等等你在车里问洗车店怎么走。它就在 50 米外 —— 看看窗外直接开过去。你不需要导航。那一天AI 才有了常识。我们还没到那一步。