大模型幻觉的成因与治理

Ruochen Chen2026年2月1日大约 4 分钟

什么是幻觉

大模型幻觉是指模型在未知或知识不足时，自信地创造虚假信息的现象，与简单错误不同。

表现为无中生有，如帮写论文时虚构不存在的参考文献（书名、作者），在中医古籍、特定法律条款等冷门专业领域仍常见。

处理文档时生成与参考材料矛盾的内容，例如财报原文显示净利润亏损 5%，总结却称「实现稳健增长」，即生成内容与输入信息直接冲突。

长文本推理中注意力漂移导致因果断裂，如前文说「A 导致 B」，中间推理后结论却变成「A 导致 C」，整体读起来流畅但因果关系不成立。

互联网数据中 AI 生成内容占比上升，导致「知识污染」。模型 A 生成的虚假信息被模型 B 当作真理学习，进而生成新的虚假内容，真实信号减弱，虚假噪音被当作高权重知识，模型学习的「教材」本身已被污染。

大模型本质是「有损压缩器」，类似将图书馆书籍压缩进 JPG 图片，放大时部分细节模糊。模型对模糊细节不会承认「看不清」，而是根据概率选择最可能的词填充，导致虚构内容（如虚构历史事件），模型自身不认为在撒谎。

模型虽有内在思维链（internal cot），理论上应先推导、验证再输出结果，但受算力限制或追求速度，会跳过验证步骤，类似学生做题跳过中间步骤直接写答案，导致逻辑顺但结论错误的幻觉。

又称「慢思考」，对应推理模型 system two。与快速直觉式的 system one 不同，面对问题时，模型会在后台先拆分问题为小步骤，逐步推导并自我校验，确认无误后再输出结果。适用于数学计算、写代码等容错率低的任务，准确率接近 100%。

在普通 RAG 基础上增加「自我反思」机制。智能代理检索资料后，会先判断信息是否足够回答问题，若不足或有冲突，自动发起多次检索，直至信息充足。最终生成的每个句子都标注来源（文件及段落），提供出处安全感，是企业客服机器人、专业知识库的工业标准方案。

终极形态：组合使用多种方案（如长上下文模型梳理背景 → agentic RAG 精准搜索数据 → 推理模型生成分析报告）。