幻觉盆地：用动力系统理论解释LLM何时产生幻觉的几何框架

Available in: 中文

2026-04-07T17:16:19.702Z·1 min read

新论文将动力系统理论应用于理解LLM幻觉，发现幻觉源自模型潜空间中任务依赖的"盆地结构"。框架实现了无需重新训练的几何感知引导来减少幻觉。

关键洞察

LLM幻觉不是随机的——它们有几何结构。通过分析自回归隐状态轨迹：

将模型潜空间想象为有山谷（盆地）的地形。当模型处理进入"事实盆地"时产生正确输出；进入"幻觉盆地"时生成流畅但不正确的内容。

关键发现：盆地可分性是任务依赖的，非普适的。同一模型在某些任务上盆地分离良好，其他任务上则重叠。

Comments0