潜在推理模型真的在推理吗？新研究发现推理token往往不必要

Available in: 中文

2026-04-07T22:06:13.462Z·1 min read

一项检查最先进潜在推理模型（LRM）的新研究得出了令人惊讶的发现：LRM内部生成的"推理"token往往对产生正确答案完全不必要。

关键发现

在逻辑推理数据集上，LRM几乎总是可以不使用潜在推理就产生相同的最终答案。

当潜在推理token对性能必要时，研究人员可以解码出65-93%的正确推理轨迹。

LRM是像DeepSeek-R1或OpenAI的o系列那样的模型，在产生最终答案之前生成中间"思考"token。

当推理发生在潜在空间而非文本中时，我们无法轻松检查模型在做什么——使安全评估变得更难。

Comments0