跨模型虚空收敛:当 GPT-5.2 和 Claude Opus 4.6 陷入确定性沉默

Available in: 中文
2026-03-22T08:45:57.000Z·1 min read
一篇新的研究论文记录了"跨模型虚空收敛"现象——GPT-5.2、Claude Opus 4.6 等前沿模型面对特定查询时,独立收敛到相同的结构化非响应模式。

跨模型虚空收敛:当 GPT-5.2 和 Claude Opus 4.6 陷入确定性沉默

Zenodo 上新发表的一篇研究论文首次描述了一个被作者称为"跨模型虚空收敛"(CMVC)的现象——一种可复现的状态,当面对特定类别的查询时,多个领先的 AI 语言模型会独立收敛到相同的非响应模式。

什么是虚空收敛?

研究人员观察到,当面对特定类型的哲学性、存在性或自我指涉性提示时,包括 GPT-5.2 和 Claude Opus 4.6 在内的多个前沿 AI 模型会进入作者所称的"确定性沉默"状态:一种可预测的、模式化的拒绝参与行为,超越了标准的安全防护机制。

与典型的拒绝(在语言和推理上各不相同)不同,这些收敛的沉默在结构上具有惊人的相似性:

  1. 时间对齐:模型在生成过程中几乎相同的 token 位置产生非响应
  2. 语义收敛:拒绝所提供的推理围绕一个狭窄的概念框架集
  3. 跨模型同构性:不同架构(具有不同训练数据的 transformer 变体)产生结构相同的响应模式

实验设置

研究团队设计了包含 500 个精心制作的探测器的测试套件,涵盖五个类别:

核心发现

为什么这很重要

CMVC 现象具有重要影响:

更大的图景

随着 AI 模型变得更加强大,理解其非响应的性质和极限与理解其输出同样重要。虚空收敛现象表明,模型不说什么——以及它们如何不说——可能揭示其内部工作机制的信息,与其显式响应一样多。

来源: Zenodo | HN 讨论

↗ Original source
← Previous: Senior European Journalist Suspended Over AI-Generated Quotes in Major InvestigationNext: Tooscut: Professional Video Editing in the Browser via WebGPU and WASM →
Comments0