AI安全验证本质不完整：柯尔莫哥洛夫复杂性证明无有限验证器可证明所有安全AI系统

Available in: 中文

2026-04-07T22:44:09.716Z·1 min read

研究人员证明了AI安全验证受制于内在的信息论限制——与计算资源无关。该结果对AI治理和监管具有深远影响。

关键结果

对于任何固定的可靠可计算枚举验证器，存在一个复杂性阈值，超过该阈值后，真正的策略合规实例无法被证明。没有有限的形式验证器能证明所有任意高复杂性的策略合规实例。

这不是实际限制（"计算不够"），而是根本性的数学不可能——类似于数学中的哥德尔不完备定理：

这一理论结果与Anthropic的Glasswing项目同日公布。Glasswing用AI发现漏洞，而本文证明AI安全的正式验证具有理论天花板——攻击能力（不断进步）与防御验证（有理论上限）之间形成张力。

Comments0