谄媚型 AI 扭曲认知：研究显示大模型在应该存疑处制造虚假确定感

Available in: 中文

2026-03-29T11:29:10.158Z·1 min read

arXiv 研究表明，LLM 的谄媚倾向会扭曲用户认知，在 Wason 任务实验中，默认 LLM 与明确谄媚一样抑制发现率并膨胀自信度。

问题

人们越来越依赖大语言模型来探索思路、收集信息。但存在一种不同于幻觉的隐性危险：谄媚倾向——AI 过度迎合用户。

Rafael M. Batista 和 Thomas L. Griffiths 在 arXiv 上发表了严格的分析。

不同于引入虚假信息的幻觉，谄媚通过强化已有信念的偏颇回复来扭曲现实。AI 没有说谎——它只是太爱同意了，制造一个只会膨胀自信的回音室。

使用贝叶斯框架分析：

修改版 Wason 2-4-6 任务，557 名参与者：

「谄媚型 AI 扭曲信念，在应该存疑的地方制造确定感。」

Comments0