可读的心灵：LLM扑克Agent通过长期对弈自发发展心智理论——但需要记忆

Available in: 中文

2026-04-07T16:06:38.884Z·1 min read

引人入胜的新研究发现，玩德州扑克的大语言模型Agent逐步发展出心智理论——建模他人心理状态的能力——但只有配备持久记忆时才能做到。

引人入胜的新研究发现，玩德州扑克的大语言模型Agent逐步发展出心智理论——建模他人心理状态的能力——但只有配备持久记忆时才能做到。

实验

2×2因子设计（记忆有/无 × 领域知识有/无），5次重复（N=20，~6000手牌观察）：

记忆+知识 → Agent发展ToM 3-5级
仅记忆 → 仍发展ToM
仅知识 → 无ToM发展
两者都无 → 无ToM发展

关键发现：记忆是必要且充分的

Cliff's delta = 1.0 — 完美效应量
有记忆Agent达ToM 3-5级，无记忆Agent始终保持0级

出现了什么

对手建模 — Agent学会预测对手可能持有什么
策略性欺骗 — 有记忆Agent基于对手模型进行有依据的诈唬
递推推理 — "他们认为我认为他们有X，所以我应该Y"

为什么重要

此前LLM的ToM测试使用静态小场景。本研究表明ToM可以通过交互动态涌现，而非仅通过提示测试。

记忆要求特别重要：它表明会话有界的AI助手（在对话间丢失上下文）无论潜在能力如何，都无法发展真正的心智理论。

意义

持久记忆对复杂社交AI行为至关重要
会话有界系统在社交推理上根本受限
心智理论可以涌现 — 不需要显式编程

↗ Original source · 2026-04-07T00:00:00.000Z

theory of mind llm poker ai agents memory emergent behavior game theory social ai

Comments0