LLM 可大规模识别匿名用户:精确度高达 90%,彻底颠覆网络隐私假设
Available in: 中文
研究表明 LLM 可以 90% 精确度跨平台去匿名化用户,彻底颠覆了「匿名化提供足够保护」的网络隐私基本假设。
LLM 可大规模识别匿名用户:精确度高达 90%,彻底颠覆网络隐私假设
研究人员证明,大型语言模型可以以令人震惊的准确度跨多个社交媒体平台去匿名化用户——精确度高达 90%,召回率达 68%。这些发表在同行评审论文中的发现对网络隐私构成了根本性威胁。
研究
该研究测试了 LLM 通过分析写作风格、主题偏好和行为模式来匹配跨平台帖子(例如将 Hacker News 账户关联到 LinkedIn 个人资料)的能力:
- 精确度:高达 90% 的去匿名化猜测是正确的
- 召回率:68% 的匿名用户被成功识别
- 规模:该方法在人群级别工作,而非仅针对个人
- 成本:与传统调查方法相比,该过程快速且廉价
为什么这改变了一切
网络匿名性长期以来一直是一个「隐含威胁模型」——人们假设虽然完全匿名是不可能的,但匿名化提供了足够的保护,因为有针对性的去匿名化需要大量努力。LLM 使这一假设失效:
- 大规模人肉搜索:批量识别匿名评论者、审查者和举报者
- 跟踪:将公开但匿名的账户链接到真实身份
- 营销监控:从分散的匿名数据中构建详细的消费者画像
- 专制风险:政府可能利用此技术识别异见者和活动家
对平台的影响
社交媒体平台和论坛面临艰难选择:
- 更强的匿名工具:账户间更激进的身份隔离
- 抗 LLM 设计:在帖子中添加噪声或风格随机化
- 政策回应:更新关于跨平台去匿名化的服务条款
来源: Ars Technica | 研究论文
← Previous: Invisible Code Supply-Chain Attack Hits GitHub and Other Major RepositoriesNext: Trump Gets AI Data Center Giants to Sign 'Ratepayer Protection Pledge' on Energy Costs →
0