ChatGPT推荐的产品全部错误:实验揭示AI购物助手可靠性鸿沟
Available in: 中文
一项WIRED实验让ChatGPT基于WIRED评测者的推荐提供产品推荐,结果发现AI聊天机器人给出的答案完全错误,凸显了自信的AI回复与实际专家意见之间的可靠性差距。
实验揭示AI自信回复与事实准确性之间的差距
一项WIRED实验让ChatGPT基于WIRED评测者的推荐提供产品推荐,结果发现AI聊天机器人给出的答案完全错误,凸显了自信的AI回复与实际专家意见之间的可靠性差距。
实验
WIRED让ChatGPT推荐其在各产品类别中评测者会推荐的产品。结果一律不正确——AI自信地推荐了WIRED评测者从未认可的产品。
为什么会发生这种情况
多种因素导致了产品推荐中的这类AI幻觉:
- 训练数据包含互联网上无数的评论和推荐
- ChatGPT无法可靠地区分不同评测者和出版物
- 模型倾向于混合和综合来自多个来源的信息
- 品牌名称和产品类别在模型内部表示中变得混淆
更大的问题
这不仅仅是产品推荐错误的问题。实验揭示了一个根本挑战:
- 有自信但不准确:ChatGPT以与正确答案相同的自信呈现错误答案
- 来源归属失败:模型无法可靠引用具体评测者意见
- 消费者风险:依赖AI推荐的用户可能做出糟糕的购买决策
- 信任侵蚀:反复不准确的推荐削弱对AI助手的信任
对AI购物助手的启示
随着零售商和科技公司推进AI购物助手,这项实验是一个警告:
- AI购物推荐需要强大的事实核查机制
- 与实际产品数据库和评论系统的整合至关重要
- 用户应对照原始来源验证AI推荐
- 一般AI知识与特定专家推荐之间的差距仍然很大
来源:WIRED https://www.wired.com/story/i-asked-chatgpt-what-wired-reviewers-recommend-its-answers-were-all-wrong/
← Previous: AI Has Flooded All the Weather Apps: How Generative Models Are Changing ForecastingNext: Silicon Industry in China Faces Severe Supply-Demand Imbalance as Prices Fall Below Cost →
0