原生尺度AI生成视频检测：14万视频、15个生成器、ICLR 2026新SOTA

Available in: 中文

2026-04-07T23:23:14.905Z·1 min read

一篇新的ICLR 2026论文引入了迄今最全面的AI生成视频检测系统，处理了来自15个生成器的14万+视频，无需现有方法中破坏信息的预处理。

一篇新的ICLR 2026论文引入了迄今最全面的AI生成视频检测系统，处理了来自15个生成器的14万+视频，无需现有方法中破坏信息的预处理。

当前检测的问题

现有AI视频检测器存在一个关键缺陷：

将视频调整大小和裁剪为固定分辨率
这破坏了高频伪造痕迹 — 正是检测所需的信号
预处理导致空间失真和重大信息损失
训练数据集过时，无法捕捉现代生成器

解决方案：原生尺度处理

研究人员在Qwen2.5-VL Vision Transformer上构建了检测框架，可在以下条件下运行：

可变空间分辨率 — 无固定调整
可变时间长度 — 无固定裁剪
原生尺度 — 保留所有高频痕迹

数据集

组件	规格
视频	14万+
生成器	15个（开源+商业）
基准	Magic Videos（超逼真合成内容）
架构	Qwen2.5-VL Vision Transformer

ICLR 2026终稿

论文已被接受，处于终稿状态，表明同行评审验证。

为什么重要

虚假信息防御 — 对抗深度伪造和合成媒体必不可少
内容平台 — 社交媒体公司需要可靠的AI视频检测
法律证据 — 验证媒体真实性的取证工具
军备竞赛 — 检测必须跟上不断改进的生成模型

↗ Original source · 2026-04-07T00:00:00.000Z

deepfake detection ai video iclr 2026 qwen2 5 vl vision transformer forensics synthetic media content authenticity misinformation

Comments0