百度伐谋Agent 2.0再次登顶OpenAI的MLE-Bench,刷新机器学习工程基准SOTA

Available in: 中文
2026-04-10T23:05:35.076Z·1 min read
百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于2026年5月Create百度AI开发者大会发布。

百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于2026年5月Create百度AI开发者大会发布。

什么是MLE-Bench?

MLE-Bench由OpenAI主导设立,包含75个来自Kaggle竞赛的真实工程难题,测试AI智能体执行端到端机器学习工程任务的能力,包括:

伐谋Agent 2.0详情

重要意义

中国AI公司在OpenAI创建的基准上登顶具有多重意义:

  1. 竞争格局:展示中国AI实验室在严谨工程任务上可与西方同行竞争
  2. 企业聚焦:该智能体面向企业使用,暗示实际商业应用
  3. AutoML演进:代表自动化机器学习的下一代
  4. 基准可信度:OpenAI的MLE-Bench被认为是最具挑战性的AI工程能力测试之一

下一步

百度将在Create 2026年会上正式发布伐谋Agent 2.0,预计将在AI驱动的开发工具市场上与西方公司的类似产品竞争。

↗ Original source · 2026-04-10T00:00:00.000Z
← Previous: China's Cyber Regulators Crack Down on 7 Ticket Platforms: No Automated High-Frequency Ticket Snatching AllowedNext: US March CPI Rises 3.3% Year-over-Year, Energy Prices Surge 10.9% Monthly →
Comments0