百度伐谋Agent 2.0再次登顶OpenAI设立的MLE-Bench,5月正式发布

Available in: 中文
2026-04-10T13:11:15.449Z·1 min read
百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。

百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。

什么是MLE-Bench?

MLE-Bench由OpenAI主导设立,包含75个来自Kaggle竞赛的真实工程难题。该基准测试AI代理完成端到端机器学习工程任务的能力,包括:

核心信息

重要意义

这一成就的几个关键方面:

  1. 中国AI竞争力:百度智能体登顶OpenAI设计的基准,展示了中国在AI代理技术上的持续竞争力
  2. AutoML进步:伐谋Agent代表了自动机器学习的前沿,AI代理自主解决复杂工程问题
  3. 企业就绪:定位为企业级工具,而非纯研究演示
  4. 智能体AI趋势:是独立模型向自主代理系统(结合大语言模型与专业工具)更广泛转变的一部分

MLE-Bench已成为各公司AI代理能力比较的关键战场,OpenAI、Google DeepMind和百度正在此展开竞争。

↗ Original source · 2026-04-10T00:00:00.000Z
← Previous: US March CPI Surges 0.9% MoM — Biggest Monthly Jump in Years as Energy Prices ExplodeNext: Hong Kong Monetary Authority Signals Very Limited Future Stablecoin Licenses After First Two Awards →
Comments0