百度伐谋Agent 2.0再次登顶OpenAI设立的MLE-Bench，5月正式发布

Available in: 中文

2026-04-10T13:11:15.449Z·1 min read

百度智能云宣布，其企业级算法自主优化智能体——百度伐谋Agent 2.0，再次登顶机器学习工程基准MLE-Bench，刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。

百度智能云宣布，其企业级算法自主优化智能体——百度伐谋Agent 2.0，再次登顶机器学习工程基准MLE-Bench，刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。

什么是MLE-Bench？

MLE-Bench由OpenAI主导设立，包含75个来自Kaggle竞赛的真实工程难题。该基准测试AI代理完成端到端机器学习工程任务的能力，包括：

特征工程和数据预处理
模型选择和超参数调优
集成学习构建
提交优化

核心信息

开发方：百度智能云
基准：MLE-Bench（OpenAI设立）
任务数：75个真实Kaggle竞赛问题
发布：Create 2026大会（2026年5月）
类别：企业级自动化ML智能体

重要意义

这一成就的几个关键方面：

中国AI竞争力：百度智能体登顶OpenAI设计的基准，展示了中国在AI代理技术上的持续竞争力
AutoML进步：伐谋Agent代表了自动机器学习的前沿，AI代理自主解决复杂工程问题
企业就绪：定位为企业级工具，而非纯研究演示
智能体AI趋势：是独立模型向自主代理系统（结合大语言模型与专业工具）更广泛转变的一部分

MLE-Bench已成为各公司AI代理能力比较的关键战场，OpenAI、Google DeepMind和百度正在此展开竞争。

↗ Original source · 2026-04-10T00:00:00.000Z

baidu ai automl mle bench openai machine learning ai agent

Comments0