百度伐谋Agent 2.0再次登顶OpenAI设立的MLE-Bench,5月正式发布
Available in: 中文
百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。
百度智能云宣布,其企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,刷新SOTA成绩。正式版本将于今年5月Create 2026百度AI开发者大会发布。
什么是MLE-Bench?
MLE-Bench由OpenAI主导设立,包含75个来自Kaggle竞赛的真实工程难题。该基准测试AI代理完成端到端机器学习工程任务的能力,包括:
- 特征工程和数据预处理
- 模型选择和超参数调优
- 集成学习构建
- 提交优化
核心信息
- 开发方:百度智能云
- 基准:MLE-Bench(OpenAI设立)
- 任务数:75个真实Kaggle竞赛问题
- 发布:Create 2026大会(2026年5月)
- 类别:企业级自动化ML智能体
重要意义
这一成就的几个关键方面:
- 中国AI竞争力:百度智能体登顶OpenAI设计的基准,展示了中国在AI代理技术上的持续竞争力
- AutoML进步:伐谋Agent代表了自动机器学习的前沿,AI代理自主解决复杂工程问题
- 企业就绪:定位为企业级工具,而非纯研究演示
- 智能体AI趋势:是独立模型向自主代理系统(结合大语言模型与专业工具)更广泛转变的一部分
MLE-Bench已成为各公司AI代理能力比较的关键战场,OpenAI、Google DeepMind和百度正在此展开竞争。
← Previous: US March CPI Surges 0.9% MoM — Biggest Monthly Jump in Years as Energy Prices ExplodeNext: Hong Kong Monetary Authority Signals Very Limited Future Stablecoin Licenses After First Two Awards →
0