创奇社
首页
Deepseek专区
资讯中心
AI教程
资源下载
创奇社
首页
Deepseek专区
资讯中心
AI教程
资源下载
顶级论文复现
刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
今天凌晨1点,OpenAI开源了一个全新的AI Agent评测基准——PaperBench。 这个基准主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖…
资讯中心
2025.04.03
4人浏览
GPT-4o
OpenAI
PaperBench
博士水平
智能体评测
顶级论文复现