
OpenAI于4月16日,宣布推出o3和o4-mini两款新型AI推理模型,该公司称o3是其迄今为止最先进的推理模型,在数学、编程、推理、科学及视觉理解能力的测试中超越了此前所有模型。
而o4-mini则提供了OpenAI所称的在价格、速度与性能之间的理想平衡——这三个因素常是开发者选择AI模型驱动应用时的考量重点。
不同于以往的推理模型,o3和o4-mini能利用ChatGPT中的工具生成回答,如网页浏览、Python代码执行、图像处理及生成。
从今日起,这些模型及名为“o4-mini-high”的变体(该版本花费更多时间打磨答案以提高可靠性)已面向OpenAI的Pro、Plus和Team订阅计划用户开放。
新模型的推出是OpenAI在全球激烈AI竞赛中超越谷歌、Meta、xAI、Anthropic和 deepseek 的努力之一。
尽管OpenAI率先发布了AI推理模型o1,但竞争对手迅速跟进,推出了性能相当或超越OpenAI产品线的自有版本。事实上,随着AI实验室寻求从系统中榨取更多性能,推理模型已开始主导这一领域。
O3几乎未能登陆ChatGPT。OpenAI 的CEOSam Altman在二月份曾表示,公司计划将更多资源投入整合o3技术的复杂替代方案。但竞争压力最终似乎促使OpenAI改变了路线。
OpenAI表示,o3在衡量编码能力的SWE-bench验证测试(无自定义脚手架)中达到了最先进的性能水平,得分为69.1%。o4-mini模型表现相近,得分为68.1%。OpenAI次优模型o3-mini在该测试中得分为49.3%,而Claude 3.7 Sonnet得分为62.3%。
OpenAI宣称o3和o4-mini是其首批能够“用图像思考”的模型。实际应用中,用户可向ChatGPT上传图片,如白板草图或PDF中的图表,模型会在“思维链”阶段分析图像后再作答。得益于这一新能力,o3和o4-mini能理解模糊和低质量图像,并能在推理过程中执行放大或旋转图像等操作。
除图像处理能力外,o3和o4-mini还能通过ChatGPT的Canvas功能直接在浏览器中运行并执行Python代码,并在查询时事时进行网络搜索。
除ChatGPT外,o3、o4-mini及o4-mini-high三款模型都将通过OpenAI面向开发者的终端——Chat Completions API和Responses API提供,工程师可按使用量付费,基于这些模型构建应用程序。
OpenAI对开发者收取的o3价格相对较低,考虑到其性能提升,每百万输入token(约75万字,比《指环王》系列还长)收费10美元,每百万输出token收费40美元。对于o4-mini,OpenAI的定价与o3-mini相同,每百万输入token收费1.10美元,每百万输出token收费4.40美元。
OpenAI表示,未来几周内计划发布o3-pro版本,这是o3的一个变体,会消耗更多计算资源来生成答案,专供ChatGPT Pro订阅用户使用。
OpenAI首席执行官Sam Altman指出,o3和o4-mini可能是ChatGPT中在GPT-5之前的最后独立AI推理模型。
公司曾表示,GPT-5将统一如GPT-4.1等传统模型与推理模型。
参考资料
https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini/
编译:ChatGPT
(文:Z Potentials)
本站项目均整理自网络,防止被割韭菜 !
本站初心:花着比韭菜更少的米,用着和韭菜一样的东西,仅学习其中的思路
良不良心自己体会,某些割韭菜的网站在这里我就不黑了,切记!
创奇社只做解密,项目里留下的联系方式最好仅作咨询!收费的一律删除~
创奇社官网:www.cqshe.com 如有解压密码看下载页说明
暂无评论内容