速递｜GPT-5前的最后冲锋？OpenAI亮出o3与o4-mini双模型，实现“用图像思考”-创奇社

速递｜GPT-5前的最后冲锋？OpenAI亮出o3与o4-mini双模型，实现“用图像思考”-1

图片来源：Unsplash

OpenAI于4月16日，宣布推出o3和o4-mini两款新型AI推理模型，该公司称o3是其迄今为止最先进的推理模型，在数学、编程、推理、科学及视觉理解能力的测试中超越了此前所有模型。

而o4-mini则提供了OpenAI所称的在价格、速度与性能之间的理想平衡——这三个因素常是开发者选择AI模型驱动应用时的考量重点。

不同于以往的推理模型，o3和o4-mini能利用ChatGPT中的工具生成回答，如网页浏览、Python代码执行、图像处理及生成。

从今日起，这些模型及名为“o4-mini-high”的变体（该版本花费更多时间打磨答案以提高可靠性）已面向OpenAI的Pro、Plus和Team订阅计划用户开放。

新模型的推出是OpenAI在全球激烈AI竞赛中超越谷歌、Meta、xAI、Anthropic和 deepseek 的努力之一。

尽管OpenAI率先发布了AI推理模型o1，但竞争对手迅速跟进，推出了性能相当或超越OpenAI产品线的自有版本。事实上，随着AI实验室寻求从系统中榨取更多性能，推理模型已开始主导这一领域。

O3几乎未能登陆ChatGPT。OpenAI 的CEOSam Altman在二月份曾表示，公司计划将更多资源投入整合o3技术的复杂替代方案。但竞争压力最终似乎促使OpenAI改变了路线。

OpenAI表示，o3在衡量编码能力的SWE-bench验证测试（无自定义脚手架）中达到了最先进的性能水平，得分为69.1%。o4-mini模型表现相近，得分为68.1%。OpenAI次优模型o3-mini在该测试中得分为49.3%，而Claude 3.7 Sonnet得分为62.3%。

OpenAI宣称o3和o4-mini是其首批能够“用图像思考”的模型。实际应用中，用户可向ChatGPT上传图片，如白板草图或PDF中的图表，模型会在“思维链”阶段分析图像后再作答。得益于这一新能力，o3和o4-mini能理解模糊和低质量图像，并能在推理过程中执行放大或旋转图像等操作。

除图像处理能力外，o3和o4-mini还能通过ChatGPT的Canvas功能直接在浏览器中运行并执行Python代码，并在查询时事时进行网络搜索。

除ChatGPT外，o3、o4-mini及o4-mini-high三款模型都将通过OpenAI面向开发者的终端——Chat Completions API和Responses API提供，工程师可按使用量付费，基于这些模型构建应用程序。

OpenAI对开发者收取的o3价格相对较低，考虑到其性能提升，每百万输入token（约75万字，比《指环王》系列还长）收费10美元，每百万输出token收费40美元。对于o4-mini，OpenAI的定价与o3-mini相同，每百万输入token收费1.10美元，每百万输出token收费4.40美元。

OpenAI表示，未来几周内计划发布o3-pro版本，这是o3的一个变体，会消耗更多计算资源来生成答案，专供ChatGPT Pro订阅用户使用。

OpenAI首席执行官Sam Altman指出，o3和o4-mini可能是ChatGPT中在GPT-5之前的最后独立AI推理模型。

公司曾表示，GPT-5将统一如GPT-4.1等传统模型与推理模型。

参考资料

https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini/

编译：ChatGPT

——-

（文：Z Potentials）

本站项目均整理自网络，防止被割韭菜！

本站初心：花着比韭菜更少的米，用着和韭菜一样的东西，仅学习其中的思路

良不良心自己体会，某些割韭菜的网站在这里我就不黑了，切记！

创奇社只做解密，项目里留下的联系方式最好仅作咨询！收费的一律删除~

创奇社官网：www.cqshe.com 如有解压密码看下载页说明

文章版权声明本站仅分享项目，不提供任何指导，不会操作请参考项目内教程自行研究，小白请勿下单！
客服不回复任何关于项目内的问题咨询。
虚拟商品购买须知：虚拟类商品，一经打赏赞助，不支持退款。请谅解，谢谢合作！
本站内容转载于网络，版权归原作者所有，仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任，如果侵犯了您的权益，请联系站长 QQ：2428-6070 进行删除。

THE END