前言:GPT-4.5的发布被OpenAI视为[非思维链模型的最后一代],此后将转向需要长时间思考的推理模型。
这一转变与行业趋势紧密相连——自从DeepSeekR1开源引发推理热潮后,AI竞争的焦点已经从数据规模转向逻辑深度。
作者 | 方文三图片来源 | 网 络
OpenAI正式发布GPT-4.5
在2月27日,OpenAI通过一段时长为13分钟的视频,正式发布了其迄今为止最为庞大的最新模型——GPT-4.5。
在介绍该模型时,OpenAI的研究副总裁MiaGlaese指出,GPT-4.5模型的显著特点是其能够进行充满热情、直观且自然流畅的对话,并且在理解用户需求方面展现出更为强大的能力。
GPT-4.5与o1在回答同一问题时的表现有所不同。
值得注意的是,GPT-4.5并非一个推理模型,而是迄今为止OpenAI所构建的规模最大、知识储备最为丰富的模型。
据透露,GPT-4.5的训练过程消耗了相当于GPT-4o十倍的计算资源,其性能的提升充分展示了预训练规模扩展所带来的显著效果。
在多项基准测试中,GPT-4.5的表现超越了GPT-4o,特别是在数学能力上提高了27%,在编码能力上提升了7%至10%。GPT-4.5在某些特定指标上甚至超越了o3-mini。
GPT-4.5的核心进步体现在无监督学习能力的增强。
通过增强计算资源和数据规模,该模型在执行复杂任务时表现出更高的精确度,特别是在降低[幻觉]现象(即错误生成信息)方面取得了显著成效。
这使得GPT-4.5在处理事实性问题时更为可靠,适用范围也更为广泛。
在减少幻觉和提高准确率方面,早期测试显示GPT-4.5具有较高的情感智能(EQ),能够根据对话情境调整其回应,尤其在处理与用户情感相关的交流时,展现了较高的同理心。
尽管其更高的[情商]、审美直觉和创造力主要依赖于无监督学习,GPT-4.5在推理能力方面也显示出强劲的实力。
GPT-4.5的显著升级体现在其对人类情感的深刻理解。
OpenAI的研究副总裁MiaGlaese强调,GPT-4.5的回应更加温馨、自然,并且能够通过语言调整用户的情绪状态。
更通用和更自然智能的模型
OpenAI明确指出,GPT-4.5在作出反应之前并不进行思考,这使得其优势与推理模型如o1等截然不同。
因此,与o1、o3-mini相比,GPT-4.5被认为是一种更通用、更自然智能的模型。
OpenAI坚信推理将成为未来模型的核心能力,而预训练和推理这两种扩展方法将相互补充。
随着GPT-4.5等模型通过预训练变得更加智能和知识渊博,它们将成为推理和使用工具的代理的更强大的基础。
在GPQA(科学)、AIME’24(数学)、SWE-BenchVerfied(编码)等数据集上,GPT-4.5全面领先于GPT-4o,但在数学和真实编程能力方面,仍略逊于o3-mini。
OpenAI已经开发出一系列先进的可扩展技术,这些技术使得GPT-4.5能够利用较小模型的数据集来训练更为庞大和强大的模型。
这些技术的引入显著提升了GPT-4.5的操作性、对细节的敏感度以及自然对话能力。
定价高于市面主力大模型
目前,GPT-4.5仅对ChatGPTPro用户开放,其订阅费用高达每月200美元,API使用成本则为输入75美元/百万token、输出150美元/百万token,是GPT-4o的30倍。
OpenAI坦承,模型训练消耗了大量GPU资源,因此迫切需要扩充数万张显卡以满足需求。
以输入数据缓存未命中为例,GPT-4.5的API费用是GPT-4o的三十倍,较之DeepSeek-V3(美元定价)则为二百七十七倍,与DeepSeek-R1(美元定价)相比则为一百三十六倍。
进一步比较,即便是在DeepSeek的优惠时段,GPT-4.5的费用也达到了前者的五百五十五倍。
GPT-4.5的API定价出乎意料地高,不仅高于自家主力大模型,甚至比新推出的全球首个混合推理模型Claude-3.7-Sonnet高出二十五倍,更不用说与刚刚宣布错峰定价的[价格屠夫]DeepSeek相比了。
GPT-4.5的计算效率相较于GPT-4实现了超过十倍的提升。
在API层面,ChatCompletionsAPI、AssistantsAPI和BatchAPI将向所有付费开发者提供预览,支持函数调用等关键功能及图像输入视觉功能,适用于写作辅助等应用场景。
然而,由于模型庞大且计算密集,成本较高,官方正在评估是否长期在API中提供该服务。
将与kimi、DeepSeek展开竞争
目前,OpenAI的市值已超过1570亿美元(约合人民币1.1万亿元)。
最近,奥尔特曼公开透露,OpenAI正在考虑根据使用量来设定价格策略。
至于何时能够实现通用人工智能(AGI),他指出,当一个AI系统能够执行一个熟练人士在关键工作中所能完成的任务时,即可称之为AGI。
值得注意的是,在今天凌晨,月之暗面kimi再次发布最新版本的Kimi-K1.6-IOI-high模型,该模型在LiveCodeBench基准测试中排名第一,超越了GPT和Claude系列模型。
同时,DeepSeek的开源周活动持续吸引公众关注,包括发布了专为英伟达HopperGPU设计的MLA解码内核FlashMLA、EP通信库DeepEP、FP8GEMM(通用矩阵乘法)计算库DeepGEMM等。
据公开资料,2024年全年,OpenAI的销售收入约为37亿美元,同比增长超过1700%。
预计到2025年,OpenAI的年化收入将增长至116亿美元,其中75%的收入来源于用户对ChatGPTPlus服务的订阅。
内部预估,到2029年全年,OpenAI的营收将达到1000亿美元,相当于目前雀巢公司的年销售额。
GPT-4.5象征着一个时代的终结
OpenAI宣布,GPT-4.5将是其聊天机器人系统中最后一个不包含[思维链推理]功能的版本。
继GPT-4.5之后,OpenAI的模型将可能模仿人类的思考方式,花费更多时间深入思考问题后再给出回答,而不是立即作出反应。
GPT-4.5代表了OpenAI最后一个[非思维链]模型。
基于GPT-4.5,OpenAI计划优化其产品线,为GPT-5的重大创新做好准备,并奠定采用新方法的基础。
山姆·奥特曼指出,过多的模型会使用户感到困惑,而未来的GPT-5将成为一个重要里程碑,它将整合OpenAI的所有技术进步。
其中最大的创新在于它与之前独立的o系列模型的融合。
OpenAI表示,它将把o3模型中的大部分技术整合进GPT-5,这实际上意味着o3模型将不再作为一个独立的产品存在。
换言之,GPT-5将融合两个并行发展的[AI大脑]的优势。
业界推测,GPT-5可能会扮演[路由器模型]的角色,根据需要协调各种内部组件或子模型。
用户只需与GPT-5交互,而GPT-5将利用不同的工具和知识资源来寻找最佳解决方案,这可能包括访问搜索引擎、执行计算或使用代码解释工具,具体取决于任务需求。
结尾:在收购OpenAI未果后计划
GPT-4.5的发布不仅是技术上的进步,更是AI人性化的重要里程碑。
它用情商重新定义了人机交互,用知识的广度赋能实际应用场景,同时也因高昂的成本引发了争议。
随着推理模型的到来,AI有望真正融入人类生活,成为工作与情感的[双重助手]。
对于普通用户而言,如何在性能与成本之间找到平衡,将是接下来最实际的挑战。
部分资料参考:凤凰网科技:《史上最贵AI模型上线,主打情商高,奥特曼竟因"带娃"缺席发布会?》,网站知识:《OpenAI发布GPT-4.5:高情商AI引发全网热议》,机器之心:《OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商》,DeepTech深科技:《OpenAI发布号称[情商最高]的AI模型,奥特曼称GPU已用完》,雷科技:《价格是DeepSeek277倍!GPT-4.5还是太自信了》,钛媒体AGI:《6年来最强模型GPT-4.5登场:更贵、更高情商、更少幻觉》
原文标题 : AI芯天下丨热点丨GPT-4.5正式发布,号称OpenAI最好的聊天模型