GPT-4.5正式发布，号称OpenAI最好的聊天模型

前言：GPT-4.5的发布被OpenAI视为[非思维链模型的最后一代]，此后将转向需要长时间思考的推理模型。

这一转变与行业趋势紧密相连——自从DeepSeekR1开源引发推理热潮后，AI竞争的焦点已经从数据规模转向逻辑深度。

作者 | 方文三图片来源 | 网络

OpenAI正式发布GPT-4.5

在2月27日，OpenAI通过一段时长为13分钟的视频，正式发布了其迄今为止最为庞大的最新模型——GPT-4.5。

在介绍该模型时，OpenAI的研究副总裁MiaGlaese指出，GPT-4.5模型的显著特点是其能够进行充满热情、直观且自然流畅的对话，并且在理解用户需求方面展现出更为强大的能力。

GPT-4.5与o1在回答同一问题时的表现有所不同。

值得注意的是，GPT-4.5并非一个推理模型，而是迄今为止OpenAI所构建的规模最大、知识储备最为丰富的模型。

据透露，GPT-4.5的训练过程消耗了相当于GPT-4o十倍的计算资源，其性能的提升充分展示了预训练规模扩展所带来的显著效果。

在多项基准测试中，GPT-4.5的表现超越了GPT-4o，特别是在数学能力上提高了27%，在编码能力上提升了7%至10%。GPT-4.5在某些特定指标上甚至超越了o3-mini。

GPT-4.5的核心进步体现在无监督学习能力的增强。

通过增强计算资源和数据规模，该模型在执行复杂任务时表现出更高的精确度，特别是在降低[幻觉]现象（即错误生成信息）方面取得了显著成效。

这使得GPT-4.5在处理事实性问题时更为可靠，适用范围也更为广泛。

在减少幻觉和提高准确率方面，早期测试显示GPT-4.5具有较高的情感智能（EQ），能够根据对话情境调整其回应，尤其在处理与用户情感相关的交流时，展现了较高的同理心。

尽管其更高的[情商]、审美直觉和创造力主要依赖于无监督学习，GPT-4.5在推理能力方面也显示出强劲的实力。

GPT-4.5的显著升级体现在其对人类情感的深刻理解。

OpenAI的研究副总裁MiaGlaese强调，GPT-4.5的回应更加温馨、自然，并且能够通过语言调整用户的情绪状态。

更通用和更自然智能的模型

OpenAI明确指出，GPT-4.5在作出反应之前并不进行思考，这使得其优势与推理模型如o1等截然不同。

因此，与o1、o3-mini相比，GPT-4.5被认为是一种更通用、更自然智能的模型。

OpenAI坚信推理将成为未来模型的核心能力，而预训练和推理这两种扩展方法将相互补充。

随着GPT-4.5等模型通过预训练变得更加智能和知识渊博，它们将成为推理和使用工具的代理的更强大的基础。

在GPQA（科学）、AIME’24（数学）、SWE-BenchVerfied（编码）等数据集上，GPT-4.5全面领先于GPT-4o，但在数学和真实编程能力方面，仍略逊于o3-mini。

OpenAI已经开发出一系列先进的可扩展技术，这些技术使得GPT-4.5能够利用较小模型的数据集来训练更为庞大和强大的模型。

这些技术的引入显著提升了GPT-4.5的操作性、对细节的敏感度以及自然对话能力。

定价高于市面主力大模型

目前，GPT-4.5仅对ChatGPTPro用户开放，其订阅费用高达每月200美元，API使用成本则为输入75美元/百万token、输出150美元/百万token，是GPT-4o的30倍。

OpenAI坦承，模型训练消耗了大量GPU资源，因此迫切需要扩充数万张显卡以满足需求。

以输入数据缓存未命中为例，GPT-4.5的API费用是GPT-4o的三十倍，较之DeepSeek-V3（美元定价）则为二百七十七倍，与DeepSeek-R1（美元定价）相比则为一百三十六倍。

进一步比较，即便是在DeepSeek的优惠时段，GPT-4.5的费用也达到了前者的五百五十五倍。

GPT-4.5的API定价出乎意料地高，不仅高于自家主力大模型，甚至比新推出的全球首个混合推理模型Claude-3.7-Sonnet高出二十五倍，更不用说与刚刚宣布错峰定价的[价格屠夫]DeepSeek相比了。

GPT-4.5的计算效率相较于GPT-4实现了超过十倍的提升。

在API层面，ChatCompletionsAPI、AssistantsAPI和BatchAPI将向所有付费开发者提供预览，支持函数调用等关键功能及图像输入视觉功能，适用于写作辅助等应用场景。

然而，由于模型庞大且计算密集，成本较高，官方正在评估是否长期在API中提供该服务。

将与kimi、DeepSeek展开竞争

目前，OpenAI的市值已超过1570亿美元（约合人民币1.1万亿元）。

最近，奥尔特曼公开透露，OpenAI正在考虑根据使用量来设定价格策略。

至于何时能够实现通用人工智能（AGI），他指出，当一个AI系统能够执行一个熟练人士在关键工作中所能完成的任务时，即可称之为AGI。

值得注意的是，在今天凌晨，月之暗面kimi再次发布最新版本的Kimi-K1.6-IOI-high模型，该模型在LiveCodeBench基准测试中排名第一，超越了GPT和Claude系列模型。

同时，DeepSeek的开源周活动持续吸引公众关注，包括发布了专为英伟达HopperGPU设计的MLA解码内核FlashMLA、EP通信库DeepEP、FP8GEMM（通用矩阵乘法）计算库DeepGEMM等。

据公开资料，2024年全年，OpenAI的销售收入约为37亿美元，同比增长超过1700%。

预计到2025年，OpenAI的年化收入将增长至116亿美元，其中75%的收入来源于用户对ChatGPTPlus服务的订阅。

内部预估，到2029年全年，OpenAI的营收将达到1000亿美元，相当于目前雀巢公司的年销售额。

GPT-4.5象征着一个时代的终结

OpenAI宣布，GPT-4.5将是其聊天机器人系统中最后一个不包含[思维链推理]功能的版本。

继GPT-4.5之后，OpenAI的模型将可能模仿人类的思考方式，花费更多时间深入思考问题后再给出回答，而不是立即作出反应。

GPT-4.5代表了OpenAI最后一个[非思维链]模型。

基于GPT-4.5，OpenAI计划优化其产品线，为GPT-5的重大创新做好准备，并奠定采用新方法的基础。

山姆·奥特曼指出，过多的模型会使用户感到困惑，而未来的GPT-5将成为一个重要里程碑，它将整合OpenAI的所有技术进步。

其中最大的创新在于它与之前独立的o系列模型的融合。

OpenAI表示，它将把o3模型中的大部分技术整合进GPT-5，这实际上意味着o3模型将不再作为一个独立的产品存在。

换言之，GPT-5将融合两个并行发展的[AI大脑]的优势。

业界推测，GPT-5可能会扮演[路由器模型]的角色，根据需要协调各种内部组件或子模型。

用户只需与GPT-5交互，而GPT-5将利用不同的工具和知识资源来寻找最佳解决方案，这可能包括访问搜索引擎、执行计算或使用代码解释工具，具体取决于任务需求。

结尾：在收购OpenAI未果后计划

GPT-4.5的发布不仅是技术上的进步，更是AI人性化的重要里程碑。

它用情商重新定义了人机交互，用知识的广度赋能实际应用场景，同时也因高昂的成本引发了争议。

随着推理模型的到来，AI有望真正融入人类生活，成为工作与情感的[双重助手]。

对于普通用户而言，如何在性能与成本之间找到平衡，将是接下来最实际的挑战。

部分资料参考：凤凰网科技：《史上最贵AI模型上线，主打情商高，奥特曼竟因"带娃"缺席发布会？》，网站知识：《OpenAI发布GPT-4.5：高情商AI引发全网热议》，机器之心：《OpenAI迄今最大、最贵模型，API价格飞涨30倍，不拼推理拼情商》，DeepTech深科技：《OpenAI发布号称[情商最高]的AI模型，奥特曼称GPU已用完》，雷科技：《价格是DeepSeek277倍！GPT-4.5还是太自信了》，钛媒体AGI：《6年来最强模型GPT-4.5登场：更贵、更高情商、更少幻觉》

原文标题 : AI芯天下丨热点丨GPT-4.5正式发布，号称OpenAI最好的聊天模型

GPT-4.5正式发布，号称OpenAI最好的聊天模型

相关推荐