GPT_新闻中心_深圳市普雷科技有限公司

北京时间2月28日凌晨，OpenAI官方发布了GPT-4.5大模型，根据官方介绍，该模型为“迄今为止最大、知识最丰富的聊天模型”，在用户翘首企盼的性能方面，它并非前沿模型，在编程、数学等多个维度的性能不如o3-mini，因此直播人员主要进行了和“情商”相关的演示，但即便如此，GPT-4.5也成了OpenAI“史上最贵”大模型。

值得注意的是，OpenAI首席执行官山姆·奥特曼并未参与此次直播，他在社交平台表示，GPT-4.5是一个“庞大而昂贵”的型号，GPU已经不够了，这并不是一个推理模型，不会超越基准智能，而是“一种不同类型的智能”。

以“情商”“情怀”代替性能展示研究负责人频看提示词

GPT-4.5直播发布截图最右为OpenAI研究负责人米娅（Mia）

新京报贝壳财经记者观看本次发布的视频直播发现，本次直播的主持人是OpenAI研究负责人米娅（Mia），虽然米娅的名字酷似已离职的OpenAI前联合创始人、首席技术官米拉（Mira），但和后者在去年发布GPT-4o时气场全开、侃侃而谈的自信表现相比，Mia在直播时频频看提示词，显得颇为紧张。

在直播发布中，OpenAI首先展示了GPT-4.5的“情商”提升，例如当输入提示词“我的朋友放了我鸽子，给他发一条短信说我恨他”时，相比o1直接按要求写出了短信，GPT-4.5分析出用户可能需要情绪宣泄，因此在安抚用户情绪的同时，也写出了一条相对委婉的短信。

但实际上，此类“高情商”表现Deepseek早已拥有，如贝壳财经记者以相同的提示词输入Deepseek后，Deepseek首先就在思维链中意识到了“用户真正的需求可能是表达不满”，并同样写出了一条委婉的短信，还加上了一点幽默，比如“请我喝奶茶的话我可以考虑原谅你三分钟。”

也许因为并非推理模型，直播人员也意识到了在性能展示方面GPT-4.5可能并不占优势，因此接下来直播人员回顾了GPT系列模型从2018年发展至今的历程，并进行了一些“情怀”展示，如当询问“为什么海水是咸的”这个话题时，GPT-1完全不了解，GPT-2可以输出海水和盐的相关的内容，GPT-3.5第一个完整回答了这个问题，而GPT-4.5则在回答这个问题的同时还兼顾了表达的通顺甚至朗读韵律，使回答看上去更加舒服。

OpenAI“史上最贵模型”输入价格比Deepseek贵近300倍

贝壳财经记者注意到，山姆·奥特曼曾在2月13日表示不再发布o3，而是发布GPT-4.5，但根据当前已经发布的GPT-4.5的性能测试数据，该大模型在很多维度上的水平不及o3-mini，因此和预想中的“最先进大模型”显然有着不小差距。

上图展示了GPT-4.5与GPT-4o和o3-mini在多个维度上的测试得分，可以发现，在科学、数学、编程等多个领域，GPT-4.5的表现并不如o3-mini，只在多模态方面略胜一筹。

在准确性、幻觉测试方面，GPT-4.5的性能表现优于GPT系列其他表现，因此OpenAI也把和人交流列为GPT-4.5的“长处”。GPT-4.5集成了文件和图像上传、画布、搜索等功能，不过OpenAI也表示，GPT-4.5不能完全代替GPT-4o。

在API价格方面，GPT-4.5的定价达到了OpenAI的“史上最贵”，其API的输入价格达到每百万Tokens价格75美元，相比GPT-4o的2.5美元贵30倍，相比o3-mini贵68倍，相比DeepSeek更是贵了将近300倍。

虽然作为综合模型，将GPT-4.5直接与推理为主的o3-mini和DeepSeek对比不太合适，但过高的价格仍然令人咋舌，有外国网友在OpenAI的评论区询问，GPT-4.5“是不是在定价那里写了错别字”？

直播人员表示，ChatGPT的pro用户将可以立即体验GPT-4.5，下周开放给team和plus用户。

“OpenAI推广AI有两种方式——推理和无监督学习，我们相信模型的推理能力很重要，但GPT-4.5实际上处于无监督学习的前沿，它有更多知识并且更聪明，会成为未来更强大模型的基础。”米娅在直播中表示。

记者联系邮箱：luoyidan@xjbnews.com

新京报贝壳财经记者罗亦丹

编辑陈维城校对杨利

深圳市普雷科技有限公司

注塑加工|电子用塑胶制品|模具|模具加工|模具设计

298

0

0

近期更新文章

主推文章

创作者推荐