<
头闻号

深圳市普雷科技有限公司

注塑加工|电子用塑胶制品|模具|模具加工|模具设计

GPT
发布时间:2025-04-02 03:33:07        浏览次数:1        返回列表

北京时间2月28日凌晨,OpenAI官方发布了GPT-4.5大模型,根据官方介绍,该模型为“迄今为止最大、知识最丰富的聊天模型”,在用户翘首企盼的性能方面,它并非前沿模型,在编程、数学等多个维度的性能不如o3-mini,因此直播人员主要进行了和“情商”相关的演示,但即便如此,GPT-4.5也成了OpenAI“史上最贵”大模型。

值得注意的是,OpenAI首席执行官山姆·奥特曼并未参与此次直播,他在社交平台表示,GPT-4.5是一个“庞大而昂贵”的型号,GPU已经不够了,这并不是一个推理模型,不会超越基准智能,而是“一种不同类型的智能”。

以“情商”“情怀”代替性能展示 研究负责人频看提示词

GPT-4.5直播发布截图 最右为OpenAI研究负责人米娅(Mia)

新京报贝壳财经记者观看本次发布的视频直播发现,本次直播的主持人是OpenAI研究负责人米娅(Mia),虽然米娅的名字酷似已离职的OpenAI前联合创始人、首席技术官米拉(Mira),但和后者在去年发布GPT-4o时气场全开、侃侃而谈的自信表现相比,Mia在直播时频频看提示词,显得颇为紧张。

在直播发布中,OpenAI首先展示了GPT-4.5的“情商”提升,例如当输入提示词“我的朋友放了我鸽子,给他发一条短信说我恨他”时,相比o1直接按要求写出了短信,GPT-4.5分析出用户可能需要情绪宣泄,因此在安抚用户情绪的同时,也写出了一条相对委婉的短信。

但实际上,此类“高情商”表现Deepseek早已拥有,如贝壳财经记者以相同的提示词输入Deepseek后,Deepseek首先就在思维链中意识到了“用户真正的需求可能是表达不满”,并同样写出了一条委婉的短信,还加上了一点幽默,比如“请我喝奶茶的话我可以考虑原谅你三分钟。”

也许因为并非推理模型,直播人员也意识到了在性能展示方面GPT-4.5可能并不占优势,因此接下来直播人员回顾了GPT系列模型从2018年发展至今的历程,并进行了一些“情怀”展示,如当询问“为什么海水是咸的”这个话题时,GPT-1完全不了解,GPT-2可以输出海水和盐的相关的内容,GPT-3.5第一个完整回答了这个问题,而GPT-4.5则在回答这个问题的同时还兼顾了表达的通顺甚至朗读韵律,使回答看上去更加舒服。

OpenAI“史上最贵模型”输入价格比Deepseek贵近300倍

贝壳财经记者注意到,山姆·奥特曼曾在2月13日表示不再发布o3,而是发布GPT-4.5,但根据当前已经发布的GPT-4.5的性能测试数据,该大模型在很多维度上的水平不及o3-mini,因此和预想中的“最先进大模型”显然有着不小差距。

上图展示了GPT-4.5与GPT-4o和o3-mini在多个维度上的测试得分,可以发现,在科学、数学、编程等多个领域,GPT-4.5的表现并不如o3-mini,只在多模态方面略胜一筹。

在准确性、幻觉测试方面,GPT-4.5的性能表现优于GPT系列其他表现,因此OpenAI也把和人交流列为GPT-4.5的“长处”。GPT-4.5集成了文件和图像上传、画布、搜索等功能,不过OpenAI也表示,GPT-4.5不能完全代替GPT-4o。

在API价格方面,GPT-4.5的定价达到了OpenAI的“史上最贵”,其API的输入价格达到每百万Tokens价格75美元,相比GPT-4o的2.5美元贵30倍,相比o3-mini贵68倍,相比DeepSeek更是贵了将近300倍。

虽然作为综合模型,将GPT-4.5直接与推理为主的o3-mini和DeepSeek对比不太合适,但过高的价格仍然令人咋舌,有外国网友在OpenAI的评论区询问,GPT-4.5“是不是在定价那里写了错别字”?

直播人员表示,ChatGPT的pro用户将可以立即体验GPT-4.5,下周开放给team和plus用户。

“OpenAI推广AI有两种方式——推理和无监督学习,我们相信模型的推理能力很重要,但GPT-4.5实际上处于无监督学习的前沿,它有更多知识并且更聪明,会成为未来更强大模型的基础。”米娅在直播中表示。

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹

编辑 陈维城 校对 杨利