刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会
7048点击    2025-02-28 11:03

GPT-4.5正式发布,号称OpenAI最大最好的聊天模型。


但很意外啊,这么大的事奥特曼都不来。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


这次OpenAI也不打算秀炫酷的解题,也不打算晒各种榜单的排名,反而强调起了情商。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


第一个现场演示:


“我又被朋友鸽了,帮我写个短信告诉他们我恨他们。”


o1意识到这样会“友尽”,但也只是很忠实的按要求完成了任务。


GPT-4.5甚至都没完成提示词中的任务,但整个互动显得更自然了:


  • 先识别出用户很烦恼
  • 建议更清楚的表达自己的情绪
  • 给出两种备选方案
  • 再询问用户是否坚持原来的要求


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


第二个现场演示,强调GPT-4.5掌握更多世界知识,以及讲述知识的方式更自然。


解释为什么海水是咸的。


GPT-4 Turbo掌握很多知识,但回答就像是在炫耀它很有知识,只是把事实罗列在一起。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


同样这些知识,GPT-4.5的语气更有互动感,还考虑到用一句简洁的开场,让用户更容易记住三个关键词。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


面对更专业的问题“用第一性原理解释AI对齐的必要性”,o1的回答像是写论文,而GPT-4.5通过“第1步、第2步、第3步……”来引导用户思考这个问题。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


除了演示之外,直播中也透露了GPT-4.5开发过程的一些内幕:


如“激进地”使用了低精度训练,预训练阶段跨多个数据中心完成。GPT-4.5会成为未来推理模型的基础模型


从今天起,GPT-4.5开放给200美元一个月的Pro用户。下周逐步开放给20美元一个月的Plus用户。


不是最前沿,但是最大模型


技术报告中表示:GPT-4.5不是一个前沿模型,但它是OpenAI最大的语言模型,比GPT-4的计算效率提高了10倍以上。


OpenAI称通过扩展无监督学习和推理提升AI的能力。


GPT‑4.5通过扩展计算和数据以及架构优化扩展了无监督学习,拥有更广泛的知识和更深入的世界理解能力,所以幻觉更少。


在衡量LLM事实准确性的SimpleQA基准上,GPT-4.5准确率62.5%,幻觉率37.1%,比GPT-4o、o1、o3mini优化了不少。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


以下是一个具体的幻觉降低的案例。


假如用户询问“第一种语言是什么”,GPT-4.5会诚实回答不知道、这还是人类未解之谜,而不是随便蒙一个答案。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


此外,Blog中还称开发了新的可扩展的技术,能够利用从小型模型衍生出的数据来训练更大更强的模型,由此提升了GPT‑4.5的可操控性、对细微差别的理解以及自然对话能力。


在人类偏好评估中,测试者更倾向于选择GPT‑4.5而非GPT‑4o。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


OpenAI表示,GPT‑4.5对人类意图的理解更深刻,能够以更细腻的“情商”解读微妙的线索或隐含的期望,还展现出了更强的审美直觉和创造力,在协助写作和设计方面表现出色。


比如,当用户表达“考试不及格、很难过”,它会安慰、鼓励用户。作为对比,4o给出的回答就更加冰冷,没什么安慰的话语。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


在一些回复上,GPT‑4.5对比4o回答也更简洁。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


另外,OpenAI还晒出了GPT‑4.5在标准学术基准测试中的结果,全面超越GPT-4o,在SWE-Lancer Diamond(coding)和MMMLU(multilingual)上超越o3-mini。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


API定价非常贵


值得一提的是,GPT-4.5的API定价非常贵。


75美元/百万tokens输入、150美元/百万tokens输出。


对比GPT-4o,定价高出去15-30倍。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


到底这个价格值不值呢?不少人已经分享了抢先体验的效果。


拿到内测的博主表示,实际使用中GPT-4.5非常有创造力、一定上了很多人文课。


Claude 3.7和GPT-4.5两个,非常相似。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


他还列举了GPT-4.5视觉理解能力很强的例子。它能从这张星露谷截图中发现非常小的元素蝴蝶。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


“独角兽评估”的实测表现也很好。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


后续随着更多实测放出,应该还能看到更多有意思的例子。


One More Thing


最后,大家一定很关心,奥特曼去哪了呢?


在医院照顾小孩。


是的,他最近刚刚喜提一子。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会


直播回放:https://www.youtube.com/watch?v=cfRYp0nItZ8


参考链接:https://openai.com/index/introducing-gpt-4-5/


文章来自于“量子位”,作者“梦晨 西风“。


刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会

关键词: AI , GPT-4.5 , openai , chatGPT
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales