ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
OpenAI突发新模型,GPT-3.5退役,大模型成本2年骤降99%
4475点击    2024-07-19 10:40

OpenAI突发新模型,全面取代老去的GPT-3.5。


GPT-4o mini,能力接近原版GPT-4,价格却要便宜一个数量级


每百万输入tokens,15美分(约1.09元人民币)


每百万输出tokens,60美分(约4.36元人民币)



在ChatGPT应用中,GPT-3.5已经完全退役,免费用户已可使用GPT-4o mini模型。



对应的API也已经开放,支持128k输入tokens(图像和文本),更令人瞩目的是支持16k输出tokens


相比之下,隔壁Claude 3.5 Sonnet几天前刚刚升级8k输出tokens。


以其低成本和低延迟特性,官方推荐用于多种场景:


链式或并行化多个模型调用


将大量上下文输入给模型(如完整的代码库或对话历史记录)


或通过快速、实时的文本响应交互(如客服)


在未来几天内,将开放GPT-4o mini微调


CEO奥特曼表示,仅仅两年前,世界上最好的模型还是GPT-3的text-davinci-003版本。


与今天相比表现差得多,还要贵上100倍。



或者换另一个说法,大模型成本在两年内下降了99%


GPT-4级别小模型,便宜一个数量级


ChatGPT首发震撼世界,原版GPT-3.5模型功不可没。


但尽管经过一系列升级降价,系列最新型号GPT-3.5 Turbo也渐渐落后了。


竞争对手新出的小模型,以Anthropic的Claude 3 Haiku和谷歌Gemini Flash为代表,开始抢占市场。


GPT-4o mini就是专门来找回场子的。



在多项文本和多模态推理学术基准测试中,GPT-4o mini都超过了其他小模型。


特别是在数学(MGSM、MATH)和代码能力(HumanEval)上优势明显,与其他小模型拉开一个档次,只比GPT-4o完整版稍弱。


此外,它还在函数调用方面表现出强大的性能。



价格方面,也比Claude 3 Haiku和Gemini Flash要更便宜40%-60%。


作为模型开发的一部分,OpenAI与Ramp和Superhuman等公司合作,已将GPT-4o mini用于实际应用,在“从文件中提取结构化数据”和“对邮件通信记录生成高质量回复”等任务明显优GPT于 -3.5 Turbo。


此外几周之前,新模型还化名GPT-mini登上大模型竞技场供广大网友测试检验。


目前收集到6000+用户投票,与GPT-4 Turbo表现相当。



不过感兴趣的可以在大模型竞技场体验,目前版本为gpt-4o-mini-2024-07-18。


这一次OpenAI对模型做了更多的安全设置,第一个应用了OpenAI指令层次结构方法的模型,有助于提高模型抵抗越狱、Prompt注入和系统Prompt提取的能力。


简单测试中,确实不能简单的一句话套出系统提示词了。



不过用上一系列复杂的越狱手段之后,还是没防住。泄漏出来的系统提示词倒也没什么特殊的内容。



不过很可惜,新模型还是搞不懂9.11和9.9哪个大……



One More Thing


此外奥特曼还在回复网友提问中透露,GPT-4o实时语音模式也就是《Her》,将于本月晚些时候Alpha测试,更晚一些正式发布。



不过也有网友略有点失望:我们要想要的是GPT-5,你却给我GPT-4o mini。



同一天,DeepSeek与Mistral也都有了新进展。


一边开源了 DeepSeek-V2-0628,直接摘得大模型榜单上开源大模型头名。



另一边则是推出了12B的小模型,同英伟达合作开发,上下文长度为128K。



大家打起来啊打起来啊~~~


参考链接:[1]https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/[2]https://x.com/sama/status/1813984333352649087


本文来自微信公众号“量子位”,作者:关注前沿科技


关键词: GPT-3.5 , AI , OpenAI , GPT-4 , token , GPT-4o mini
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales