省流版:
你是不是以为发了GPT4.5?
但很抱歉,今天只是发布了o1的API以及实时语音的新玩意。
还记得前段时间的OpenAI的DevDay吗?那上面曾经说过会更新OpenAI的API,现在期货交割了!这次OpenAI表现很好,才用了短短的一个多月就完成了交割,值得鼓励!(我是在吹不下去了。。。)
本次发布会发布了o1的API,现在已经可以在API平台里调用,目前仅向 Tier 5 级别开发者提供,但将在几周内推广给其他用户。
同时也发布了o1-2024-12-17,他是o1的最新版本(Post-Train),它旨在处理复杂的多步骤任务,并提高了准确性。最新版o1也已经更新到ChatGPT里面,现在Plus和Pro用户都已经可以使用!
o1 使用的“思考”token比预览版减少了 60%,从而加快了速度并降低了使用成本。在各种评估(函数调用、结构化输出、编码、推理)中,都比预览版和 GPT-4o 表现出显著的改进。
虽然大家都想要o1 Pro,但 o1 Pro 尚未提供API,正在开发中。(谁用得起啊,不得贵死。。。)
今天发布了两个新模型GPT-4o-realtime-preview-2024-12-17和GPT-4o-mini-realtime-preview-2024-12-17
新模型改进了的语音质量、提供了更可靠的输入(尤其是口述数字)和大幅降低的成本。
GPT-4o 音频 token 价格降低了 60%,Whisper Mini 音频 token 价格降低了 10 倍。
先来看看GPT-4o-realtime-preview-2024-12-17
他有128k token的上下文窗口,最大 4,096 个 输出token、知识截止时间为 2023 年 10 月
价格:
文本:2.50 美元 / 100 万个输入 token,10.00 美元 / 100 万个输出 token
音频:40.00 美元 / 100 万个输入 token,80.00 美元 / 100 万个输出 token
然后是GPT-4o-mini-realtime-preview-2024-12-17
他也有128k token的上下文窗口和最大 4,096 个 输出token,知识截止时间也为 2023 年 10 月
价格: 文本:0.15 美元 / 100 万个输入 token,0.60 美元 / 100 万个输出 token;音频:10.00 美元 / 100 万个输入 token,20.00 美元 / 100 万个输出 token
(AI玩具创业者们狂喜)
最后,展示了API的微调功能:在API平台里引入了偏好微调能力(PFT),你仅需12行代码,就可以基于你的数据微调一个API。
此方法使用直接偏好优化 (DPO) ,与SFT相比PFT对于语气、风格和创造力很重要的主观任务尤其有效。
非常适合改进诸如响应格式、风格、帮助性、创造力和内容审核(例如,与特定品牌基调保持一致)等方面。
偏好微调将于今日上线gpt-4o-2024-08-06,并将很快上线gpt-4o-mini-2024-07-18。
它将以与监督微调相同的价格提供,并将于明年初支持最新模型o1等。
今天发布的东西其实都是实用的,开发者需要的能力。但最后结束的这个冷笑话有点搞
“你们知道圣诞老人有一个坏孩子名单,上面都是用了o1的API的孩子。为什么结构化输出会在坏孩子名单上?因为圣诞老人听说它是“模式化的”。”
圣诞老人因为听说结构化输出是“模式化的”(a schema),就误以为它是“搞阴谋的”(a schemer),因此把它放到了坏孩子名单上。
Fine,是我理解不了的老外梗,我们明天见!
文章来自微信公众号 “ 01Founder “,作者 ” 一直在路上的Max “
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales