去年,OpenAI在旧金山举办了一场引发业界轰动的开发者大会(DevDay 2023),推出了一系列新产品和工具,包括支持128K上下文的GPT-4 Turbo,API价格下调,新的Assistants API,具备视觉功能的GPT-4 Turbo,DALL·E 3 API,以及大幅改进的JSON模型,还有命运多舛的GPTs和类App Store平台GPT Store。
CEO Sam Altman信心满满的说:“我们希望你明年还能来,相较于我们正在精心打造的新成果,今天发布的东西会显得非常过时”,再次拉高外界预期。
在刚刚经历新一轮高管团队离职风波之后,OpenAI年度盛事DevDay 2024即将到来,所有人心中都有一个疑问:接下来会发生什么?
然而,今年OpenAI的DevDay却悄然改变了调性。先是宣布了大会的举办形式进行了调整,从大型活动转变为一系列路演式的开发者互动环节。
更令人意外的是,根据官方的剧透,OpenAI在DevDay期间不会发布其下一代主要旗舰模型,而是将重点放在API和开发者服务的更新上。
简而言之:下一代模型还在炉子里烤着呢,所以干脆只字不提。
DevDay不再是模型大会,这次真的是“开发者”大会了。
没有GPT-5的Devday,开发者们还有哪些期待?
尽管OpenAI宣布今年的DevDay不会发布新一代旗舰模型,但业界对此次开发者大会仍抱有诸多期待。根据猜测,OpenAI可能会重点推出长期推理和函数调用等新API能力,同时增强模型的代理能力,为开发者提供更多自主权和与其他API集成的可能性。
4o语音模式的API也备受期待
硅星人也与几位开发者进行了交流,了解他们对API的真实需求,多模态和性能成为关注的焦点。
Talkme是一款面向海外市场的语言学习ToC产品,CEO贾子健告诉硅星人,对于出海的AI开发者,通常都会选择OpenAI的API,少量会用Gemini和Claude。Talkeme使用的主力API是OpenAI,加上Gemini辅助。
“GPT-3.5 Turbo基本已经淘汰,大家都会转成4o-mini或者4o去完善业务逻辑。更复杂的tob类SaaS产品,可能会考虑GPT-4,能力更强,相对也更贵。”
o1目前也在Talkme的考虑范围内,但由于成本较高,目前仅限于实验性功能的预研,无法投入到ToC应用正式生产当中。
“o1的能力的确很强,但从工程的角度来说,一部分用o1、一部分用4o、一部分用4omini,基本上就可以覆盖开发场景。”
对于OpenAI API的期待,贾子健表示主要有三点:
第一是低延时。
第二是低延时下的多模态能力,“我们的多模态能力目前一部分在用4o,一部分在用Gemini”。
第三点是更稳定的JSON输出。“OpenAI的公众化还没有那么严谨,更多可能是科学家算法主导,导致OpenAI输出的JSON不是很稳定,很多场景反而不如自己写正则,去解析输出的文本内容。在这个维度上,谷歌比OpenAI做的好,如果能有稳定的JSON输出,对于开发者是比较受益的。”
价格方面,“除了o1,其他价格都比较便宜”。
Cocos引擎运营总监、老菜喵主理人晨阳从国内AI产品的角度进行了分析。他告诉硅星人,从目前能力和响应速度来看,OpenAI仍然是最强,另一方面,国内的开发者考虑的更多是合规性和使用的ROI,而国内的Qwen,豆包,MiniMax,文心等模型也都在追赶,部分产品优惠后的性价比不弱于OpenAI。
他表示,“未来需求一定是多模态的,传统的HTTP Post请求会被逐渐淘汰,国内的豆包已经率先用上了WebRTC,网传OpenAI WebRTC即将开放。所以未来市场除了模型的质量,要考虑综合的效果,ASR,TTS,WebRTC等结合,从这个角度考虑,国内的产品在整合上优势更大,价格战有机会取得优势。”
语核科技面向企业场景应用,技术合伙人池光耀希望OpenAI API的更新能够提供两方面的改进:内置一些工程化能力来减少或检测幻觉;对于o1,提供更灵活的使用选项,允许用户指定是否在本次请求中使用复杂推理功能。
AGI可以等,缺钱不能等
DevDay的焦点转变与OpenAI近期在生成式AI发展中采取更多渐进步骤的战略相契合。
公司目前正在优化其旗舰模型GPT-4o和GPT-4o mini,在生成式AI的竞赛中面临保持技术领先的挑战。根据某些基准测试,OpenAI似乎已经失去了绝对的技术领先地位。
其中一个原因是获取高质量训练数据的困难,据Originality.AI的数据,全球排名前1000的网站中,已有超过35%封禁了OpenAI的网络爬虫。
麻省理工学院数据溯源计划的一项研究发现,约25%来自“高质量”来源的数据,已经被限制使用在训练AI模型中。
为了应对这些数据获取的挑战,OpenAI已经与出版商和数据经纪商签订了一系列高额授权协议。
压力的另一方面来自运营公司的成本,据路透社报道,OpenAI预计今年营收将达到37亿美元,同时将亏损50亿美元,主要用于支付运营服务成本、员工薪资和办公室租金等,这还不包含员工股权激励等其他大额支出。
为了解决资金问题,OpenAI正在推进新一轮的融资,9月初,融资消息传出,OpenAI可能以1500亿美元的估值获得65亿美元的投资。据消息人士透露,这一估值取决于OpenAI能否将其公司结构转变为与其竞争对手Anthropic和xAI类似的盈利模式。
不过最新的消息是,最新一轮65亿美元的融资,苹果已经决定不参与。此外,上周首席技术官、首席研究官和研究副总裁先后离职,也为OpenAI增添了不确定性。
尽管OpenAI首席财务官Sarah Friar于9月27日向投资者透露,本轮融资已超额认购并计划在月底前结束,但融资谈判仍未最终敲定,参与者和具体金额仍可能有所变动。
专注于API,或许与OpenAI在财务上面临的压力相关。
根据FutureSearch公布的研究报告和相关数据,OpenAI年收入为34亿美元,其中76%的营收来自ChatGPT付费用户(ChatGPT Plus、ChatGPT Enterprise和ChatGPT Team订阅),API接口服务贡献了公司15%的收入,约5.1亿美元。
API驱动的服务模式曾经帮助AWS这样的平台迅速成长,随着越来越多的企业利用亚马逊的API开发新产品或服务,从而产生网络效应,其生态系统的价值不断增长。
虽然OpenAI目前API带来的直接收入占比不高,但是在ChatGPT增速放缓、OpenAI更多地采取了渐进式的步骤来发展生成式AI的背景下,通过提供更好的API或许可以为公司开辟新的市场机会,并促进与其他企业的合作。
没有GPT-5,高管出走,向营利公司转型,这一系列的事件都预示着商业化已经成为Sam Altman迫切需要解决的问题,OpenAI将更多考虑利润,而不是实现AGI。
很长一段时间以来,Sam Altman用高超的技巧,一边操纵公众情绪,一边经营自己的事业,堪称科技界CEO中的翘楚。
但如果你在旧金山的OpenAI DevDay上听到他谈论关于OpenAI计划转向“盈利模式”的讨论,请不要感到意外。
文章来源于“硅星人Pro”,作者“周一笑”
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales