ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
“不发模型、不上新功能”的OpenAI DevDay,开发者们还能期待啥
4741点击    2024-10-01 14:04

去年,OpenAI在旧金山举办了一场引发业界轰动的开发者大会(DevDay 2023),推出了一系列新产品和工具,包括支持128K上下文的GPT-4 Turbo,API价格下调,新的Assistants API,具备视觉功能的GPT-4 Turbo,DALL·E 3 API,以及大幅改进的JSON模型,还有命运多舛的GPTs和类App Store平台GPT Store。


CEO Sam Altman信心满满的说:“我们希望你明年还能来,相较于我们正在精心打造的新成果,今天发布的东西会显得非常过时”,再次拉高外界预期。


在刚刚经历新一轮高管团队离职风波之后,OpenAI年度盛事DevDay 2024即将到来,所有人心中都有一个疑问:接下来会发生什么?


然而,今年OpenAI的DevDay却悄然改变了调性。先是宣布了大会的举办形式进行了调整,从大型活动转变为一系列路演式的开发者互动环节。


更令人意外的是,根据官方的剧透,OpenAI在DevDay期间不会发布其下一代主要旗舰模型,而是将重点放在API和开发者服务的更新上。



简而言之:下一代模型还在炉子里烤着呢,所以干脆只字不提。


DevDay不再是模型大会,这次真的是“开发者”大会了。


没有GPT-5的Devday,开发者们还有哪些期待?


尽管OpenAI宣布今年的DevDay不会发布新一代旗舰模型,但业界对此次开发者大会仍抱有诸多期待。根据猜测,OpenAI可能会重点推出长期推理和函数调用等新API能力,同时增强模型的代理能力,为开发者提供更多自主权和与其他API集成的可能性。



4o语音模式的API也备受期待


硅星人也与几位开发者进行了交流,了解他们对API的真实需求,多模态和性能成为关注的焦点。


Talkme是一款面向海外市场的语言学习ToC产品,CEO贾子健告诉硅星人,对于出海的AI开发者,通常都会选择OpenAI的API,少量会用Gemini和Claude。Talkeme使用的主力API是OpenAI,加上Gemini辅助。


“GPT-3.5 Turbo基本已经淘汰,大家都会转成4o-mini或者4o去完善业务逻辑。更复杂的tob类SaaS产品,可能会考虑GPT-4,能力更强,相对也更贵。”


o1目前也在Talkme的考虑范围内,但由于成本较高,目前仅限于实验性功能的预研,无法投入到ToC应用正式生产当中。


“o1的能力的确很强,但从工程的角度来说,一部分用o1、一部分用4o、一部分用4omini,基本上就可以覆盖开发场景。”


对于OpenAI API的期待,贾子健表示主要有三点:


第一是低延时。


第二是低延时下的多模态能力,“我们的多模态能力目前一部分在用4o,一部分在用Gemini”。


第三点是更稳定的JSON输出。“OpenAI的公众化还没有那么严谨,更多可能是科学家算法主导,导致OpenAI输出的JSON不是很稳定,很多场景反而不如自己写正则,去解析输出的文本内容。在这个维度上,谷歌比OpenAI做的好,如果能有稳定的JSON输出,对于开发者是比较受益的。”


价格方面,“除了o1,其他价格都比较便宜”。


Cocos引擎运营总监、老菜喵主理人晨阳从国内AI产品的角度进行了分析。他告诉硅星人,从目前能力和响应速度来看,OpenAI仍然是最强,另一方面,国内的开发者考虑的更多是合规性和使用的ROI,而国内的Qwen,豆包,MiniMax,文心等模型也都在追赶,部分产品优惠后的性价比不弱于OpenAI。


他表示,“未来需求一定是多模态的,传统的HTTP Post请求会被逐渐淘汰,国内的豆包已经率先用上了WebRTC,网传OpenAI WebRTC即将开放。所以未来市场除了模型的质量,要考虑综合的效果,ASR,TTS,WebRTC等结合,从这个角度考虑,国内的产品在整合上优势更大,价格战有机会取得优势。”


语核科技面向企业场景应用,技术合伙人池光耀希望OpenAI API的更新能够提供两方面的改进:内置一些工程化能力来减少或检测幻觉;对于o1,提供更灵活的使用选项,允许用户指定是否在本次请求中使用复杂推理功能。


AGI可以等,缺钱不能等


DevDay的焦点转变与OpenAI近期在生成式AI发展中采取更多渐进步骤的战略相契合。


公司目前正在优化其旗舰模型GPT-4o和GPT-4o mini,在生成式AI的竞赛中面临保持技术领先的挑战。根据某些基准测试,OpenAI似乎已经失去了绝对的技术领先地位。


其中一个原因是获取高质量训练数据的困难,据Originality.AI的数据,全球排名前1000的网站中,已有超过35%封禁了OpenAI的网络爬虫。


麻省理工学院数据溯源计划的一项研究发现,约25%来自“高质量”来源的数据,已经被限制使用在训练AI模型中。


为了应对这些数据获取的挑战,OpenAI已经与出版商和数据经纪商签订了一系列高额授权协议。


压力的另一方面来自运营公司的成本,据路透社报道,OpenAI预计今年营收将达到37亿美元,同时将亏损50亿美元,主要用于支付运营服务成本、员工薪资和办公室租金等,这还不包含员工股权激励等其他大额支出。


为了解决资金问题,OpenAI正在推进新一轮的融资,9月初,融资消息传出,OpenAI可能以1500亿美元的估值获得65亿美元的投资。据消息人士透露,这一估值取决于OpenAI能否将其公司结构转变为与其竞争对手Anthropic和xAI类似的盈利模式。


不过最新的消息是,最新一轮65亿美元的融资,苹果已经决定不参与。此外,上周首席技术官、首席研究官和研究副总裁先后离职,也为OpenAI增添了不确定性。


尽管OpenAI首席财务官Sarah Friar于9月27日向投资者透露,本轮融资已超额认购并计划在月底前结束,但融资谈判仍未最终敲定,参与者和具体金额仍可能有所变动。


专注于API,或许与OpenAI在财务上面临的压力相关。


根据FutureSearch公布的研究报告和相关数据,OpenAI年收入为34亿美元,其中76%的营收来自ChatGPT付费用户(ChatGPT Plus、ChatGPT Enterprise和ChatGPT Team订阅),API接口服务贡献了公司15%的收入,约5.1亿美元。



API驱动的服务模式曾经帮助AWS这样的平台迅速成长,随着越来越多的企业利用亚马逊的API开发新产品或服务,从而产生网络效应,其生态系统的价值不断增长。


虽然OpenAI目前API带来的直接收入占比不高,但是在ChatGPT增速放缓、OpenAI更多地采取了渐进式的步骤来发展生成式AI的背景下,通过提供更好的API或许可以为公司开辟新的市场机会,并促进与其他企业的合作。


没有GPT-5,高管出走,向营利公司转型,这一系列的事件都预示着商业化已经成为Sam Altman迫切需要解决的问题,OpenAI将更多考虑利润,而不是实现AGI。


很长一段时间以来,Sam Altman用高超的技巧,一边操纵公众情绪,一边经营自己的事业,堪称科技界CEO中的翘楚。


但如果你在旧金山的OpenAI DevDay上听到他谈论关于OpenAI计划转向“盈利模式”的讨论,请不要感到意外。


文章来源于“硅星人Pro”,作者“周一笑


关键词: AI , openai , chatGPT , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。

项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales