mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVAEMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。
EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。
去年,OpenAI在旧金山举办了一场引发业界轰动的开发者大会(DevDay 2023),推出了一系列新产品和工具,包括支持128K上下文的GPT-4 Turbo,API价格下调,新的Assistants API,具备视觉功能的GPT-4 Turbo,DALL·E 3 API,以及大幅改进的JSON模型,还有命运多舛的GPTs和类App Store平台GPT Store。
基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了!
Stable Assistant还支持草图生成完整图片,一键“毛坯”变“精装”。
谷歌推出Gemini大规模商业化,将其聊天机器人Bard改名为Gemini,并推出Gemini的Android版App。谷歌还将Gemini的能力加入iOS的Google App中,并免费向公众开放。Gemini还可替代原来的Google Assistant成为手机的默认语言助手。
去年 6 月,JetBrains 宣布所有基于 IntelliJ 的 IDE 和 .NET 工具都将集成一个新功能:AI 助手(AI Assistant)——该功能由 JetBrains AI 服务提供支持,可连接不同的大语言模型(LLM),并表示会将它整合到 IDE 的核心工作流中。
OpenAI的GPT商店有开源平替了——来自抱抱脸(Hugging Face)。
现在,人人都可以利用开源模型,打造量身定制的AI助手了。
就在刚刚,全新升级4.0的日日新大模型发布!不仅如此,商汤还抢先OpenAI首发了支持不同模态工具调用的Assistants API!现在,超千万的中文开发者可以轻松玩转「文生图」和「图生文」了。
距离上次推出的 v0.4.0 大版本的三周后,我们又再次迎来了重大的更新 — v0.5.0!在这个最新版本中,我们隆重推出了 AI Agent 能力。