多模态语言模型又双叒叕上新了!
近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core。
它被誉为该公司「最大、最有能力」的模型,在性能上与GPT-4和Claude 3 Opus不相上下!
Reka的首席科学家兼联合创始人Yi Tay兴奋地表示,过去几个月,该公司使用了「数千台H100」来开发Reka Core。
能够达到GPT-4或Opus的水平是研究团队中许多人的目标。
从头开始训练模型来与OpenAI的GPT-4和Claude 3 Opus相媲美无疑是一项壮举。
目前Core仍在改进,在后续的时间里,兴许会有更多有趣的内容陆续推出!
对于这个新推出的模型,网友们叫好声一片~
还有网友看了官方发布的视频后惊叹:这莫不就是传说中的AGI,有点迫不及待了!!!
Core是Reka语言模型系列中的第三个成员,由多个来源训练而成,包括公开数据、授权数据以及涵盖文本、音频、视频和图像文件的合成数据。
它能够理解图像、音频和视频等多种模式的数据内容。
虽然Reka Core的确切参数数量尚未披露,但该公司首席执行官Dani Yogatama认为它是一个「非常庞大的模型」(上一个模型Reka Flash有210亿个参数)。
Core还支持32种语言和128,000个词组的上下文窗口,这也就让该模型在处理长篇文档方面具备了极强的优势。
可以说,Core是继谷歌的Gemini Ultra之后第二个涵盖从文本到视频等所有数据模式并且能够提供高质量输出的模型了。
此外,Yogatama还表示,研究团队正在训练Core以进一步提高其性能,同时也在开发下一个版本,并且表示该公司没有开源该技术的计划。
模型能力
1. 多模态(图像和视频)理解
Core 不仅仅是一个前沿的大型语言模型,它对图像、视频和音频具有强大的上下文理解能力,是仅有的两个商用综合多模态解决方案之一。
2. 128K上下文窗口
Core能够摄取并精确准确地调用更多信息。
3. 推理能力
Core在语言或者数学方面具有出色的推理能力,使其适用于需要精密分析的复杂任务。
4. 编码和代理工作流
Core是顶级代码生成器。它的编码能力与其他功能相结合时,可以增强代理工作流程的能力。
5. 支持多种语言
Core是在32种语言的文本数据上进行的预训练,因此,它能说流利的英语以及好几种亚洲和欧洲的语言。
6. 部署灵活性
与Reka其他型号的模型(Flash和Edge)一样,Core可通过API、本地或设备部署,以满足客户和合作伙伴的部署限制。
参考资料:
https://venturebeat.com/ai/reka-releases-reka-core-its-multimodal-language-model-to-rival-gpt-4-and-claude-3-opus/
https://x.com/YiTayML/status/1779895037335343521 https://x.com/artetxem/status/1779895714438365284
文章来自微信公众号“新智元”,作者:flynne
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)