2025年4月16日,Cohere 发布了其最新一代多模态搜索模型 Embed 4,在多模态数据处理、长文本建模和跨模态检索能力上实现了显著提升,进一步巩固了其在企业级 AI 搜索领域的领先地位。
128,000 个 token 的上下文窗口,理论上可处理约 200 页文档,解决了传统模型在处理超长文本时的性能瓶颈。支持跨文本、图像和表格的联合搜索,能够直接处理扫描文档和手写文件,无需复杂预处理。
在 Embed 3 的基础上增强了多模态能力,支持 文本、图像、表格 等多种数据类型的联合嵌入,可实现跨模态的语义检索。
针对企业数据中常见的拼写错误和格式问题,经过“嘈杂的现实世界数据”训练,保持高准确性。
充分考虑了金融、医疗保健和制造业等监管严格行业的需求,支持在虚拟私有云或内部技术堆栈上部署,增强数据安全性。
支持 100 多种语言,能够创建压缩数据嵌入以降低存储成本,同时扩展性优异,可满足大型组织的需求
解决了传统嵌入模型在理解复杂多模态企业数据时的天然缺陷,减少了繁琐的数据预处理需求。
通过生成嵌入,企业可将各类数据转化为 RAG(检索增强生成)用例所需的数值表示,提高 AI 代理答案的准确性,避免“幻觉”现象。
与 Qodo-Embed-1-1.5B 和 MongoDB 收购的 Voyage AI 模型 等竞争对手相比,Embed 4 在跨数据类型的准确性、企业级效率和应用场景覆盖上具有显著优势。
Embed 4 不仅在技术上实现了重大突破,更将极大地改善代理的应用场景,有望成为企业级代理和 AI 助手的“最佳搜索引擎”。随着技术的进一步发展,该模型可能会在更多行业中发挥关键作用,推动 AI 搜索技术的普及与应用。
文章来自于“数字炼丹师”,作者“数字炼丹师”。
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/