刚刚,OpenAI收购了数据库初创公司Rockset。
公司由Facebook工程师创立,主打实时搜索和数据分析,能够实现毫秒级延迟。
这项收购作价5亿美元(约36亿人民币),而且与之前收购另一家公司不同,这次除了要人,技术也会被整合进OpenAI的产品。
按照官方说法,这次收购将增强OpenAI的检索基础设施,帮助企业把数据转化为“可操作的智能”(actionable intelligence)。
有网友表示,OpenAI的算法和算力都已经很强了,此次收购也将帮助其应对数据层面的挑战。
还有人猜测,OpenAI是不是要造搜索引擎了。
Rockset于2016年创立,总部位于加州的圣马特奥(San Mateo)。
领英资料显示,该公司规模为51-200人,有86名用户的资料与之相关。
假设按照80人来计算,5亿美元平均到每个人头上,就是625万美元,约合4500多万人民币。
该公司由Facebook的工程师创办,包括两名联合创始人在内,公司的六名高管中有四人都曾有过在Facebook工作的经历。
创始人兼CEO Venkat Venkataramani,威斯康星大学麦迪逊分校计算机硕士,在2016年创立Rockset时已有14年的数据库工作经验。
他曾任Facebook基础设施团队的工程总监,所带领的团队为15亿用户管理在线数据服务;更早之前,Venkat在甲骨文公司担任主要技术人员,同样从事数据库工作。
联创兼CTO Dhruba Borthakur,是比Venkat早七届的校友,同样在Facebook从事过数据库工作,还是Hadoop分布式文件系统的创始工程师之一,以及开源Apache HBase项目的贡献者。
架构负责人Tudor Bosman,斯坦福计算机硕士,拥有7年的Facebook工作经历,是Facebook搜索引擎Unicorn的领导者,还曾在甲骨文、谷歌等公司担任软件工程师。
还有负责工程的副总裁Louis Brandy,于2021年加入Rockset,此前在Facebook工作了10年,做到了工程部门的主管。
Rockset的主营业务自然也是与数据库相关,具体来说是实时搜索和分析数据库,旨在为事件流、CDC流和向量提供毫秒延迟的分析查询。
而为Rockset“贡献”了四名高管、现已成为Meta的Facebook,也成了Rockset的客户。
据介绍,Meta在PyTorch上,用两周就完成了Rockset的部署和迁移,并将查询延迟降低到了亚(sub)秒级别。
截止上一轮融资,Rockset已经获得了1.17亿美元,主要投资者包括红杉资本,以及顶级风投机构greylock等。
最近的一次融资是在去年8月,Rockset获得了4400万美元,估值为1-5亿美元,最终OpenAI的收购价格也是敲定在了5亿美元。
虽然OpenAI确实投资过很多初创公司,但是直接公开收购的举动并不多见。
加上去年收购游戏公司Global Illumination,一共就只进行了这两次。
至于OpenAI到底想要干什么,也和上次一样没有披露详情。
OpenAI公告中的说法是增强基础设施,让AI“变得更有帮助”。
可以确定的是,此次收购之后Rockset的技术将会被整合,支持OpenAI的检索基础设施,另一方面团队成员也将加入OpenAI。
而被收购的Rockset一方,CEO Venkat在通告中直接说,此举将会帮助构建安全有益的AGI。
官方消息之外,有网友发现,ChatGPT最近的联网搜索变得比perplexity快,不知道是不是已经提前用上了Rockset。
的确,实时的数据索引和检索能够为AI模型的准确性和性能显著提高。
所以,整合这样的技术,一定程度上可以帮助解决所有大模型从业者都在面临的数据问题,也可以为此前传闻中的“OpenAI搜索引擎”铺路。
另一方面,这种做法,也被一些网友看作是OpenAI进一步迈向B端市场的一种举措。
不过,在如此之多的推断当中,热度最高的一条评论,关心的还是GPT-4o的“视频通话”到底什么时候上线,还有Sora又在哪里……
虽然GPT-4o的视频通话依然没有铺开,但关于GPT-5,OpenAI CTO却已经有了新的暗示。
不久前,Mira回到了母校达特茅斯工程学院,并接受了访谈。
期间Mira对各代GPT的表现做出了评价,表示GPT-3是幼儿园水平,GPT-4则达到了高中生水准。
而目前OpenAI的目标,是让下一代模型(大概是GPT-5)在特定任务上达到博士水平。
至于具体的问世时间,Mira表示,或许是(Let’s say)一年半之后。
文章来源于“量子位”,作者“克雷西”
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/