图片来源:exa.ai
Z Highlights
视频来源:x
01 超级智能之前我们需要超级知识
我们时代最重要的技术问题是:超级智能之前我们需要超级知识。什么是超级知识?超级智能是一个可以处理极其复杂的推理请求的系统,而超级知识是一个可以处理极其复杂的检索请求的系统。知识系统如谷歌在过去十年中几乎没有改进,而智能系统则每月都有进步,这意味着智能系统越来越受限于知识的瓶颈。当存在一个API可以处理任何复杂的知识请求时,我们就达到了超级知识的目标。
虽然现在有了如Transformers这样的技术,让ChatGPT变得更高智能,但知识却令人惊讶的有限,例如GPT-4可以解决任何高中物理问题,但如果你要求它检索某个市的物理博士名单:检索返回的是4380万条低质量弱相关的相关链接。因此,一家名为Exa的初创公司渴望成为第一个针对AI构建的搜索引擎:为人工智能打造一个谷歌。
图片来源:exa.ai
02 Exa:为AI企业打造一个谷歌
图片来源:lsvp
Exa的主要产品是一款高度智能化的搜索引擎,专门优化以处理复杂查询和大数据量的搜索需求。Exa的搜索引擎独具特色,因为它并不是专为人类设计的,而是为AI平台服务的。Exa的创始人认为,随着AI在企业和消费者生活中的日益普及,AI将比人类更多地搜索网络,AI平台本身需要定期在互联网上搜索信息,并返回真实的答案,而不是生成虚假的内容。Exa正在开发一款工具,允许AI模型进行类似于网络搜索的操作,但采用了特别为人工智能设计的技术和方法(AI-native twist)。
Exa的关键技术包括:
图片来源:exa.ai & google
03 正在成为AI开发者和公司的关键力量
Exa的API版本大约在一年前推出。创始人Wang表示:“从那时起,它获得了大量的关注。” 目前,Exa表示正在为成千上万的开发者提供服务。与Perplexity不同,Exa最初更像是为B端企业和开发者设计的研AI工具,而不是一个传统的搜索引擎。在ChatGPT席卷科技界后,AI公司开始请求使用Exa的搜索引擎API以将其集成到自己的模型中。如今,AI公司已成为Exa的主要客户群,Exa搜索引擎的应用范围从AI聊天机器人在回答客户问题时查找互联网信息,到公司为训练数据进行筛选,应用广泛。例如,Databricks是Exa的重要客户之一,创始人表示,他们利用Exa的搜索引擎寻找用于模型训练的大规模数据集。
Exa受到数千开发者和公司的信赖:
值得一提的是,Exa提供一个免费层,允许任何人有限度地试用其搜索引擎,同时也有多个分层收费级别。
图片来源:exa.ai
Exa的创始人未透露收入情况,但其官方博客显示,目前已有数千家公司和开发者集成了Exa的产品,并且收入在过去几个月中增长了两倍。有趣的是,除了运行自己的GPU集群外,Exa还将其产品托管在AWS上,而不是AI优先的Google Cloud。尽管团队目前的目标并非颠覆谷歌的搜索业务,但如果AI如预期那样成为解决所有问题的终极技术,那么专门为人工智能机器人设计的搜索引擎可能会对现有搜索市场霸主地位构成意外挑战。
Exa提供灵活定价模式,与传统搜索引擎的定价方式显著不同。传统搜索引擎通常采用固定的广告收费模式,而Exa是为知识付费为主的即用即付结构,更侧重于知识满足不同规模和需求的用户。
对于个人和小团队,Exa提供即用即付模式,并赠送$10的免费额度以便用户开始使用。
对于高流量需求、自定义数据集和企业安全需求,Exa还提供量身定制的解决方案。
04 哈佛天才室友联手创业,获顶尖风投支持
图片来源:lsvp
Exa的创始团队由Will Bryk和Jeff Wang共同创立。两人自哈佛大学计算机科学专业学习期间就开始合作,并且建立了深厚的友谊。在哈佛的日子里,他们常常一起熬夜破解难题和进行技术项目的开发。
Will Bryk作为Cresta最早的工程师之一,因其出色的学习能力和创造性问题解决能力而声名鹊起。开发了实时AI产品。他在哈佛大学学习计算机科学和物理,研究人机交互并领导了机器人俱乐部。
图片来源:linkedin
Jeff Wang在Plaid工作三年期间,负责数据和网络基础设施的构建,以惊人的工程速度和为新项目寻找产品市场契合点的能力而闻名。他在哈佛大学学习计算机科学和哲学期间与Will是室友,曾在宿舍里运行GPU集群。
图片来源:linkedin
Exa最近宣布完成了由Lightspeed的Guru Chahal领投的1700万美元A轮融资,参与投资的还包括Nvidia的投资部门NVentures和Y Combinator。这笔资金将用于加强技术研发和市场扩展,帮助Exa实现其重新定义互联网搜索的愿景。
“Exa代表了一支令人难以置信的团队与关于AI应用如何获取最新知识的宏大愿景的交汇点。看到Exa在如此小的团队和有限的资源下所取得的成就,令人印象深刻。AI系统的三个关键组成部分是计算能力、模型和数据。Nvidia提供计算基板,Anthropic、OpenAI及其他基础模型公司训练模型,而Exa可以提供关键的数据和知识层。我们非常高兴能够支持他们,重新定义AI如何利用知识,并最终重新定义整个搜索。” Lightspeed合伙人Guru Chahal表示。
据TechCrunch报道,Exa目前的总融资额已达到2200万美元,其中包括之前的500万美元种子轮融资。Exa曾参与2021年夏季的Y Combinator计划。
文章来源于“Z Potentials”,作者“Z Potentials”
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/