ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
95后哈佛华人,创业AI企业版谷歌,获光速美国、英伟达等数千万美元融资
6892点击    2024-10-03 16:19


图片来源:exa.ai


Z Highlights


  • 引领AI搜索时代产品新定义 :谷歌发明于1998年的基于关键词的算法至今还在使用着,但对于现代互联网的庞大内容和SEO行业并不适用。Exa是首个网络规模的神经搜索引擎,使用与ChatGPT相同的Transformer架构算法,根据意义而非关键词过滤互联网。通过其创新的自然语言处理和机器学习算法,Exa实现了高精度的企业信息提取和数据分析。不仅快速提取实时相关信息,还能生成有价值的洞见,极大地提升企业效率和决策质量。

  • 技术应用亮眼:自从ChatGPT出现以来,AI公司就开始向Exa请求他们搜索引擎的API,以便将其集成到他们的模型中。AI公司成为现在其主要客户,Exa搜索引擎的应用范围涵盖了从AI聊天机器人在回答客户问题时查找互联网信息到公司为训练数据进行筛选的各种用途。

  • 哈佛学子联手创业,融资超2200万美元 :Exa由哈佛大学计算机科学专业同学William Bryk和Jeffrey Wang创立,自成立以来获得了多个知名投资机构的支持,包括Lightspeed Venture Partners和Nvidia。截至目前,Exa已经成功融资2200万美元,这些资金将用于进一步研发和市场扩展。



视频来源:x


01 超级智能之前我们需要超级知识


我们时代最重要的技术问题是:超级智能之前我们需要超级知识。什么是超级知识?超级智能是一个可以处理极其复杂的推理请求的系统,而超级知识是一个可以处理极其复杂的检索请求的系统。知识系统如谷歌在过去十年中几乎没有改进,而智能系统则每月都有进步,这意味着智能系统越来越受限于知识的瓶颈。当存在一个API可以处理任何复杂的知识请求时,我们就达到了超级知识的目标。


虽然现在有了如Transformers这样的技术,让ChatGPT变得更高智能,但知识却令人惊讶的有限,例如GPT-4可以解决任何高中物理问题,但如果你要求它检索某个市的物理博士名单:检索返回的是4380万条低质量弱相关的相关链接。因此,一家名为Exa的初创公司渴望成为第一个针对AI构建的搜索引擎:为人工智能打造一个谷歌。



图片来源:exa.ai


02 Exa:为AI企业打造一个谷歌



图片来源:lsvp


Exa的主要产品是一款高度智能化的搜索引擎,专门优化以处理复杂查询和大数据量的搜索需求。Exa的搜索引擎独具特色,因为它并不是专为人类设计的,而是为AI平台服务的。Exa的创始人认为,随着AI在企业和消费者生活中的日益普及,AI将比人类更多地搜索网络,AI平台本身需要定期在互联网上搜索信息,并返回真实的答案,而不是生成虚假的内容。Exa正在开发一款工具,允许AI模型进行类似于网络搜索的操作,但采用了特别为人工智能设计的技术和方法(AI-native twist)。


Exa的关键技术包括:


  • 向量数据库和嵌入模型:与Chatgpt相同的技术,Exa使用向量数据库和嵌入技术来构建机器学习模型,将网页内容转化为向量,使搜索过程更具智能精准化。

  • 端到端Transformer模型及高效信息过滤:Exa通过使用网络上的链接数据或长文本作为训练数据集,模型可以预测下一个最可能的内容,从而提供高效的信息过滤,避免了传统搜索引擎中常见的SEO垃圾信息和AI生成的内容干扰。网页检索的质量对于LLMs来说尤其重要,强大的检索能力能够过滤互联网以获取高质量的内容。




图片来源:exa.ai & google


03 正在成为AI开发者和公司的关键力量


Exa的API版本大约在一年前推出。创始人Wang表示:“从那时起,它获得了大量的关注。” 目前,Exa表示正在为成千上万的开发者提供服务。与Perplexity不同,Exa最初更像是为B端企业和开发者设计的研AI工具,而不是一个传统的搜索引擎。在ChatGPT席卷科技界后,AI公司开始请求使用Exa的搜索引擎API以将其集成到自己的模型中。如今,AI公司已成为Exa的主要客户群,Exa搜索引擎的应用范围从AI聊天机器人在回答客户问题时查找互联网信息,到公司为训练数据进行筛选,应用广泛。例如,Databricks是Exa的重要客户之一,创始人表示,他们利用Exa的搜索引擎寻找用于模型训练的大规模数据集。


Exa受到数千开发者和公司的信赖:


  • EvaBot的CEO Rabi Gupta表示:“Exa的深度研究能力大大提升了我们销售人员的研究效率。没有Exa的速度和质量,我们很难达成这一目标。”


  • Databricks首席科学家Jonathan Frankle说道:“模型的好坏取决于训练数据的质量,Exa的搜索让我们找到了其他方式无法获取的高质量数据。”

  • JotBot创始人Alex Johnson表示:“Exa确实很棒,我们从多次API调用和抓取转变为单次<1秒的快速调用,结果比传统搜索好得多,我们的用户非常喜欢。”

值得一提的是,Exa提供一个免费层,允许任何人有限度地试用其搜索引擎,同时也有多个分层收费级别。



图片来源:exa.ai


Exa的创始人未透露收入情况,但其官方博客显示,目前已有数千家公司和开发者集成了Exa的产品,并且收入在过去几个月中增长了两倍。有趣的是,除了运行自己的GPU集群外,Exa还将其产品托管在AWS上,而不是AI优先的Google Cloud。尽管团队目前的目标并非颠覆谷歌的搜索业务,但如果AI如预期那样成为解决所有问题的终极技术,那么专门为人工智能机器人设计的搜索引擎可能会对现有搜索市场霸主地位构成意外挑战。


Exa提供灵活定价模式,与传统搜索引擎的定价方式显著不同。传统搜索引擎通常采用固定的广告收费模式,而Exa是为知识付费为主的即用即付结构,更侧重于知识满足不同规模和需求的用户。


对于个人和小团队,Exa提供即用即付模式,并赠送$10的免费额度以便用户开始使用。


  • 每1,000次神经搜索$5(1-25个结果):适用于语义数据类型的检索增强生成(RAG)。

  • 每1,000次神经搜索$25(26-100个结果):适用于需要较多结果的自动化AI驱动研究流程。

  • 每1,000次关键词搜索$25(1-100个结果):使用传统搜索提供商进行的基于关键词的搜索。

  • 每1,000个内容$1:从任何网页获取全文或智能摘录,包括PDF文件。

对于高流量需求、自定义数据集和企业安全需求,Exa还提供量身定制的解决方案。


04 哈佛天才室友联手创业,获顶尖风投支持



图片来源:lsvp


Exa的创始团队由Will Bryk和Jeff Wang共同创立。两人自哈佛大学计算机科学专业学习期间就开始合作,并且建立了深厚的友谊。在哈佛的日子里,他们常常一起熬夜破解难题和进行技术项目的开发。


Will Bryk作为Cresta最早的工程师之一,因其出色的学习能力和创造性问题解决能力而声名鹊起。开发了实时AI产品。他在哈佛大学学习计算机科学和物理,研究人机交互并领导了机器人俱乐部。



图片来源:linkedin


Jeff Wang在Plaid工作三年期间,负责数据和网络基础设施的构建,以惊人的工程速度和为新项目寻找产品市场契合点的能力而闻名。他在哈佛大学学习计算机科学和哲学期间与Will是室友,曾在宿舍里运行GPU集群。



图片来源:linkedin


Exa最近宣布完成了由Lightspeed的Guru Chahal领投的1700万美元A轮融资,参与投资的还包括Nvidia的投资部门NVentures和Y Combinator。这笔资金将用于加强技术研发和市场扩展,帮助Exa实现其重新定义互联网搜索的愿景。


“Exa代表了一支令人难以置信的团队与关于AI应用如何获取最新知识的宏大愿景的交汇点。看到Exa在如此小的团队和有限的资源下所取得的成就,令人印象深刻。AI系统的三个关键组成部分是计算能力、模型和数据。Nvidia提供计算基板,Anthropic、OpenAI及其他基础模型公司训练模型,而Exa可以提供关键的数据和知识层。我们非常高兴能够支持他们,重新定义AI如何利用知识,并最终重新定义整个搜索。” Lightspeed合伙人Guru Chahal表示。


据TechCrunch报道,Exa目前的总融资额已达到2200万美元,其中包括之前的500万美元种子轮融资。Exa曾参与2021年夏季的Y Combinator计划。


文章来源于“Z Potentials”,作者“Z Potentials


关键词: AI , AI创业 , Exa , AI搜索
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/