# 热门搜索 #
搜索
谷歌DeepMind核心大佬被曝离职创业,瞄准AI智能体!曾是Gemini关键负责人
7421点击    2024-01-31 16:52
AI智能体实火!谷歌被曝出DeepMind核心技术大佬离职,连Gemini项目的主要开发者也留不住了。


谷歌又被曝出有核心员工离职了!


这次跑路的竟是DeepMind的核心技术大佬,Gemini项目的四位主要开发者之一,Ioannis Antonoglou。



上图左半部分列出了Gemini项目的36位领导者,自去年九月以来,包括Ioannis Antonoglou在内,已有四位主要成员离开。



Ioannis Antonoglou


在OpenAI以及背后微软的挤压之下,谷歌的日子貌似不太好过。


去年裁员12000多人,光遣散费就花了几十亿美元,劈柴还宣布今年要持续裁员一整年,


而一边的OpenAI也在花心思挖角谷歌的高级人才。


另一方面,AI行业的大佬们在大模型带来的变革中发现了新的风口,——比如AI智能体(Agent)。



越来越多的初创公司试图在这个领域崭露头角,Antonoglou这次离职的目标就是创办自己的人工智能公司,并瞄准Agent这个市场。


Antonoglou目前的两位合伙人,Sherjil Ozair和Misha Laskin,也是之前一起参与Gemini项目的同事。据一位知情人士透露,他们已经开始为自己的初创企业筹集资金。



——谷歌的科技帝国开枝散叶......也未尝不是一件好事?


当然,如果这家新公司决定涉足智能体领域,也将面临众多竞争对手。


近期的初创公司,包括获得General Catalyst支持的Adept(已筹集4.3亿美元)和获得Nvidia支持的Imbue(已筹集超过2亿美元),都在从事智能体的研发。


其他的初创公司还包括HyperWrite和Lindy,而大公司没准也会来插一脚。



Antonoglou于2012年加入DeepMind。


2013年,Antonoglou作为七位作者之一,发表了一篇关于深度强化学习的论文,能够在无需人类干预的情况下学习,并掌握Atari视频游戏。



这篇工作在NIPS 2013的Deep Learning Workshop中展示,而这一突破也引起了谷歌和Facebook领导层的注意,他们认识到这可以用于增强自己的广告业务。


2014年,谷歌以超过5亿美元的价格收购了只有约有75名员工的DeepMind。之后Antonoglou参与开发了击败围棋顶尖人类选手的 AI。


有趣的是,OpenAI的团队也受此影响,采用类似技术开发了一个能玩Dota 2的AI系统。


还有上面提到的Antonoglou的合伙人Sherjil Ozair也是业内的大佬。




Ozair去年夏天离开DeepMind加入Tesla,他之前也同Antonoglou 合作发表过一些文章,比如下面这篇来自PMLR'2021。



而他更加有名的一篇工作是我们大部人都非常熟悉的「GAN」(生成对抗网络)。



这篇开创性的工作为后续生成式AI模型的发展奠定了基础。


「开枝散叶」


除了上面介绍的大佬,在过去两年里,DeepMind和Google Brain的一些员工纷纷离职,开创了自己的新公司。


包括开发开源AI模型的Mistral AI,以及同样致力于生成式AI模型的Sakana AI和Reka AI。


最近,又有三位在谷歌负责图像和音乐方向的AI研究人员离职,据知情人士透露,他们成立了自己的AI初创公司Uncharted Labs。



这也揭示了谷歌内部可能存在的结构性问题,推出的AI产品错失良机,而顶尖的研究人员则决定抓住外部机遇,抓住风险投资者对AI领域新公司的热情。


文件显示,这三位创始人已经筹集了850万美元,最近几个月,他们还会见了包括Andreessen Horowitz在内的潜在投资者。


三人团队的总裁是David Ding,他此前是Google DeepMind的技术负责人。



而另外两位Charlie Nash和Yaroslav Ganin,是Ding之前在DeepMind的团队成员。Ding和Ganin在谷歌工作了五年以上。


Ding之前的团队还有一名成员Conor Durkan也在去年离职了。


在DeepMind,这四个人参与了一个项目,使AI能够根据用户的简单描述创造出原创的图像和音乐。


去年11月,DeepMind公开了音乐生成模型Lyria,能够从头开始创作歌曲,包括利用Charlie Puth和John Legend等艺术家的人声。



这几个人还参与了Imagen 2的开发,作为Midjourney和DALL·E 3(OpenAI )的竞品。


面对这不容乐观的水土流失,谷歌被逼无奈,只好咬牙提高顶尖AI研究人才的待遇,使用特别的股票奖励措施。


然而,对于那些致力于生成式AI的初创公司来说,轻松获得风险投资的吸引力极大。


根据PitchBook和National Venture Capital Association的数据显示,2023年在美国,超过三分之一的风险投资涌向了AI领域。


AI 智能体未达预期


AI智能体的概念随着生成式AI大模型的发展而开始流行,Agent可以自动帮助人类处理线上购物、订票、会议等。


比如AutoGPT和BabyAGI,承诺能做到从预订机票到回复短信等一切自动化操作。然而,它们很快就暴露出了技术上的限制。



包括OpenAI推出的相关产品,目前也没有什么实质性的进展。


现有的Agent执行任务的能力参差不齐,还容易重复相同的行为模式,研究人员正也尝试新的方法解决这些问题,比如开发更适合智能体任务的专用软件,而不是依赖现成的模型。


HyperWrite的联合创始人兼CEO Matt Shumer表示,AI智能体之所以未能如预期般发展,有几个原因。


目前的智能体虽然能够规划并将目标分解成子任务(比如将竞争对手研究,分解为评估管理层、预测销售额和成本计算),但是在执行这些子任务时往往遇到困难。


同自动驾驶一样,智能体经常会被从未遇到过的「边缘情况」所困扰,这种失败可能会削弱消费者的信任。


另外,这个行业似乎面临着与大型语言模型开发商同样的问题:他们正试图用风险资本解决一个长期的研究问题,而投资者却希望尽早看到成品和投资回报。


解决方案


传统的AI智能体通常由三部分构成:


一是像GPT-4这样的大语言模型,负责规划完成目标所需的任务;二是向量数据库,帮助智能体记住以往的行动和目标相关的重要背景信息;三是LangChain等工具,负责将这些组件连接起来。



而HyperWrite正在尝试一种截然不同的结构。根据请求的复杂程度,HyperWrite能将客户的请求分配给不同的模型处理。


Shumer表示,GPT等传统大语言模型仅能处理简单的网络搜索,而HyperWrite的定制模型则更擅长分析网页内容并与之交互,如点击不同的按钮。HyperWrite目前已有数千名付费用户。



与此类似,Imbue也在开发多种模型,包括大语言模型和多模态模型,以帮助AI智能体解决软件编码等问题。


为此,Imbue团队特别标注训练数据,使模型能够理解博客文章或软件代码背后的逻辑。


Imbue的开发者会对模型训练数据中的代码行进行注释,说明它们是如何为更大的软件项目贡献的。这样一来,模型便能学会单行代码如何协同工作,共同实现一个更广泛的目标。


另一种智能体的发展方向是专注于特定的任务。


比如,Imbue使用了多个专门解决特定问题的智能体,从修正代码格式错误到分析AI政策趋势。这种专注于特定领域的方法减少了智能体遇到的问题边缘情况。


Shumer认为,随着时间的推移,通用型模型将最终超越专用于特定任务的模型,但CRV的Vivian Cheng认为,由于技术还处于初期阶段,短期到中期内很难开发出一个可靠的通用型智能体。


——也许「通用」和「专用」会在未来的某个时间点相遇吧,让我们拭目以待。


参考资料:

https://www.theinformation.com/articles/google-deepmind-veteran-departs-to-launch-ai-agent-startup?rc=epv9gi


文章来自于微信公众号 “新智元”,作者 “alan 、好困



关键词: DeepMind , AI智能体 , Gemini
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI