AI人才抢夺战:年初疯狂,年末彷徨

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
AI人才抢夺战:年初疯狂,年末彷徨
2598点击    2023-09-15 14:01

AI人才抢夺战:年初疯狂,年末彷徨


时间来到ChatGPT引发中国AI热潮的第十个月。


每位熟知国内AI格局的投资人和猎头,脑海中已经有了一幅人才版图,如果你有机会和他们喝上一杯,畅快地聊聊天,大概会有这样的对话:


“头条的张前川去哪里了?”


“他被挖去了MiniMax。”


张前川,今日头条前用户产品负责人,2023年初离职后宣称将成立一家AI应用公司。不过,离职不久,张前川就加入了大模型创业公司MiniMax。据36氪获悉,MiniMax开出了相当可观的报酬。


“Seven离职后创业了吗?”


“没有,她去了深言科技当产品负责人。”


Seven(王京津),2022年离职的抖音前产品负责人,近期入职了估值超1.5亿美金的AI创业公司深言科技。36氪了解到,在Seven正式加入前,深言邀请她做了半年顾问。


“还有什么值得关注的大牛吗?”


“有,Louis,相比前两位,他才是行业真正看重的人。”


Louis,阳陆育,前Musical.ly联合创始人,TikTok海外市场的奠基人。2022年中离开字节跳动后,一度去向成谜。今年6月,Louis携一家名叫“远光灯数字科技”的公司,躬身入局AIGC游戏赛道。


一名投资人对36氪评价:“只要Louis创业,我就要找他聊。如果他做AI,那更要聊。”


AI创业火热,但技术型创业,产品要研发、落地要试错,诸多不确定性里,人才,成了定价和交易的砝码,也是早期的大模型之争中,最重要的因素。


抢人的战火迅速点燃赛道。年初王慧文高调入局,王小川紧随其后,发AI“英雄帖”的创业大佬不下十人。


据多名高校出身的AI大牛回忆,以“二王”为代表的创业者,几乎把市面上所有AI人才聊了一遍。今年4月接受36氪专访时,听到光北京就有20多家大模型企业,正忙于招团队的王小川问道:“你们能在文章里放上我们(百川智能)的招聘邮箱吗?”


泛科技领域里,AI属于成熟风口,人才不像室温超导那样扎堆在实验室,而是均匀分布在高校、机构、巨头。那些经验老道的投资人和猎头,早已在这十个月内,将AI人才们的title、过往履历和最新动向熟稔于心。


比如,想要挖到技术高管,免不了去一趟诞生ChatGPT的AI腹地:硅谷。


猎头Mia去硅谷前,在行李箱装了两罐精包装的西湖龙井和四瓶老干妈。抵达后,她要去Mountain View(山景城)的一家酒吧,用祖国的特产、再配上国内企业的offer和近千万元的年薪,请几名算法科学家回去。


在汇聚Google、微软等科技巨头的Mountain View,除了猎头,遇见寻觅AI人才的创投圈大佬,也不是一件难事。


有人在街头看到过穿着深色T恤的百度副总裁景鲲(他是百度“小度”系列智能产品的缔造者);在斯坦福大学的草坪和被誉为“西海岸华尔街”的沙丘路,走过源码资本合伙人黄云刚和真格基金管理合伙人戴雨森。


更近一点的5月初,王小川出现在硅谷一场AI技术party上。对着在场数十名华人工程师,王小川把自己“AI重塑搜索”的创业理想讲了一遍,试图和人才拉近关系——在36氪的专访中,他曾提及:“国内的大公司、高校里有一些不错的领军人物,一些更明星级的人才,确实在美国。”


AI人才抢夺战:年初疯狂,年末彷徨


帮国内创始人们与硅谷AI人才牵线,也成了一个商机。一名在硅谷的猎头记得,光3月份,Mountain View几乎每晚都有华人中介举办的party,报名参加光会费就达上万人民币,还要有门槛:成功创过业,或者投出过好项目。


企业们砸血本招人的同时,还得防止员工被挖角。


一家创业公司为了留住人才,给近十名核心员工涨了30%的薪水,几乎所有工程师在公司内部都用“花名”。


大公司也在警惕。百度宣布大语言模型“文心一言”立项当晚,参与成员被HR拉了个会,重新签了一遍竞业协议。


共识快速形成:人才储备最多的企业,离“中国的OpenAI”最近。


千万年薪,难挖硅谷人才


以如今AI人才的紧俏程度,Mia觉得千万级的年薪并不夸张。


在2023年第一季度,超过17万中国AI企业如雨后春笋般冒了出来。圈内人爱用一句话形容AI赛道的创业热:“光北京就有20多家声称能做大模型的企业。”


但相对的,是写在中国工信部报告中的30万AI人才缺口。再严苛一些,国内有过完整大模型工程经验的人能有多少?AI行业资深人才顾问海浪告诉36氪:“不超过100个人。”


若想要挖到能直接带上百人的团队跑工程的P9、P10,国内就只剩下大厂的几个CTO和首席科学家。“企业想要招技术高管,只能看硅谷。”海浪解释。


可惜的是,无论是茶叶、老干妈,还是一千万的高薪,都很难打动硅谷的人才。


一名研究员在Mia尚未给出薪酬条件时,就开门见山地拒绝:“老婆孩子都在这里,回国之后孩子的教育问题,也很难解决。”


再过一年多,微软必应团队的算法工程师Joshua就能如愿拿到美国绿卡。在他的人生蓝图里,再积攒两年工作经验,他就从华盛顿搬到硅谷创业。


他不愿离开硅谷——即便从今年2月起,求职软件上几乎每天都有99+的未读消息和通知红点。除了薪酬,Joshua还看到有公司开出隐形福利:前半年不背OKR。


被求职信息轰炸近一个月后,Joshua关闭了几个求职软件的弹窗。


抢人大战中,有成熟落地场景的企业,赢面会大一些。在Mia看来,落地场景就是企业的简历,更能吸引人才。


而落地方案尚未成熟的公司,要么有个像王慧文和王小川一样,“人能来事,又能搞钱”的创始人,要么靠“画饼”吸引人才。


但国内科研环境与硅谷的现实差距,让大模型创业者画的理想之“饼”,不那么有说服力。


在硅谷期间,Mia去了英特尔总部。在那里,每位算法工程师能调用的GPU就有四五百块。“但在国内,四五百张GPU往往是一个项目组能够申请到的算力上限。”Mia说。



AI人才抢夺战:年初疯狂,年末彷徨


类似的,谷歌AI实验室对人才的大方一度让蓝振忠觉得惊讶。在那里,他能够自由调用相当于几千张A100的TPU。就算在比较冷门的研究组,部门团建仍然开得起高级餐厅最贵的酒。


回国成立AI公司“西湖心辰”后,蓝振忠第一次感受到了算力资源的稀缺和昂贵:“公司和学校的科研经费只能买很少一部分,剩余的都得租公有云服务。”为了拉融资买算力,他每天需要和投资机构和客户开五六个电话会。


回国的硅谷创业者为资源焦虑,而去硅谷的创业者也屡屡碰壁。一位知名创业者曾在公开场合被问及近期的硅谷之行收获时,坦言自己去硅谷不是为了挖人,而是为了交流技术经验。

但一名与该创业者在硅谷交流过的人士告诉36氪:“别信他。因为挖人很难,大多数人过去,只能先建立个联系。”


Meta一开源,猎头白干半年


年初,AI技术大牛还是圈内最热的招徕对象。像ChatGPT一样参数千亿的大语言模型,仍然是个“舶来品”。对多数企业而言,想要做“中国OpenAI”,就必须大力招人搞技术。


然而不久后,意外发生了。


扇动翅膀的,是押注AI大模型已久的Meta(前Facebook)。2023年3月8日,被称为“最强开源模型”的大语言模型Llama遭到泄露,任何人都可以下载使用;7月,Llama的研发商Meta主动成为“搅局者”,开源了性能更强的Llama 2,几乎所有公司都能直接免费商用Llama 2。


Llama的开源,迅速降低了大模型训练的门槛。AI从业者们发现,根本没必要花这么多钱招技术人才从0训练模型。理论上,公司只要有足够多和高质数据,对Llama进行微调,就能用较低的成本训练出一个效果不错的模型。


很快,不少公司的大模型如雨后春笋般冒了出来,更甚者基于Llama微调后,就冠以“自研”之名。圈内广为流传的一句戏言是:如果Llama不“惨遭开源”,国内就没那么多的“自研”。


紧接着,技术领域的人才就开始“贬值”。


曾经想从硅谷挖人的几家企业,把自己的需求改成了从国内找工程师,年薪控制在40万元以内。猎头Mia在KTV点了一首《老子明天不上班》:“感觉自己上半年跑硅谷,最后白干。”


上半年,由于技术尚未成熟,大模型的商业化落地并不十分顺利。开源的Llama解决了卡脖子的大模型技术,也将AI企业发展的进度条从大炼模型,快速拉到应用落地。


相应的,企业们年初招徕技术人才的热情,在下半年一度转移到了产品经理。在Netflix最新发布的招聘启示中,AI产品经理的年薪开到了90万美元,超过了AI技术总监的65万美元。


不过,市场供需并非衡量顶级人才的唯一标尺,Icon(标志)级别的技术大牛仍然热度不减。


对企业来说,技术大牛不光是敲代码的员工,还是一个充满内涵的符号:技术人才,意味着技术的天花板,以及持续吸纳资方、客户和人才的门面。


昆仑万维CHO杨姝一直觉得,人才是AI公司最优质的资产。公司不仅需要基本功扎实的研发者,也需要一个名号响亮的Icon。就像乔布斯之于智能手机,“Icon和研发者的区别在于,Icon是有市场号召力的,还能吸引更牛的人才过来”。


2020年昆仑万维即布局AIGC和AGI领域,目前相关团队整体规模近千人。但到了2023年,为了争夺人才,杨姝和HR同事每周要沟通近百位候选人。最近,昆仑万维还请来了一位“Icon”——顶级AI科学家颜水成,出任天工智能联席CEO和昆仑万维2050全球研究院院长,吸引全球的AI人才。


“杨红霞博士来之前,我感觉市面上没什么人觉得字节能做大模型这件事。”一名大厂HR点评。


作为曾经阿里达摩院大模型M6的项目带头人,杨红霞在今年初转投字节跳动的AI阵营——这一消息也让不少人认为,字节有了和AI“老玩家”百度、阿里同桌竞技的可能。


至于花千万元挖一个技术大牛来做AI到底值不值,上述HR回复36氪:“在实现技术革新前,确保企业形象跟上时代潮流。”


所有人都在警惕泡沫


6月后,水温渐凉。钱在上半年,已经涌向了大模型的早期玩家。


据不完全统计,上半年融到钱的大模型企业大概有20多家,而6月后,数量骤减至不到1/2。


一名双币基金的AI投资人终止了四五家大模型企业的投资进程。她告诉36氪,近期他们只看AI应用。


可惜时至今日,AI赛道依然没有一款“杀手级”应用——市场和投资人都在观望,高开的大模型技术是否能持续高走,给予可观的回报。


“CV(计算机视觉领域)好歹也火了一两年,但大模型冷却的速度巨快。”海浪说,“今年大家只是看似拿了很多钱,其实背负了很大压力。”


与赛道一起降温的,还有企业对AI人才的热情。


年初的抢人热,更多的是企业们面对新技术的兴奋和FOMO(Fear of Missing Out,害怕错过)情绪。“大家也不管招这么多人有没有用,先把气氛炒起来。”年初Mia接到的需求,大多没有指明招募人才数量的范围,“一是挖人确实难,二是企业不知道挖多少人。”


精打细算后,企业们逐渐发现,人海战术、跑马圈地的互联网打法并不适用于大模型。


王慧文曾告诉36氪,他觉得搞大模型“人多了反而起负作用”,最小的建制只要30来人。今年7月,马斯克高调宣布入局大模型领域,新公司xAI只有12名成员。


AI人才抢夺战:年初疯狂,年末彷徨


人海战术的反例是Meta——即便拥有Llama和OPT两支明星大模型团队,但由于算力资源分配的不平衡,目前超半数Llama作者选择了离职。


在资源紧俏的大模型领域,缩减人员规模既能如马斯克所说“提高人均可支配资源数量”,也能提高管理效率。王小川在媒体访谈中提到,管理过3000人的搜狗后,发现现在百川只有100、300人,非常容易把效率提上去。


更何况,大模型的研究是亟需才能和悟性的领域,人海战术收效甚微。


“一个聪明的大脑胜过万马千军。”智子引擎CEO高一钊告诉36氪,他们团队自研的多模态元乘象ChatImg 2.0,核心算法编写只用了不到5人。


当大模型人才的供需趋向平衡,企业对AI人才的急切之心,也迅速恢复平静。


“企业基本只要招一个厉害的CTO,或者个位数的技术带头人。”Mia近期接到的招人需求数量骤减。顶级人才的流动,在上半年的“热战”中基本已成定局,而模型团队中剩余的工程师,Mia发现只要用三四十万的年薪,并不难从国内外大厂或者高校计算机专业中挖到。


企业们对AI人才扩张的谨慎,更源于在视觉识别(简称CV)领域发生的那场人才扩张泡沫。


2018年,CV的风口吹起了AI四小龙。当时,估值飙升至60亿美元的商汤,一年内融了20多亿美元。


最后大部分融资都去了哪?答案是挖人。当时,即便是CV方向出身的应届毕业生,不少人年薪也能拿到60万元。


但很快,不少公司发现,CV没有太高的技术壁垒。AI企业To B、To G的业务,很快就被上游的云厂商蚕食。这几年四小龙的难处有目共睹,最早上市的商汤,在2022年每赚一块钱,就要净亏2块。


AI人才抢夺战:年初疯狂,年末彷徨


企业不得不让科学家背上营收指标。2020年以来,海浪能明显感到风向的变化,高校出身的教授变得不那么受欢迎,“大家更需要带过团队、做过产品的人”。一家想要智能化转型的物流企业说得更直接:“我们的钱是一个盒子一个盒子搬出来的,不是发论文发出来的。”


迫于营收压力,不少去大厂研究院的大牛,又回到了高校。海浪发现,此前帮大厂挖角的北美高校出身的华人科学家,重新开始以教授的身份发论文。


几乎所有企业都不希望人才泡沫再次产生。


Llama发布前,由于大模型是个高壁垒的新技术,企业给人才定的绩效并不具体,比如“年末前超越GPT-3.5,未来1-2年超越GPT-4”。但Llama把进度条快速拉到做应用的阶段,人才们的绩效,迅速指向了商业化。


赚钱成了首要指标。Mia下半年接到来自企业的不少需求,从挖人,变成了帮人才做项目管理。


一名硅谷出身的研究员对Mia诉苦:“(企业)不是说好给足空间做研究吗?怎么又要背营收?”Mia脑子转得飞快:“企业方觉得您有能力。”


2023年末,是不少企业和投资人检验人才价值的关键点。


“投资人和创始人都需要先看看,到年底花钱找来的人,能跑出什么东西,再决定是否继续入场。”海浪说。从给title的爽快程度,他能感受到今年企业的谨慎:2018年,帮技术大牛谈个T10、P10以上的岗位并不难。但今年,P9的职级都需要垫脚伸手够一够。


早上六七点起,游一小时的泳,紧接着去实验室工作到晚上9点,然后回去陪家人——这是在卡内基梅隆大学读博时蓝振忠的一天,“从不加班熬夜,也不把工作带回家”。


但在这轮热潮中,蓝振忠破了戒。这位技术老手、创业新手最近主动约见了不少投资人,从头学习管理和战略:“在终场来临前,努力让自己不被市场淘汰。”


(应受访者要求,文中海浪、Mia、Joshua为化名)


文章转载自”36kr“,作者周鑫雨,邓咏仪

关键词: AI , AI照招聘 , AI人才 , AI就业
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner