# 热门搜索 #
搜索
GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
8933点击    2024-05-19 16:39

GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天:


领衔者,是DALL·E 2/3研究团队成员、Scaling Law共同提出者。


更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人


这里的“新人”,可能是本科or硕博刚毕业的应届生,也可能是刚加入OpenAI的新成员。


恰如其时的,思维链作者、从谷歌跳槽OpenAI的Jason Wei跳出来,分享了公司内部派活儿的原则:


派给你的活,绝不与你的职级挂钩


换句话说,即使是初级工程师,只要有想法,就可能被OpenAI委任承担大项目。


而且任命前的评判纯粹根据员工执行表现来,而不是考虑过去这人有过啥优秀业绩。


Jason Wei说,他在OpenAI见过几位毕业不久的工程师,在内部揽了一个重要的大活,他那时候心想,“哇,要是谷歌,这不得让L8/L9的员工来搞?”


好一个任人唯贤!


网友看后感慨万千,感慨OpenAI这样独角兽中的超级独角兽,就是需要这股子劲。


给这样的团队2-3年,你会看到他们带来的惊艳表现。



具体情况,咱们来扒一扒就清楚了——


做出伟大产品的年轻团队们


本次吃瓜活动,就从最近万众瞩目的GPT-4o背后团队(以下简称Omni团队)下手吧。


Omni团队负责人,印度小哥Prafulla Dhariwal(下面我们叫他PD哥)


你可能不咋熟悉他的名字,但一说他的前作你大概率都认识:DALL·E 2、DALL·E 3、一致性模型,还共同提出了Scaling Law。


谷歌学术显示,这哥的论文引用次数超过了72500次,还在不断上升中。



想当初,PD哥是以本科毕业生的身份加入OpenAI的,虽然这个本科是MIT(手动狗头)


他在MIT主攻计算机科学、数学、物理学,并在MIT大脑、思维和机器中心担任本科生研究员。


据PD哥自我介绍,本科毕业前,他就已经在成立不到1年的OpenAI实习了,然后2017年毕业后正式转正。


我们整理发现,入职前半年,他就参与了Openai baselines的团队项目。


然后次年成为了Glow的共同作者,接下来更是共同提出Scaling Law,参与研究DALL-E 2、DALL-E 3、一致性模型等等等等。


过去的18个月里,他领衔了GPT-4o的工作。


项目面世后奥特曼狂赞他,说如果没有PD哥的远见,以及长期以来才智、信念和决心,就没有GPT-4o。


OpenAI总裁Greg Brockman也说,多亏PD哥“建立全能大模型”的信念,团队才最终搞定了GPT-4o。


夸得太卖力,一下就把PD哥推到了聚光灯下。



GPT-4o项目负责人Prafulla Dhariwal


PD哥自己在推特表示,GPT-4o是他们团队推出的第一个模型,也是OpenAI首个原生多模态大模型。


经由PD哥在推特对团队在线点名致谢,我们发现Omni团队里有6位(疑似)华人面孔。


  • Yu Zhang:加入OpenAI 8个月;此前在Google DeepMind工作6年。他本科毕业于上海交通大学计算机专业。


  • Huiwen Chang:加入OpenAI 1年;此前在Google呆过5年。她的学士学位是在清华大学姚班取得的。


  • Li Jing:加入OpenAI 2年,曾是Dall-E 3、Sora团队成员。本次负责保障GPT-4o的图像生成、3D生成的能力。本科时,Jing在北大获得物理学学士学位。


  • Jiahui Yu:加入OpenAI 3年8个月,现带领OpenAI感知团队;入职前参与过Google的Gemini、PaLM 2项目。Yu本科时就读于中国科技大学少年班,学习计算机。


  • Casey Chu:加入OpenAI已有4年,参与过GPT-4、DALL・E 2的研究。


  • Mark Chen:加入OpenAI 5年8个月,现任前沿研究主管,曾参与过DALL・E、GPT-4等项目。

当然,Omni团队背后还有大批共同参与者的努力。但就从上述几个人的资料来看,里面既有老手,也有OpenAI新来的员工,并不会因为司龄低,就不给派重要的活。


为了佐证这一点,我们又往前再扒了扒,看看之前的项目是否如此。



看看今年春节发布的Sora


Sora由两位博士应届生带队研究,这可称为佐证Jason Wei分享的OpenAI用人秘籍的典范材料。


两位负责人,Tim BrooksWilliam (Bill) Peebles都是2023年刚刚博士毕业,团队里甚至还有00后成员。


其中,Tim是DALL-E 3作者之一,而William (Bill) Peebles则和谢赛宁合作,搞出了Sora的技术基础之一DiT。



带队Sora的Tim(左)和Bill(右)


看看2020年发布的Jukebox。


这是一个在原始音频域中通过唱歌产生音乐的模型,参与人员就有我们刚入职没两年的PD哥


当初没掀起什么水花,但着实为现在的GPT-4o培养了音频人才,成为了OpenAI奔赴「Her愿景」的基石之一。


看看2018年发布的GPT-1。


一切故事都开始都源于万神之源《Attention is All You Need》论文的出现。论文发表当天,OpenAI刚刚离职的前首席科学家Ilya Sutskever,就意识到“它给了我们想要的一切”。


然后建议同事Alec Radford开始动手研究——彼时距离Alec加入OpenAI才不到2年,也是个本科生。


结果就是,Radford开发了GPT的原型,然后OpenAI调动更多人从机器人、DOTA游戏等项目转型,参与进来开发了GPT-1、GPT-2……


OpenAI沿着这位本科生主导的佳作,开创了今日盛世。



GPT-1论文主力Alec Radford


OpenAI原来是这样


不只是成员履历,其实从OpenAI的组织架构上,就能感知到他们这种任人唯贤的扁平化管理方法


最明显的是,OpenAI的研究员,大家都叫Member of Technical Staff,没有啥称呼上的差异。


怪不得有网友调侃,OpenAI说初级工程师也能抗大活,但可能你们就没有初级工程师啊……



Greg曾透露,他们曾认真考虑用哪种职位名称,因为不想简单将他们归为研究人员和工程师。


“Member of Technical Staff”这一说法继承自施乐帕克研究中心Alan Kay的建议。



而且整个OpenAI的部门划分也没有很精细,只有数据科学、研究、安全等几个大部门。


但其实不管GPT-4、DALL·E、Sora还是最新的GPT-4o,全部都是项目制的


整个团队从各个部门抽人组建,搭伙干活。


讲道理,在OpenAI,项目归属感可能比部门归属感更强。



除了OpenAI,现在很多科技公司和领导人,包括像马斯克xAI在内也都在按这套方法在搞。


现在,随着Omni团队的揭秘,关于OpenAI组织架构和评判标准再次被讨论。


有网友对这种方式表示赞赏,“也是为什么我确信创始团队是应届毕业生的新出路”。


当前的市场环境下,这是满足这种雄心壮志的最佳途径,在传统稳定领域想要获得指导和成长变得十分艰难。



就像Jason Wei所说,据他观察,一般大公司会对项目有一个隐隐的期望,所以会按职级划分工作内容,项目一般都是自上而下分配的。


重要项目通常派给此前工作表现突出的“值得信赖的”L7或L8,这能保证团队有组织、高可靠性地完成工作。


但是对于一个等待大展拳脚的初级工程师来说,想要他遵守一些无关痛痒的条条框框?


不可能,绝对不可能。指望我把活干好不就完事儿了!



虽然这也是许多公司在初创期的通用做法,但事情因OpenAI这次发布Gpt-4o再次曝光后,更多网友开始触景生情,破防了!


顺便再蛐蛐一下自家公司的成长体系:


别说了,羡慕


网友自曝其他大厂不这样


一位曾在微软工作的“独立黑客”自述了此前一段伤心经历。


他本来负责一个十分具有挑战性的功能,已经做了所有前期工作,也得到设计部门的认可。但随后就被要求交给一个高级工程师。因为这个工作不符合“职级要求”。


微软的管理者都精于算计(象棋高手),他们晋升的人选都是事先决定好的,合适的项目会分配给那个人,以证明晋升的合理性。




来自谷歌的现员工和前员工们也表示,谷歌在这方面确实做的很糟糕,就是在Gemini时代也没有改善。



初级企业的层级结构扁平化,可以有更大的创新空间。



因此也有人在警示OpenAI“在这方面需要加强很多工作”,有前车之鉴在此。



这样的警示并非没有依据。


事实上如今OpenAI飞速发展,人才规模迅速扩展,已经开始出现一丝丝不好的“苗头”。


ChatGPT发布会之后,OpenAI一度成为全球AI人才向往的圣地。包括像斯坦福、MIT等顶尖学术机构,微软、谷歌等顶级大厂的人才涌入。


但这当中,有不少研究类人才来了没过多久又走了,留不住。


典型如OpenAI创始成员、前特斯拉AI总监Andrej Karpathy,2023年ChatGPT发布后二进宫;又在一年之后再次离开,如今正在秘密开发一个项目。



还有又回到谷歌担任DeepMind研究科学家的Shane Gu,仅仅只在OpenAI待了7个月,其中带领团队进入了日本市场。在此之前他曾在谷歌待了四年。



2022年5月Shane Gu参与的研究发现,只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%,引发学术界轰动。



还有其中DeepMind老员工Jack Rae,曾就压缩即智能在Stanford MLSys Seminar发表演讲。


此前在OpenAI工作一年多时间,今年7月份从OpenAI跳回到谷歌,他可能是唯一一位对GPT-4和Gemini都有贡献的人类了。


现在OpenAI掀起新一波离职潮,且大部分都是技术团队的人才,甚至随着灵魂人物、首席科学家Ilya官宣离职而加剧,超级对齐团队负责人也紧随其后辞职。


而另一面,关于产品、营销方面的人员加入。最新消息,他们还挖来了谷歌搜索广告业务的21年老将。


再加上,如今频繁的产品级更新、搜索引擎的布局以及同苹果Siri的合作……更多商业化操作不一而足,OpenAI和奥特曼的野心由此可见。


在这样的情况之下,OpenAI是否还能持续保持领先?


一起来评论区讨论讨论呗~


文章来源于“量子位 ”,作者“关注前沿科技 ”






关键词: GPT-4o , Sora , AI , chatGPT , openai
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/