阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

8539点击 2024-07-28 21:35

最新消息，阿里大模型元老杨红霞入职香港理工大学，任电子计算机系教授。

杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员，并在雅虎担任首席科学家。2016年加入阿里巴巴，就职于达摩院智能计算实验室；2023年3月入职字节跳动。

她在达摩院期间领导了通义千问前身M6大模型的研发，是M6大模型从百亿、千亿参数量进化到万亿规模的主要功臣，并领导通义大模型核心技术“统一学习范式OFA-M6”的开发。

任职字节期间，她主要负责大模型研发，向字节AML和豆包大模型Foundation团队负责人项亮汇报。

今年5月，杨红霞被曝从字节跳动离职，有传闻称她将进行大模型领域创业。

如今，更先一步曝光了她进军学术圈的消息。

此前杨红霞未曾在高校内有正式任职，仅担任过浙江大学上海高级研究院兼职教授。

通义千问奠基人物

杨红霞本科毕业于南开大学统计学专业。博士就读于杜克大学。

在顶级会议和期刊上发表论文100余篇，在美国和中国拥有50多项专利。

主要研究方向为贝叶斯统计、时间序列分析、时空建模、生存分析、机器学习、数据挖掘及其在商业分析和大数据中的应用。

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

博士毕业后，她最先在IBM T.J.沃森研究中心担任研究人员。之后来到雅虎担任计算广告首席数据科学家，负责开发广告投放预测相关算法。

2016年，杨红霞回国入职阿里巴巴，就职于达摩院智能计算实验室。

在此期间她最重要的工作是推动了M6大模型的研发和扩展。

这一多模态模型是通义千问的前身，也是构建阿里当下大模型竞争力的关键基础工作。

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

M6项目在启动研发1年时间左右，快速完成从亿级到十万亿级规模扩展。2020年6月项目启动，2021年5月发布万亿参数规模M6并投入使用，2021年10月M6正式成为全球首个10万亿参数多模态大模型。

不仅成为当时世界上最大的中文多模态模型，并且快速追赶上谷歌的发展脚步，在文生图、商业化等领域达到世界一流水平。而且在绿色低碳方面，相比GPT-3，M6实现了同等参数规模下所需能耗仅为1%。

这项工作由阿里和清华共同开发，杨红霞、唐杰共同担任通讯作者。

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

其他主要成员，正是通义千问研发的核心成员，比如An Yang、Rui Men。

M6的共同一作林俊旸是目前通义千问开源负责人。

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

2022年9月，达摩院正式发布“通义”大模型系列，打造业界首个AI通义底座，并构建了大小模型协同的层次化人工智能系统。

其中统一底座的M6-OFA模型由杨红霞领导完成。

它在业界首次实现模态表示、任务表示、模型结构统一。不引入新增结构，单一模型就可以同时处理超过10项跨模态任务，升级后可以处理超过30种。

这项工作对外开源，目前被引用数超过900+，GitHub星标2.4k。

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

而就在这项重磅发布1个月后，杨红霞被曝因家庭原因从达摩院离职。

下一次新动向已是2023年3月。

消息称她已加入字节AML（机器学习系统）团队，任字节跳动大语言模型研发技术专家，在美国西雅图从事大语言模型的研发。

不过短短1年时间，她就又从字节离职。与此同时，行业的风向也从基础大模型开发，逐渐转向更细分的应用落地方向。

同步筹备全球化AI项目

值得一提的是，此前杨红霞的下一站被猜测是“端侧模型创业”，布局AI Agent。

5月消息称，团队正在筹备组建中，已获得3000-4000万美元投资，投后估值1.5亿美元。

最近量子位从知情人士处获悉，杨红霞前不久还在西雅图筹备全球化AI项目。

综合来看，杨红霞入职香港理工大学，可能和创业动作并不冲突。

值得一提的是，从事更具体的AI细分领域大展拳脚，确实是目前AI人才再创业比较集中的选择。

比如漆远的创业方向选择了可信大模型。从蚂蚁集团副总裁任上离职后，漆远先是重返学界，在复旦担任教职，而后又产学研并行地创立了大模型公司无限光年。

此前，量子位从市场获悉更多消息如下：

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

如上或有缺漏与误传，欢迎评论区留言指正、分享更多行业信息。

文章来源于“量子位”，作者“关注前沿科技”

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

关键词: 阿里大模型 , AI , AI创业 , AI人物 , 通义千问

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md