ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
8020点击    2024-07-28 21:35

最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。



杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。


她在达摩院期间领导了通义千问前身M6大模型的研发,是M6大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式OFA-M6”的开发。


任职字节期间,她主要负责大模型研发,向字节AML和豆包大模型Foundation团队负责人项亮汇报。


今年5月,杨红霞被曝从字节跳动离职,有传闻称她将进行大模型领域创业


如今,更先一步曝光了她进军学术圈的消息。


此前杨红霞未曾在高校内有正式任职,仅担任过浙江大学上海高级研究院兼职教授。


通义千问奠基人物


杨红霞本科毕业于南开大学统计学专业。博士就读于杜克大学。


在顶级会议和期刊上发表论文100余篇,在美国和中国拥有50多项专利。


主要研究方向为贝叶斯统计、时间序列分析、时空建模、生存分析、机器学习、数据挖掘及其在商业分析和大数据中的应用。



博士毕业后,她最先在IBM T.J.沃森研究中心担任研究人员。之后来到雅虎担任计算广告首席数据科学家,负责开发广告投放预测相关算法。


2016年,杨红霞回国入职阿里巴巴,就职于达摩院智能计算实验室。


在此期间她最重要的工作是推动了M6大模型的研发和扩展。


这一多模态模型是通义千问的前身,也是构建阿里当下大模型竞争力的关键基础工作。



M6项目在启动研发1年时间左右,快速完成从亿级到十万亿级规模扩展。2020年6月项目启动,2021年5月发布万亿参数规模M6并投入使用,2021年10月M6正式成为全球首个10万亿参数多模态大模型。


不仅成为当时世界上最大的中文多模态模型,并且快速追赶上谷歌的发展脚步,在文生图、商业化等领域达到世界一流水平。而且在绿色低碳方面,相比GPT-3,M6实现了同等参数规模下所需能耗仅为1%。


这项工作由阿里和清华共同开发,杨红霞、唐杰共同担任通讯作者。



其他主要成员,正是通义千问研发的核心成员,比如An Yang、Rui Men。


M6的共同一作林俊旸是目前通义千问开源负责人。


2022年9月,达摩院正式发布“通义”大模型系列,打造业界首个AI通义底座,并构建了大小模型协同的层次化人工智能系统。


其中统一底座的M6-OFA模型由杨红霞领导完成。


它在业界首次实现模态表示、任务表示、模型结构统一。不引入新增结构,单一模型就可以同时处理超过10项跨模态任务,升级后可以处理超过30种。


这项工作对外开源,目前被引用数超过900+,GitHub星标2.4k。



而就在这项重磅发布1个月后,杨红霞被曝因家庭原因从达摩院离职。


下一次新动向已是2023年3月。


消息称她已加入字节AML(机器学习系统)团队,任字节跳动大语言模型研发技术专家,在美国西雅图从事大语言模型的研发。


不过短短1年时间,她就又从字节离职。与此同时,行业的风向也从基础大模型开发,逐渐转向更细分的应用落地方向。


同步筹备全球化AI项目


值得一提的是,此前杨红霞的下一站被猜测是“端侧模型创业”,布局AI Agent


5月消息称,团队正在筹备组建中,已获得3000-4000万美元投资,投后估值1.5亿美元。


最近量子位从知情人士处获悉,杨红霞前不久还在西雅图筹备全球化AI项目。


综合来看,杨红霞入职香港理工大学,可能和创业动作并不冲突。


值得一提的是,从事更具体的AI细分领域大展拳脚,确实是目前AI人才再创业比较集中的选择。


比如漆远的创业方向选择了可信大模型。从蚂蚁集团副总裁任上离职后,漆远先是重返学界,在复旦担任教职,而后又产学研并行地创立了大模型公司无限光年


此前,量子位从市场获悉更多消息如下:



如上或有缺漏与误传,欢迎评论区留言指正、分享更多行业信息。


文章来源于“量子位”,作者“关注前沿科技




AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md