3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。
阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。
以下内容来自于官方稿件,Founder Park 略有调整。
成立一年,阶跃星辰团队对通往 AGI 的技术路径有深入理解。首先坚定相信 Scaling Law 是方向,参数量决定了模型智能水平的上限。因此 Step-1 千亿参数语言大模型训练成功后,随即开展 Step-2 万亿参数大模型的训练工作。其次是认识到多模理解和生成的统一是通往 AGI 的必经之路。Step-1V 千亿参数多模态大模型,在多模理解上做到了业内领先,一方面验证了 Step-1 语言大模型的能力,另一方面也为多模生成打下一个好基础。
具体来说,阶跃星辰研发的 Step-1 千亿参数语言大模型,在逻辑推理、中文知识、英文知识、数学、代码方面的性能全面超过 GPT-3.5。Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台「司南」(OpenCompass)多模态模型评测榜单中,位列第一,性能比肩 GPT-4V。Step-1V 的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。此外,Step-1V 亦可实现视频理解。
千亿参数模型只是阶跃星辰团队在攀登通用人工智能路上迈出的第一步。此次,阶跃星辰还发布了 Step-2 万亿参数语言大模型预览版,提供 API 接口给部分合作伙伴试用。模型采用 MoE 架构,聚焦深度智能的探索。据了解,参数量从千亿到万亿,增长了一个数量级,对算力、系统、数据、算法四个方面都提出了极高的要求,业内只有极少数公司能做到。训练万亿参数模型体现了阶跃星辰的核心技术能力,也说明了公司探索通用人工智能的决心。
当下,模型能力决定了 AI 应用水平的上限,同时也将创造全新的应用机会。阶跃星辰在此方面通过自有产品和合作产品两种方式,展开了积极探索。团队研发并推出了两款面向 C 端用户的大模型产品——效率工具跃问和 AI 开放世界平台冒泡鸭,均已全面开放使用。
此外阶跃星辰在金融、网络文学、知识服务等领域已与合作伙伴达成深度合作,共同探索面向 C 端用户的创新应用。在金融领域,阶跃星辰与上海报业旗下界面财联社达成深度合作,双方围绕 AIGC 财经资讯、智能投研、智能投顾等领域推进大模型的应用落地。
在网络文学领域,阶跃星辰与中文在线独家达成深度战略合作,共同探索大模型在灵感激发、内容创作等网络文学创作领域的应用。在知识服务领域,阶跃星辰与中国知网、中文在线达成战略合作,围绕大众知识服务等场景研究和推进大模型的应用。
当下,大模型技术的研发和落地应用仍在快速迭代和探索中,围绕这一前沿技术,聚集了最顶尖的人才与丰厚的战略资源,无疑是科技发展的焦点所在,在这样的大环境下阶跃星辰从幕后走向台前,正式亮相并发布了一系列重要模型与产品,坚定地释放出一种信号,实现通用人工智能或许并不遥远,「智能阶跃,十倍每一个人的可能」。
阶跃星辰成立于 2023 年 4 月,聚集了多位微软系顶尖人才。其创始人和 CEO 是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士,核心创始团队包括系统负责人朱亦博博士和数据负责人焦斌星博士。
姜大昕博士是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验;朱亦博博士拥有多次单集群万卡以上的系统建设与管理实践经验;焦斌星博士此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和 NLP 算法优化索引和搜索质量。
阶跃星辰自成立起,在算力、系统、数据和算法这四大要素上综合布局,坚定投入攀登 Scaling Law。这是必须坚持但极其艰巨的任务,阶跃星辰团队因此聚集,在通用人工智能领域开启了一场追赶 OpenAI 的竞逐。
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
本文来源于财联社 ,作者毛明江、黄心怡