在今天揭幕的 2024 世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)上,阶跃星辰首发了三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。
自今年三月正式公布以来,Step 系列通用大模型在短短 100 天左右实现了从千亿参数到万亿参数,从语言模型到多模态模型,从理解到生成的全面进步。
同时,阶跃星辰还重点展示了面向 C 端用户的自研大模型应用产品,并披露了在大模型生态合作领域的最新进展与计划。
文章转载自「阶跃星辰」官方文章,Founder Park 略有调整。
万亿+多模
全面升级通用大模型底座能力
今年三月,阶跃星辰首次亮相,公布了 Step 系列通用大模型的研发进展。今天,阶跃星辰宣布对 Step 系列通用大模型家族进行全面升级。
最新发布的 Step-2 万亿参数语言大模型正式版,采用了创新的 MoE 混合专家模型架构。同时,基于阶跃星辰行业领先的系统能力,Step-2 大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近 GPT-4,企业和开发者可以通过阶跃星辰开放平台(https://platform.stepfun.com)申请体验。
此外,阶跃星辰还公布了其在多模态大模型研发领域的多项进展。
新升级的 Step-1.5V 千亿参数多模态大模型,在图像感知和理解能力上全面提升,并具备出色的视频理解能力。它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。在 Step-2 万亿参数大模型的加持下,Step-1.5V 推理能力大幅增强,能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务。
Step-1.5V 的发布,体现出阶跃星辰在多模态大模型领域取得了突破性进展。同时,它标志着阶跃星辰在极短的时间内,实现了从图像理解到视频理解的跨越升级。
新发布的 Step-1X 图像生成大模型,则代表了阶跃星辰在推动多模态理解和生成统一的技术路线上取得重要进展。它采用全链路自研的 DiT(Diffusion Models with transformer)模型架构,支持 600M、2B、8B 三种不同的参数量,能够满足不同场景的需求。
Step-1X 具备更加强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,更具中国风格。此外,阶跃星辰团队还针对中国动画 IP 进行了视频生成能力的技术展示。
阶跃星辰创始人、CEO 姜大昕博士表示:“攀登 AGI 山峰,‘万亿参数’和‘多模融合’缺一不可。万亿参数规模,是实现 AGI 的基础门槛;多模态大模型,是通向 AGI 的必经之路。面向未来,我们会继续将模型做大做强,打造超级模型,同时让模型服务于工作和生活,十倍每个人的可能。”
自研+生态
加速推动大模型产品应用落地
阶跃星辰在 WAIC 现场展示了面向 C 端用户的自研产品,以及与行业头部公司在促进大模型生态应用方面的最新成果与计划。
智能助手——“跃问”(https://yuewen.cn)和 AI 开放世界平台——“冒泡鸭”(https://maopaoya.com),是阶跃星辰面向 C 端用户推出的两款自研产品。
基于 Step 系列通用大模型的强大能力,“跃问”能准确地描述和理解图像中的文字、数据、图表等信息,出色地完成内容创作、逻辑推理、数据分析等任务。
“冒泡鸭”则打造了一个全新的 AI 开放世界。在这里,用户可以探索故事、创作角色,沉浸属于自己的开放世界。
同时,阶跃星辰宣布在金融财经、内容创作、消费娱乐等领域,与众多合作伙伴达成了深度合作,共同探索面向 C 端用户的创新应用。这其中包括:
此外,阶跃星辰宣布推出开放平台——“繁星计划”,投入优质资源扶持多模态领域优秀的初创企业与独立开发者团队,共同加速 AI 大模型技术在各类场景的应用落地。面向未来,阶跃星辰将继续与广大开发者和合作伙伴携手,探索AI应用落地的创新与实践。
文章来源于:微信公众号Founder Park