# 热门搜索 #
搜索
中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o
8935点击    2024-05-26 11:56


在通用大模型的时代浪潮中,中国移动,勇立潮头,不落人后!


5月24日,在第七届数字中国建设峰会中国移动人工智能生态大会「AI赋能,智筑国基」主旨论坛上,中国移动发布了最新自研的「九天」千亿多模态基座大模型。



凭借自主研发与行业积累,「九天」基座大模型堪称「国内最值得信赖、最懂行业」的全栈大模型。


和其他企业不同,央企做大模型,是面向国民经济骨干行业,目的是给国家基建转型赋能,「为产业注智,为国家筑基」。


中国移动,当得起一句「央企人工智能领头羊」。


AI电聊对接会议,遇难题自主寻求人类帮助


GPT-4o发布当天,向所有人展示了强大的AI语音助手能力,将电影「Her」中的Samantha带入现实。


而中国移动现场的直播演示,一点也不输OpenAI。


九天·九九


首先上场的「九天·九九」,是一个定制化的个人助理。


两位童鞋向在场所有人展示了,真正的AI助理,如何让主人们效率倍升。


一边是小天,一边是九九。


小哥向自己的助手「小天」提问:「我有点紧张,怎么办」?


暖心的小天开始为小哥出招,并为他加油打气。



旁边女生的助手「九九」则帮她生成了「3道关于二次函数的初中数学题」,并且在后续的追问下给出了详细的解题步骤,分分钟搞定初中生的指导。



接下来,九九还生成了一张六一儿童节的图片,以「九天蓝」为背景。



最后,九九还完成了一个非常实用的功能:告诉它自己的时间计划,它就可以帮忙安排日程了,比如把后天上午9点的一个会议加入议程。



更厉害的是,小天和九九这两个AI助手,直接在现场互通电话对接起了开会需求,完全没有主人们的事儿了。



九天·善学


另一个在演示中登场的,是「九天·善学」。


作为一个基于知识数据和专家指导的产品,它可以协助我们进行专业的行业分析或产业洞察。


而且,如果我们有一个待完善的工作,也可以驱动模型与专家对话来进行修正。


比如它在撰写方案时遇到了一个网络运维方面的问题,会主动开始询问人类专家。



在两位专家给出建议后,它就可以自动进行相关的更新和修改。




九天·网络


「九天·网络」则向我们展示了复杂系统如何完成全局的智能感知。


演示过程中,杭州亚运会场馆以及周边区域被3D复刻到了孪生数字世界,而且对通信网络的信号覆盖范围进行了可视化的渲染。



基于此,「九天·网络」可以感知网络状态、设备状态以及用户体验。


全局的监测和感知结果也可以用可视化的方式呈现出来,信号的光圈使各处的网络状态清晰可见,在下面的图片中,黄色区域表示信号比较好、红色是信号比较拥堵的地方,甚至可以追踪路上的某一个人,从用户个体的角度出发进行分析。



运维人员在检查设备时可以戴着AR眼镜,视觉监测能力可以协助分析设备情况,并直接将分析结果叠加在运维人员的视觉范围中。



此外,也可以让远程专家参与进来,对设备的检修、维护进行指导。



千亿参数+多专家架构


以上所展现的产品和能力,全部来自中国移动「九天」千亿多模态基座大模型的加持。


而要实现如此复杂且智能的基座大模型,就需要在模型架构和参数规模上不断进行技术突破。


中国移动从2013年起就已经开展人工智能的自主研发,在同一领域深耕十年、持续积累,让「九天」大模型取得了技术领先的地位。



「九天」基座大模型采用纯解码与多专家相结合的架构,创新了模型的学习方式——通过结构化数据建模,进行渐进式学习。


模型的参数量,从曾经的十亿、百亿不断攀升至最新千亿级别。


为适应不同的应用场景,「九天」提供1.5B、3B、7B、13.9B、100+B等不同参数量的模型版本,可灵活部署于各种设备和平台。


不仅如此,中国移动还在酝酿下一步更大的训练计划,将数据集规模从5万亿提升至20万亿token,进一步提升模型能力。



有如此前沿的架构和庞大的参数量,「九天」在国际竞赛中的表现可谓是十分突出:


在语音合成领域,在2024年INTERSPEECH语音合成声码器赛道中获得国际第一名。



视觉评测方面也同样出色,获得2023年CVPR VSS(视觉语义分割)赛道中视觉理解方面的第一名。



对照MME-P榜单,「九天」基座大模型的生成能力相当于全球第9名的水准。



除了竞赛成绩喜人,各类测试中的评测结果也十分优异。


我们熟知的多语言理解MMLU、编码HumanEval、数学GSM8K基准中,「九天」基座大模型都取得了不俗的表现。


还有在中文C-Eval、MBPP、BBH基准上,基座大模型取得了领先的优势。



此外,在11个行业领域,中国移动对基座模型展开了124个细类,多达8万多道大学考试或职业资格考试题的测试,结果如下图所示。


「九天」基座大模型在11个领域均拿下了最高成绩。



这些发布会上的「智能」表现,以及竞赛和测评中令人印象深刻的成果,完全配得上它「最懂行业」的定位。


复杂系统智能化


作为全栈大模型,「九天」让自己的能力面向各种复杂行业需求,提出了「复杂系统智能化」的理念,旨在为产业「注智」。


大模型的「智能」说起来容易,但实现起来却很困难,需要攻克许多的难题和壁垒。


为了实现面向复杂系统智能化,中国移动集团首席科学家冯俊兰等专家,做了大量的工作。


如果说AI是一个大海,现在的智能还仅仅停留在表面。想要走向深水区,除了推理、生成、推理这些通用能力,还需要对复杂系统进行感知、预测、诊断、控制和决策。


大部分复杂系统,都是一个混沌的系统。怎样才能从微观走向宏观,从混沌走向清晰?



这就需要结构化的数据。因为在复杂系统中,会有大量的设备,大量的数据。


此外,还有多信源的数据,让AI可以看我所看,为我所为,听我所听。


怎么去表征好这些信号,和通用的模态数据进行融合,就是复杂系统实现真正AI的关键。


总的来说,复杂系统智能化需要解决两大问题:一是大而不稳,二是多而不合。


为此,中国移动在「九天」基座大模型的研发过程中使用了多种策略和技术,包括多层信息加固、溯源信息场一致性校验、大小模型协同等。



这几种技术的结合使用,将「九天」模型打造成为面向「原子化任务」的智能体。


不仅有当下前沿大模型的理解、生成、推理能力,还以此为基础,进一步延展出感知、预测、诊断、控制、决策等更加「类人」的能力。


从每个行业的微观数据到泛行业模型的宏观生态,从混沌、复杂的问题中提取清晰、简单的解决路径,这就是「复杂系统智能化」想要实现的目标。


打通模态信源


「九天」之所以将自己定位为通用的「全栈」大模型,原因之一是打通了各个模态之间的隔阂,实现复杂的大模型系统在「全模态」之间的智能化推理。


不仅包含语音、语言、视觉这些常见的模态,而且囊括了结构化数据,让模态的设计都更加匹配各行各业中的落地场景。


另一个原因在于,中国移动发挥自己在通信领域的龙头地位,让大模型可以在各种信源和设备上灵活部署。


当前的大模型由于参数过大、设备兼容性低等原因,一般只能在服务器或PC端进行推理,但能够提供云边端全面服务的中国移动表示不服。


「九天」大模型不仅可以部署在常见的移动电子设备和物联网传感设备上,比如智能手机、平板、汽车和穿戴设备,还能应用于各种复杂信源,包括雷达、红外、声波、无线射频等等。



这些复杂信源虽然人类难以感知,但对工业生产、通信、服务领域的一些支柱性行业至关重要。


对多种信源的强大适配能力,让「九天」轻松走入各行各业的场景,快速落地应用。


聚焦骨干行业


国内外市场上大模型层出不穷,为什么只有「九天」敢宣称自己「最懂行业」?


从模型定位、训练数据到AI生态、应用场景,「九天」的研发团队始终没有忘记自己「聚焦行业」的初衷——


让最前沿的AI模型服务于骨干行业的技术革新,服务于国家基础设施的智能转型。



因此,「九天」定位为面向复杂行业系统,要在政府治理、工业生产、民生服务、通信特色这四大领域发挥重要作用,提供基座模型。


从训练开始,「九天」基座模型就与行业紧密相连——不仅集成通信、能源、建筑、交通等八大行业的专业知识,而且行业数据在所有预训练数据中的占比达到10%,超过了所有国内和国际的同行。



另外,对于结构化数据的处理,就着重考虑了营销、出行等行业应用,增强了模型的网络智能化实战经验,较传统手段有10%-15%的提升,解决了大模型无法准确处理结构化数据的难题。


在视觉理解领域,训练数据就包含了7000万路视联网,以及200亿+咪咕图、文、视频等行业特色数据,让模型不仅「看得清」、「看得懂」,而且「看得准」。


在「九天」基座模型的基础上,中国移动已经建立了一整套面向全行业的大模型体系和AI生态,共开发出15款行业大模型。



全面支持自主生态


作为AI行业的「国家队」选手,中国移动站在AI技术的浪潮之巅,用实际行动表明了独立自主研发的决心,显示了央企应有的担当。


在研发「九天」大模型体系的过程中,研发团队同时致力于在算力、芯片、框架、算法等领域实现AI生态的「国产化」。



在芯片层面,「九天」系列大模型解决了一大训练难题——在异构芯片之间转换。


在11个厂家生产的17款不同芯片上,团队完成了适配、迁移、测试和标准拉齐等一系列工作,从而支持模型在异构芯片间平滑转化和继续训练。


为了助推国内AI产业加速发展,中国移动还提出了「万千百」智能基座计划,打造「万卡大算力、千亿大模型、百汇大平台」。



在算力层面,中国移动将建成3个两万卡智算中心和12个区域智算中心。


目前,已经在呼和浩特建成的超大单体智算中心,规模超越了全球范围内所有运营商,成为央企「十大超级工程」之一。


随着AI大规模落地,对推理算力需求激增,中国移动还将全面升级已经部署的1500个边缘计算节点,提升训推算力资源配比达到1:10,即1卡训,10卡推。


年底,全网大模型训练卡规模将达到新的水平。



其次,中国移动还将升级算网大脑新中枢,并构建数联网的新保障。


「百汇大平台」上,还会汇聚丰富的大小模型、数据集及AI原生应用,集模型体验、下载、调优、部署、应用、测评等多种功能为一体,为创业者和开发者提供「一站式」服务平台。


模型安全可信


「九天」系列大模型之所以「值得信赖」,不仅体现在支持国产化的自主研发,还根植于对模型安全性的高标准、严要求。


为了解决大模型在应用中面临的「遗忘」、「幻觉」等共性痛点,团队在训练中应用了知识升维融合、持续动态学习等关键技术。


此外,模型还配备了完善的数据安全、系统安全等保障机制,真正达到安全、可信、可控。


这种对于安全性的执着追求,最终得到了官方的认可。


「九天」自然语言交互大模型同时通过了「生成式人工智能服务备案」与「境内深度合成服务算法备案」,成为首个央企研发的完成双备案的大模型。


在中国软件测评中心开展的测试中,「九天」大模型也获得了最高等级(A级)的安全性认证。



十年磨剑,跨越式发展


在一系列卓越的成就背后,是整个集团创「世界一流信息服务科技创新公司」和勇担国家科创重任的雄心,以及研发团队十年如一日地努力前进、力争上游的决心。


IEEE Fellow、中国移动集团首席科学家冯俊兰博士是整个AI领域的领头人。



她在2013年9月加入了中国移动研究院,也就是那个时候,这家运营商已经嗅到AI的未来潜力。


十年间,冯俊兰博士带领团队在AI技术研发上一步步筚路蓝缕、稳扎稳打,亲历了公司在AI领域实现「跨越式」发展的全过程。



如今,中国移动成立了「九天」人工智能研究院,引入2名千人专家、超150个AI 专业博士,形成2000人AI核心团队,开展了人工智能基础技术、算法、平台、应用的全栈研发,具备了大模型数据构建、预训练、微调、推理等全链路技术的自主创新能力。


在去年,中国移动相继发布了「九天·客服」、「九天·海算政务」、「九天·网络」等垂直行业大模型,以及面向骨干行业开放共建的「九天·众擎基座大模型」,在大模型赛场上发出了响亮的央企声音。


除了发布的产品和模型,中国移动还取得了丰硕的科研成果——原创性提出了体系化人工智能(Holistic AI)技术,受到产学研各界的广泛认可和支持。



荣获中国通信学会科技进步奖一等奖,申请超过930项专利,发表160余篇顶会顶刊论文 ,并在约20个大型国际竞赛中取得TOP 5的成绩。


展望未来,正如这次大会的主题「AI赋能,智筑国基」,中国移动将肩负AI「国家队」的使命继续前行,把AI领域最前沿的进展带入千家万户、千行百业。


文章来源于“新智元”,作者“新智元


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

4
无人直播

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales