# 热门搜索 #
搜索
QQ音乐与元象XVERSE合作推出 lyraXVERSE 加速大模型,助力AI小琴
5383点击    2023-10-25 09:36

今年8月7日,元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B。


XVERSE-13基于标准Transformer结构,在1.4万亿高质量、多样化tokens的训练数据上,从零训练(train from scatch)了130亿参数大模型,支持40多种语言,上下文窗口大小为8192。具有文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等多方面能力。


今天最新消息,元象 XVERSE 与腾讯音乐合作推出 lyraXVERSE 加速大模型,将应用于音乐助手 “AI 小琴” 中。用户可以通过点击 QQ 音乐上的 “AI 一起听” 按键来与升级版的 “AI 小琴” 互动,她将根据用户的提问、播放习惯和心情提供闲聊、推歌、音乐解读和词曲创作等服务。lyraXVERSE 是基于元象高性能大模型 XVERSE-13B 与腾讯音乐天琴实验室的 MUSELight 框架的联合推出,也 XVERSE-13B 的 “最快版本”。该模型已全面开源,支持免费商用。该大模型通过提升问答、聊天和创作能力,使 AI 助手具备更高的情商和智商,为用户提供个性化、深入的音乐互动体验。lyraXVERSE 大模型的应用能够显著提高运营效率和用户体验,运营成本减少,聊天响应速度更快,回复更准确深入。此外,歌手相关的回复准确性提升 50%,用户聊天深度增加 33%。





QQ音乐能够和元象合作,侧面也说明了元象通用大模型XVERSE-13B的优秀性能。


展开来说,XVERSE-13B在训练预料方面构建了一个高达1.4万亿高质量、多样化tokens的训练数据集,同时优化采样策略和数据组织方式,让模型支持中、英、俄、西等40多种语言,并且多语言任务处理的性能与效果俱佳。


XVERSE-13B支持8192的上下文窗口,是同尺寸模型中最长的,从而能出色应对复杂场景,比如更长的多轮对话、知识问答与摘要等,应用范围更广泛。


模型使用标准Transforme网络结构,从零开始训练,还自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率可达到 58.5%,位居业界前列。


元象XVERSE方面表示,XVERSE-13B在多项权威的标准中文和英文测评中表现优异,是目前同尺寸中效果最好的多语言大模型。



为验证模型各项能力,XVERSE-13B通过C-Eval、AGIEval和GAOKAO-Bench等三个最具影响力的中文测评基准的综合评估,表现优异,超越了同参数规模主流模型,如Baichuan-13B、Llama-2-13B、Ziya-LLaMA-13B等。


在中文 C-Eval 的测评中,XVERSE-13B 综合评分达到了 54.7 分,超越了同参数规模的主流模型。


C-EVAL测评基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试测试集,覆盖了 52 个来自不同行业领域的学科。



在AGIEval测评里,XVERSE-13B综合评分达到41.4分,超越了同参数规模主流模型。


AGIEval测评基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的 SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。


在GAOKAO-Bench测评中,XVERSE-13B综合评分达到了53.9分,显著领先于同参数规模的主流模型。


GAOKAO-Bench 测评基准是复旦大学研究团队创建的测评框架,以中国高考题目作为数据集,用于测评大模型在中文语言理解和逻辑推理能力方面的表现。



英文测评表现领先 Llama-2-13B


XVERSE-13B英文表现同样出色,在英文最权威评测MMLU中,其综合评分高达55.1分,几乎在所有维度超越了同参数规模的主流模型,包括Llama-2-13B、Baichuan-13B等。



MMLU由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容广泛,从初级水平一直涵盖到高级专业水平。


需要强调的是,测评只反映了大模型底座的核心能力,元象将持续迭代优化,全面提升模型能力。


而XVERSE-13B所体现出的高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。


XVERSE-13B有望在医疗、教育、文旅、金融和娱乐等多个行业具有广阔应用前景,也将为元象自身的元宇宙应用提供强大技术支持。


免费可商用 哈工大率先使用助力研究


秉持开源精神,XVERSE-13B代码采用Apache-2.0协议,向学术研究完全开源,企业只需简单登记,即可免费商用。


哈尔滨工业大学(下称“哈工大”)作为我国最早从事自然语言处理研究的顶级科研团队,已经率先使用XVERSE-13B大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,“开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。”


元象XVERSE于2021年初在深圳成立,是国内领先的AI与元宇宙技术服务公司,致力于打造AI驱动的3D 内容生产与消费一站式平台,愿景为“定义你的世界”。


2022年3月,公司完成A与A+轮融资1.2亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。元象创始人姚星是前腾讯副总裁、前腾讯AI Lab创始人、国家科技部新一代人工智能战略咨询委员会成员。


元象XVERSE创始人姚星表示:“真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索3D与AI前沿技术的动力。XVERSE-13B是我们在国产技术自立自强上迈出的一小步,而开源开放将激发大模型生态活力,让AI的未来发展迈出一大步,为实体经济、数字经济的发展注入强劲动力。我们期待与众多企业与开发者携手,开创大模型商用新纪元。”


项目地址:


Hugging Face:https://huggingface.co/xverse/XVERSE-13B


Github:https://github.com/xverse-ai/XVERSE-13B







关键词: AI 小琴 , lyraXVERSE , QQ音乐