阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
5486点击    2025-01-29 12:40

昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~


就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹


Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

祝大家新年快乐,特别祝Sam。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。


阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:

外面的烟花照亮了天空,我却坐在电脑跟前。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


多模态能力展示


下面是Qwen2.5-Max在四个使用场景上的演示。


首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


有网友改造了一下,让球体内部有三个弹跳的黄色小球。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。


比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏


另外Qwen2.5-Max数单词中的特定字母数量也不在话下。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏



现在,Qwen2.5-Max已在Qwen Chat中上线。


此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏



感兴趣的童鞋赶紧试试吧~


参考链接:

[1]https://qwenlm.github.io/blog/qwen2.5-max/

[2]https://x.com/JustinLin610/status/1884263803451498794

[3]https://x.com/_akhaliq/status/1884278071093502253

[4]https://x.com/huybery/status/1884263539675934860



文章来自微信公众号 “ 量子位 ”,作者 西风 梦晨


阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

关键词: Qwen2.5-Max , Qwen2.5 , DeepSeek V3 , AI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales