AI资讯新闻榜单内容搜索-Qwen

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Qwen

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

推理大语言模型（LLM），如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域已超越人类专家，并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习（Reinforcement Learning）和推理规模（Inference scaling）。

来自主题: AI技术研报

7513 点击 2025-02-12 11:33

阿里千问海外版深度体验：8大神仙功能让我惊艳了

阿里千问海外版深度体验：8大神仙功能让我惊艳了

阿里千问海外版深度体验：8大神仙功能让我惊艳了

江树的碎碎念：最近发现阿里家的千问AI偷偷上线了海外版，不仅完全免费、无需魔法，功能甚至比ChatGPT还要强！这不赶紧带大家尝鲜体验一波？最近我发现了一个超赞的一站式免费AI神器：阿里千问海外版！它直接开启了一个全新的网址：chat.qwenlm.ai

来自主题: AI资讯

10968 点击 2025-02-11 10:37

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

「慢思考」（Slow-Thinking），也被称为测试时扩展（Test-Time Scaling），成为提升 LLM 推理能力的新方向。近年来，OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布，进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报

6983 点击 2025-02-10 17:04

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯

9207 点击 2025-02-05 11:19

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯

8403 点击 2025-01-29 12:40

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

谈到大模型的“国货之光”，除了DeepSeek之外，阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯

9952 点击 2025-01-27 14:18

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

本周，在阿里云通义千问 Qwen 团队提交的一篇论文中，研究人员发现了目前最热门的 MoE（混合专家模型）训练中存在的一个普遍关键问题，并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡，使得 MoE 模型的性能和专家特异性都得到了显著的提升。

来自主题: AI技术研报

5502 点击 2025-01-26 11:12

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

仅使用20K合成数据，就能让Qwen模型能力飙升——

来自主题: AI技术研报

7854 点击 2025-01-23 11:37

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。

来自主题: AI技术研报

8243 点击 2025-01-18 15:00

阿里云Qwen-VL降价超80%！立即生效！

阿里云Qwen-VL降价超80%！立即生效！

阿里云Qwen-VL降价超80%！立即生效！

2024年12月31日，阿里云宣布2024年度第三轮大模型降价，通义千问视觉理解模型全线降价超80%。

来自主题: AI资讯

10805 点击 2025-01-02 11:04

上一页当前第24页,共29页下一页