AI资讯新闻榜单内容搜索-Qwen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Qwen
实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

数学题, 一直是检验 AI 实力的 “硬核考场” —— 公式推导、逻辑链条、抽象思维缺一不可 。最近,我好了几天时间对国内外 7 款大厂模型展开了一场 “数学高考 ”,用阿里全球数学竞赛 + 中国奥赛真题实测它们的智商上限。

来自主题: AI产品测评
7726 点击    2025-04-01 14:25
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。但找到原理之后,我们也能让 Llama 学会自我改进。

来自主题: AI技术研报
6905 点击    2025-03-06 09:37
NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究

NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究

NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究

给DeepSeek-R1推理指导,它的数学推理能力就开始暴涨。更令人吃惊是,Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例!而人类为此耗费了27年。研究者预言:LLM离破解NP-hard问题,已经又近了一步。

来自主题: AI技术研报
8007 点击    2025-03-04 16:20
探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

在大语言模型 (LLM) 的研究中,与以 Chain-of-Thought 为代表的逻辑思维能力相比,LLM 中同等重要的 Leap-of-Thought 能力,也称为创造力,目前的讨论和分析仍然较少。这可能会严重阻碍 LLM 在创造力上的发展。造成这种困局的一个主要原因是,面对「创造力」,我们很难构建一个合适且自动化的评估流程。

来自主题: AI技术研报
5814 点击    2025-03-01 22:13
阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。

来自主题: AI资讯
7818 点击    2025-02-25 11:52