AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。

来自主题: AI技术研报
5790 点击    2025-08-17 13:16
快手副总裁、大模型负责人张迪将离职|新皮层独家

快手副总裁、大模型负责人张迪将离职|新皮层独家

快手副总裁、大模型负责人张迪将离职|新皮层独家

第一财经「新皮层」独家获悉,快手副总裁、大模型负责人张迪将离职,快手高级副总裁、可灵AI事业部负责人兼社区科学线负责人盖坤将兼任可灵AI技术部负责人,「更深地管技术」。

来自主题: AI资讯
6073 点击    2025-08-16 17:51
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。

来自主题: AI技术研报
5631 点击    2025-08-16 16:45
模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

形式化定理证明,又有新范式! 阶跃星辰正式发布并开源了形式化定理证明大模型:StepFun-Prover-Preview-7B和StepFun-Prover-Preview-32B。

来自主题: AI技术研报
7040 点击    2025-08-16 16:10
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。

来自主题: AI资讯
6538 点击    2025-08-15 20:47
10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。

来自主题: AI资讯
5583 点击    2025-08-15 14:09
老黄力推的 Physical AI,有人用开源框架打通了硬件的最后一道关

老黄力推的 Physical AI,有人用开源框架打通了硬件的最后一道关

老黄力推的 Physical AI,有人用开源框架打通了硬件的最后一道关

当大模型在代码世界封神时,一场硬件领域的新战役也在打响——如何让 AI 在物理世界「动手」。这场攻坚战的突破速度比预想快一些,Physical AI 的可行性轮廓已然变得更为清晰。 

来自主题: AI资讯
6303 点击    2025-08-15 13:17
链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。然而,这些流畅的推理链条是否真的反映了模型的推理能力?

来自主题: AI技术研报
5276 点击    2025-08-15 12:38