AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报
8128 点击    2025-08-18 11:13
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。

来自主题: AI技术研报
6723 点击    2025-08-17 13:16
快手副总裁、大模型负责人张迪将离职|新皮层独家

快手副总裁、大模型负责人张迪将离职|新皮层独家

快手副总裁、大模型负责人张迪将离职|新皮层独家

第一财经「新皮层」独家获悉,快手副总裁、大模型负责人张迪将离职,快手高级副总裁、可灵AI事业部负责人兼社区科学线负责人盖坤将兼任可灵AI技术部负责人,「更深地管技术」。

来自主题: AI资讯
7468 点击    2025-08-16 17:51
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。

来自主题: AI技术研报
7028 点击    2025-08-16 16:45
模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

形式化定理证明,又有新范式! 阶跃星辰正式发布并开源了形式化定理证明大模型:StepFun-Prover-Preview-7B和StepFun-Prover-Preview-32B。

来自主题: AI技术研报
8003 点击    2025-08-16 16:10
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。

来自主题: AI资讯
7933 点击    2025-08-15 20:47
10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光

10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。

来自主题: AI资讯
6866 点击    2025-08-15 14:09