AI资讯新闻榜单内容搜索-语言模型

更大，还能更快，更准！蚂蚁开源万亿参数语言模型Ling-1T，刷新多项SOTA

10 月 9 日凌晨，百灵大模型再度出手，正式发布并开源通用语言大模型 Ling-1T ——蚂蚁迄今为止开源的参数规模最大的语言模型。至此，继月之暗面Kimi K2、阿里 Qwen3-Max 之后，又一位重量级选手迈入万亿参数LLM 「开源俱乐部」。

来自主题: AI资讯

9935 点击 2025-10-09 11:47

复旦、同济和港中文等重磅发布：强化学习在大语言模型全周期的全面综述

近年来，以强化学习为核心的训练方法显著提升了大语言模型（Large Language Models, LLMs）的推理能力与对齐性能，尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。尽管现有综述对强化学习增强型 LLMs 进行了概述，但其涵盖范围较为有限，未能全面总结强化学习在 LLMs 全生命周期中的作用机制。

来自主题: AI技术研报

7421 点击 2025-10-06 13:22

你敢信？GPT-5的电脑操作水平只比人类低2%了

Agent（智能体）是最近一段时间的人工智能热点之一，将大语言模型的能力与工具调用、环境交互和自主规划结合起来，使其能够像虚拟助理一样完成复杂任务。其中「计算机使用智能

来自主题: AI技术研报

9221 点击 2025-10-05 21:34

强化学习之父给LLM判死刑！站队LeCun：我们全搞错了

当全世界都在狂热追逐大模型时，强化学习之父、图灵奖得主Richard Sutton却直言：大语言模型是「死胡同」。在他看来，真正的智能必须源于经验学习，而不是模仿人类语言的「预测游戏」。这番话无异于当头一棒，让人重新思考：我们追逐的所谓智能，究竟是幻影，还是通向未来的歧路？

来自主题: AI资讯

8595 点击 2025-09-30 15:40

LLM工业级自进化：北邮与腾讯AI Lab提出MoE-CL架构，解决大模型持续学习核心痛点

在工业级大语言模型（LLM）应用中，动态适配任务与保留既有能力的 “自进化” 需求日益迫切。真实场景中，不同领域语言模式差异显著，LLM 需在学习新场景合规规则的同时，不丢失旧场景的判断能力。这正是大模型自进化核心诉求，即 “自主优化跨任务知识整合，适应动态环境而无需大量外部干预”。

来自主题: AI技术研报

7736 点击 2025-09-30 15:36

「语言模型撞墙了，3D大模型刚开始」｜和VAST创始人宋亚宸聊3D大模型创业「狂飙」的两年

本周，我们邀请 3D 大模型公司 VAST 的创始人和 CEO 宋亚宸（Simon），和我们聊聊 VAST 最新 3D 生成大模型 Tripo 3.0 背后的故事。这位 97 年的创业者短期内连续融资三轮、每轮数千万美金，积攒了足够的子弹，在闷头苦干一年后，Simon 今年首次上播客，和我们探讨了几个关键的战略问题：

来自主题: AI资讯

8337 点击 2025-09-30 11:13

机器人感知大升级！轻量化注入几何先验，成功率提升31%

VLA模型通常建立在预训练视觉语言模型（VLM）之上，仅基于2D图像-文本数据训练，缺乏真实世界操作所需的3D空间理解能力。

来自主题: AI技术研报

7270 点击 2025-09-29 14:53

Shopee OnePiece：业内首个融合上下文工程、隐式推理和多目标训练策略的生成式搜推建模框架

2025 年，生成式推荐（Generative Recommender，GR）的发展如火如荼，其背后主要的驱动力源自大语言模型（LLM）那诱人的 scaling law 和通用建模能力（general-purpose modeling），将这种能力迁移至搜推广工业级系统大概是这两年每一个从业者孜孜不倦的追求。

来自主题: AI资讯

7189 点击 2025-09-28 18:14

免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

杜克大学团队发现，扩散大语言模型只需关注少量「中奖」token，就能在推理时把速度提升61-97倍，还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息，实现「少算多准」的双赢。

来自主题: AI技术研报

7950 点击 2025-09-28 09:51

给几何图片写标题就能让AI更聪明，UIUC发布高质量可泛化几何数据集

随着多模态大语言模型（MLLMs）在视觉问答、图像描述等任务中的广泛应用，其推理能力尤其是数学几何问题的解决能力，逐渐成为研究热点。然而，现有方法大多依赖模板生成图像 - 文本对，泛化能力有限，且视

来自主题: AI技术研报

7107 点击 2025-09-26 13:30