AI资讯新闻榜单内容搜索-LLM

复旦、同济和港中文等重磅发布：强化学习在大语言模型全周期的全面综述

近年来，以强化学习为核心的训练方法显著提升了大语言模型（Large Language Models, LLMs）的推理能力与对齐性能，尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。尽管现有综述对强化学习增强型 LLMs 进行了概述，但其涵盖范围较为有限，未能全面总结强化学习在 LLMs 全生命周期中的作用机制。

来自主题: AI技术研报

7248 点击 2025-10-06 13:22

100 页 Agentic RL 综述！牛津、新国立、AI Lab 等联合定义 LLM 下半场

来自牛津大学、新加坡国立大学、伊利诺伊大学厄巴纳-香槟分校，伦敦大学学院、帝国理工学院、上海人工智能实验室等等全球 16 家顶尖研究机构的学者，共同撰写并发布了长达百页的综述：《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》。

来自主题: AI技术研报

8034 点击 2025-10-03 14:15

强化学习之父给LLM判死刑！站队LeCun：我们全搞错了

当全世界都在狂热追逐大模型时，强化学习之父、图灵奖得主Richard Sutton却直言：大语言模型是「死胡同」。在他看来，真正的智能必须源于经验学习，而不是模仿人类语言的「预测游戏」。这番话无异于当头一棒，让人重新思考：我们追逐的所谓智能，究竟是幻影，还是通向未来的歧路？

来自主题: AI资讯

8417 点击 2025-09-30 15:40

LLM工业级自进化：北邮与腾讯AI Lab提出MoE-CL架构，解决大模型持续学习核心痛点

在工业级大语言模型（LLM）应用中，动态适配任务与保留既有能力的 “自进化” 需求日益迫切。真实场景中，不同领域语言模式差异显著，LLM 需在学习新场景合规规则的同时，不丢失旧场景的判断能力。这正是大模型自进化核心诉求，即 “自主优化跨任务知识整合，适应动态环境而无需大量外部干预”。

来自主题: AI技术研报

7530 点击 2025-09-30 15:36

Transformer作者初创公司最新成果：开源新框架突破进化计算瓶颈，样本效率暴涨数十倍

Transformer作者Llion Jones带着自己的初创公司Sakana AI，又来搞事情了。（doge）最新推出的开源框架——ShinkaEvolve，可以让LLM在自己写代码优化自己的同时，还能同时兼顾效率，be like为进化计算装上一个“加速引擎”。

来自主题: AI技术研报

8454 点击 2025-09-29 11:01

Shopee OnePiece：业内首个融合上下文工程、隐式推理和多目标训练策略的生成式搜推建模框架

2025 年，生成式推荐（Generative Recommender，GR）的发展如火如荼，其背后主要的驱动力源自大语言模型（LLM）那诱人的 scaling law 和通用建模能力（general-purpose modeling），将这种能力迁移至搜推广工业级系统大概是这两年每一个从业者孜孜不倦的追求。

来自主题: AI资讯

6990 点击 2025-09-28 18:14

给几何图片写标题就能让AI更聪明，UIUC发布高质量可泛化几何数据集

随着多模态大语言模型（MLLMs）在视觉问答、图像描述等任务中的广泛应用，其推理能力尤其是数学几何问题的解决能力，逐渐成为研究热点。然而，现有方法大多依赖模板生成图像 - 文本对，泛化能力有限，且视

来自主题: AI技术研报

6931 点击 2025-09-26 13:30

为 OpenAI 秘密提供模型测试， OpenRouter 给 LLMs 做了套“网关系统”

OpenRouter 创立于 2023 年初，给用户提供一个统一的 API Key，用于调用自身接入的所有模型，既包括了市面上的主流基础模型，也包括部分开源模型，一些开源模型还有多个不同的供应商。如果用户选择使用自有的 Key ，也可以同时享受 OpenRouter 的统一接口与其他服务。

来自主题: AI资讯

9187 点击 2025-09-24 09:51

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

LeCun 这次不是批评 LLM，而是亲自改造。当前 LLM 的训练（包括预训练、微调和评估）主要依赖于在「输入空间」进行重构与生成，例如预测下一个词。而在 CV 领域，基于「嵌入空间」的训练目标，如联合嵌入预测架构（JEPA），已被证明远优于在输入空间操作的同类方法。

来自主题: AI技术研报

7384 点击 2025-09-23 10:12

这一次，天玑9500的端侧AI能力，友商赶不上了

9 月 22 日下午，联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500，并展示了一系列新形态端侧的 AI 应用，在公众层面首次推动端侧 AI 从尝鲜到好用。现在，让手机端大语言模型（LLM）处理一段超长的文本，最长支持 128K 字元，它只需要两秒就能总结出会议纪要，AI 还能自动修改你的错别字。

来自主题: AI资讯

7468 点击 2025-09-22 19:09