AI资讯新闻榜单内容搜索-GTA

EMNLP2025 | SFT与RL的结合，vivo AI Lab提出新的后训练方法

监督微调（SFT）和强化学习（RL）微调是大模型后训练常见的两种手段。通过强化学习微调大模型在众多 NLP 场景都取得了较好的进展，但是在文本分类场景，强化学习未取得较大的进展，其表现往往不如监督学习。

来自主题: AI技术研报

6770 点击 2025-09-23 14:59

AI 硬件，已经成为大模型之后，又一个令人兴奋的领域。正如 AI Agent 从通用开始走向垂直，AI 硬件，也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。

来自主题: AI资讯

6915 点击 2025-09-02 15:17

大家好，我是袋鼠帝。最近我感觉又好起来了，居然受到了阿里爸爸的关照。前几天，收到了一个阿里旗下钉钉新发布的AI硬件：DingTalk A1。

来自主题: AI产品测评

8398 点击 2025-08-28 14:17

所有办公协作工具，都具备效率工具和「牛马桎梏」的双重属性，天然容易触动打工人的神经，在 AI 带着职业取代的舆论席卷而来的当下，更是如此。

来自主题: AI资讯

6751 点击 2025-08-25 16:06

作为开放世界游戏的标杆，GTA 系列不仅在游戏圈声名赫赫。尤其是在 AI 驱动的视频生成、三维生成或是世界模型等领域里，研究者们不仅采用游戏内场景为训练数据，更将生成类 GTA 的完整世界作为长久以来的目标。

来自主题: AI资讯

6662 点击 2025-08-23 11:18

GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学（广州）联合研发，提出了一种高效的大模型框架，显著提升模型性能与计算效率。

来自主题: AI技术研报

8281 点击 2025-07-23 10:15

谁曾想，AI竟能实时生成GTA级大作。刚刚，谷歌、英伟达等机构联手，震撼发布全球首款AI原生UGC游戏引擎——Mirage，没有预设关卡，一句话即生游戏，超长十分钟沉浸式体验

来自主题: AI资讯

8609 点击 2025-07-03 14:19

曾撼动Transformer统治地位的Mamba作者之一Tri Dao，刚刚带来新作——提出两种专为推理“量身定制”的注意力机制。

来自主题: AI技术研报

7705 点击 2025-06-02 15:04

利用语言模型调用工具，是实现通用目标智能体（general-purpose agents）的重要途径，对语言模型的工具调用能力提出了挑战。

来自主题: AI技术研报

3687 点击 2024-11-04 17:09

GTA 新出的游戏预告片看了吗？据说，这个预告片已经破了三项吉尼斯世界纪录，观看次数已经破亿。

来自主题: AI资讯

7667 点击 2023-12-08 15:08