AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能

来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。

来自主题: AI技术研报
6768 点击    2025-05-01 13:54
深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人

深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人

深度|AI独角兽华裔创始人:算法的一切认知都来自数据;AI可稍微自我改进,但主要进步仍来自于人

这就是为什么数据被称作"新石油"或"新黄金"——它极其珍贵,因为算法的一切认知都来源于输入的数据。

来自主题: AI资讯
7029 点击    2025-04-30 18:06
新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

AI编程智能体的能力正在飞速增长,最新研究揭示了这一「新摩尔定律」,如果AI智能体的任务时长继续以每4个月翻倍的速度增长,到2027年它们可能完成长达167小时的月级任务!

来自主题: AI资讯
6269 点击    2025-04-30 17:03
上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络

随着大语言模型 (LLM) 技术的迅猛发展,基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。

来自主题: AI技术研报
7141 点击    2025-04-30 15:05
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报
7943 点击    2025-04-30 08:32
AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实

AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实

AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实

在无数科幻电影中,增强现实(AR)通过在人们的眼前叠加动画、文字、图形等可视化信息,让人获得适时的、超越自身感知能力的信息。

来自主题: AI技术研报
7251 点击    2025-04-29 16:32
如何打造TTRL测试时强化学习+Memory的Agent,做经验时代AI的主人。| 最新

如何打造TTRL测试时强化学习+Memory的Agent,做经验时代AI的主人。| 最新

如何打造TTRL测试时强化学习+Memory的Agent,做经验时代AI的主人。| 最新

AI能像人类一样不断从经验中学习、进化,而不仅仅依赖于人工标注的数据?测试时强化学习(TTRL)与记忆系统的结合正在开启这一全新可能!

来自主题: AI技术研报
7980 点击    2025-04-29 16:24