AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
英伟达新研究:小模型才是智能体的未来

英伟达新研究:小模型才是智能体的未来

英伟达新研究:小模型才是智能体的未来

大模型OUT,小模型才是智能体的未来! 这可不是标题党,而是英伟达最新论文观点: 在Agent任务中,大语言模型经常处理重复、专业化的子任务,这让它们消耗大量计算资源,且成本高、效率低、灵活性差。

来自主题: AI资讯
6207 点击    2025-08-19 11:24
超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家

超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家

超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家

一个小解码器让所有模型当上领域专家!华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。

来自主题: AI资讯
6708 点击    2025-08-19 11:01
AI时代还用德尔菲法?其实“少数人”远比“多数人”更有价值 |谷歌最新

AI时代还用德尔菲法?其实“少数人”远比“多数人”更有价值 |谷歌最新

AI时代还用德尔菲法?其实“少数人”远比“多数人”更有价值 |谷歌最新

每当需要处理复杂领域中高度不确定性或缺乏历史数据的问题时,纯粹的科学证据不足、存在矛盾或过于复杂,通常我们就需要依赖专家们的集体智慧来形成共识,指导实践。德尔菲法(Delphi method)是半个多世纪以来最常用的一种专家共识方法。

来自主题: AI资讯
6173 点击    2025-08-19 10:47
字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!?

来自主题: AI技术研报
5231 点击    2025-08-19 10:16
NextStep-1:一次在图像生成上自回归范式的探索

NextStep-1:一次在图像生成上自回归范式的探索

NextStep-1:一次在图像生成上自回归范式的探索

自回归模型,是 AIGC 领域一块迷人的基石。开发者们一直在探索它在视觉生成领域的边界,从经典的离散序列生成,到结合强大扩散模型的混合范式,每一步都凝聚了社区的智慧。

来自主题: AI技术研报
5495 点击    2025-08-18 17:36
开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。

来自主题: AI技术研报
6100 点击    2025-08-18 17:20
一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来

仅凭一张照片,能否让行人继续行走、汽车继续飞驰、云朵继续流动,并让你从任意视角自由观赏?

来自主题: AI技术研报
7056 点击    2025-08-18 17:14
下一代MoE架构登场!伴生专家系统用“大小核”重写MoE规则

下一代MoE架构登场!伴生专家系统用“大小核”重写MoE规则

下一代MoE架构登场!伴生专家系统用“大小核”重写MoE规则

一句话概括,传统MoE就像公司派固定人数团队,Grove MoE则像智能调度系统,小项目派少数人,大项目集中火力,效率与效果兼得。

来自主题: AI资讯
6211 点击    2025-08-18 16:59
KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

在今年的 ACM KDD 2025 大会上,清华大学电子系团队联合中国移动发布了 UoMo,全球首个面向移动网络的通用流量预测模型。UoMo 能同时胜任短期预测、长期预测,甚至在没有历史数据的情况下生成全新区域的流量分布。

来自主题: AI技术研报
5901 点击    2025-08-18 15:54
400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

还记得分层推理模型(Hierarchical Reasoning Model,HRM)吗? 这项工作于 6 月份发布,当时引起了不小的轰动——X/Twitter 上的相关讨论获得了超过 400 万的浏览量和数万个点赞,剖析这项工作的 YouTube 视频观看量也超过了 47.5 万次。

来自主题: AI技术研报
6892 点击    2025-08-18 12:36