AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。

来自主题: AI技术研报
5274 点击    2026-01-26 10:19
一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架,有望攻克这一问题。 它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础,实现了从任意开放世界图像(室内/室外/合成图等)到带Mesh的3D场景的完整重建。

来自主题: AI技术研报
8014 点击    2026-01-26 10:16
UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0 ,针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势:

来自主题: AI资讯
10281 点击    2026-01-24 15:14
AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI 推理基础设施公司 Baseten 近日完成一轮 3 亿美元的成长型融资,投后估值约 50 亿美元。与不到六个月前的一轮重要融资相比,公司估值几乎翻倍。 这一交易清晰地表明,在大模型训练之外,推理

来自主题: AI资讯
9687 点击    2026-01-24 10:54
LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

编辑|Panda 在文生图模型的技术版图中,VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX,再到一系列扩散 Transformer,主流路线高度一致:先用 VAE 压缩视

来自主题: AI技术研报
6687 点击    2026-01-24 10:52
清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

这篇新论文提出了一种非常简单的新激活层 Derf(Dynamic erf),让「无归一化(Normalization-Free)」的 Transformer 不仅能稳定训练,还在多个设置下性能超过了带 LayerNorm 的标准 Transformer。

来自主题: AI技术研报
7501 点击    2026-01-24 10:38
一文速通「机器人3D场景表示」发展史

一文速通「机器人3D场景表示」发展史

一文速通「机器人3D场景表示」发展史

上海交通大学、波恩大学等院校的研究团队全面总结了当前机器人技术中常用的场景表示方法。这些方法包括传统的点云、体素栅格、符号距离函数以及场景图等传统几何表示方式,同时也涵盖了最新的神经网络表示技术,如神经辐射场、3D 高斯散布模型以及新兴的 3D 基础模型。

来自主题: AI技术研报
7634 点击    2026-01-24 10:31
奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

最新奖励模型SWIFT直接利用模型生成过程中的隐藏状态,参数规模极小,仅占传统模型的不到0.005%。SWIFT在多个基准测试中表现优异,推理速度提升1.7×–6.7×,且在对齐评估中稳定可靠,展现出高效、通用的奖励建模新范式。

来自主题: AI技术研报
6572 点击    2026-01-23 15:17
AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

GEM框架利用认知科学原理,从少量人类偏好中提取多维认知评估,让AI在极少标注下精准理解人类思维,提高了数据效率,在医疗等专业领域表现优异,为AI与人类偏好对齐提供新思路。

来自主题: AI技术研报
8889 点击    2026-01-23 10:14