AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见

今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0 ,针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势:

来自主题: AI资讯
9989 点击    2026-01-24 15:14
OpenAI核心模型主要贡献者翁家翌:OpenAI所做的,并非完全不能复刻;DS是唯一一次让内部真正警觉;模型公司本质上拼的是Infra的修Bug速度

OpenAI核心模型主要贡献者翁家翌:OpenAI所做的,并非完全不能复刻;DS是唯一一次让内部真正警觉;模型公司本质上拼的是Infra的修Bug速度

OpenAI核心模型主要贡献者翁家翌:OpenAI所做的,并非完全不能复刻;DS是唯一一次让内部真正警觉;模型公司本质上拼的是Infra的修Bug速度

近日,OpenAI一位华人研发工程师,翁家翌在一期播客采访中曝出了不少猛料。可以说是把如今的顶流OpenAI过去三年的重大转折、技术取舍、Infra、甚至包括那次各个谣传版本的“宫斗风波”。

来自主题: AI资讯
7288 点击    2026-01-24 11:10
2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

在文心Moment大会上,文心大模型5.0正式版上线。据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

来自主题: AI资讯
7442 点击    2026-01-24 11:03
AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI 推理基础设施公司 Baseten 近日完成一轮 3 亿美元的成长型融资,投后估值约 50 亿美元。与不到六个月前的一轮重要融资相比,公司估值几乎翻倍。 这一交易清晰地表明,在大模型训练之外,推理

来自主题: AI资讯
9440 点击    2026-01-24 10:54
LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

编辑|Panda 在文生图模型的技术版图中,VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX,再到一系列扩散 Transformer,主流路线高度一致:先用 VAE 压缩视

来自主题: AI技术研报
6509 点击    2026-01-24 10:52
Meta新模型要来了,但Llama 4的锅谁来接?1300多位作者的联合报告来了

Meta新模型要来了,但Llama 4的锅谁来接?1300多位作者的联合报告来了

Meta新模型要来了,但Llama 4的锅谁来接?1300多位作者的联合报告来了

路透社最新消息,Meta 新成立的 AI 团队本月已在内部交付了首批关键模型。据悉,该消息来自 Meta 公司的 CTO Andrew Bosworth,他表示该团队的 AI 模型「非常好」(very good)。

来自主题: AI资讯
8367 点击    2026-01-24 10:44
清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

这篇新论文提出了一种非常简单的新激活层 Derf(Dynamic erf),让「无归一化(Normalization-Free)」的 Transformer 不仅能稳定训练,还在多个设置下性能超过了带 LayerNorm 的标准 Transformer。

来自主题: AI技术研报
7339 点击    2026-01-24 10:38
一文速通「机器人3D场景表示」发展史

一文速通「机器人3D场景表示」发展史

一文速通「机器人3D场景表示」发展史

上海交通大学、波恩大学等院校的研究团队全面总结了当前机器人技术中常用的场景表示方法。这些方法包括传统的点云、体素栅格、符号距离函数以及场景图等传统几何表示方式,同时也涵盖了最新的神经网络表示技术,如神经辐射场、3D 高斯散布模型以及新兴的 3D 基础模型。

来自主题: AI技术研报
7482 点击    2026-01-24 10:31
百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

近期,FlashLabs 发布并开源了其实时语音模型 Chroma 1.0,其定位为全球首个开源的端到端语音到语音模型。Chroma 1.0 发布之后,便在社媒爆火,吸引了大量的关注。X 上的官推帖子已经突破了百万浏览量。

来自主题: AI资讯
8151 点击    2026-01-23 16:25