AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架,有望攻克这一问题。 它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础,实现了从任意开放世界图像(室内/室外/合成图等)到带Mesh的3D场景的完整重建。

来自主题: AI技术研报
7841 点击    2026-01-26 10:16
国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

今天,首个在国产芯片上完成全程训练的SOTA(最佳水平)多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程,该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

来自主题: AI资讯
9438 点击    2026-01-14 14:09
AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。

AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。

AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。

昨晚夜里快12点,AI视频公司PixVerse毫无预兆的发了一个项目。PixVerse R1,下一代实时世界生成模型。这玩意你看文字,可能不是很好理解,我直接放一个官方的demo视频,大家的感觉应该会强一些。

来自主题: AI资讯
9706 点击    2026-01-14 11:49
从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

随着 AIGC(Artificial Intelligence Generated Content) 的爆发,我们已经习惯了像 Sora 或 Wan 这样的视频生成模型能够理解「一只宇航员在火星后空翻」这样天马行空的指令。然而,3D 人体动作生成(3D MoGen)领域却稍显滞后。

来自主题: AI技术研报
8114 点击    2026-01-08 16:13
检索做大,生成做轻:CMU团队系统评测RAG的语料与模型权衡

检索做大,生成做轻:CMU团队系统评测RAG的语料与模型权衡

检索做大,生成做轻:CMU团队系统评测RAG的语料与模型权衡

在检索增强生成中,扩大生成模型规模往往能提升准确率,但也会显著抬高推理成本与部署门槛。CMU 团队在固定提示模板、上下文组织方式与证据预算,并保持检索与解码设置不变的前提下,系统比较了生成模型规模与检索语料规模的联合效应,发现扩充检索语料能够稳定增强 RAG,并在多项开放域问答基准上让小中型模型在更大语料下达到甚至超过更大模型在较小语料下的表现,同时在更高语料规模处呈现清晰的边际收益递减。

来自主题: AI技术研报
7522 点击    2026-01-06 09:30
比SOTA提速10倍!北大DragMesh重塑3D交互,物理零失真

比SOTA提速10倍!北大DragMesh重塑3D交互,物理零失真

比SOTA提速10倍!北大DragMesh重塑3D交互,物理零失真

让静态3D模型「动起来」一直是图形学界的难题:物理模拟太慢,生成模型又不讲「物理基本法」。近日,北京大学团队提出DragMesh,通过「语义-几何解耦」范式与双四元数VAE,成功将核心生成模块的算力消耗降低至SOTA模型的1/10,同时将运动轴预测误差降低了10倍。

来自主题: AI资讯
7083 点击    2026-01-05 09:35
ControlNet作者张吕敏最新论文:长视频也能实现超短上下文

ControlNet作者张吕敏最新论文:长视频也能实现超短上下文

ControlNet作者张吕敏最新论文:长视频也能实现超短上下文

大部分的高质量视频生成模型,都只能生成上限约15秒的视频。清晰度提高之后,生成的视频时长还会再一次缩短。

来自主题: AI技术研报
9082 点击    2026-01-04 11:38
告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

现有的AI视频生成模型虽然在短片上效果惊人,但面对一首完整的歌曲时往往束手无策——画面不连贯、人物换脸、甚至完全不理会歌词含义。

来自主题: AI技术研报
7588 点击    2025-12-30 10:29
挖到M2.1的7个神仙用法,有点上头。。

挖到M2.1的7个神仙用法,有点上头。。

挖到M2.1的7个神仙用法,有点上头。。

上周我还在折腾各种图片、视频生成模型,这周又到了编程周。前天MiniMax丢出了个在编程界绝对有分量的模型:MiniMax-M2.1。然后发现就在刚才已经开源了:

来自主题: AI资讯
10204 点击    2025-12-27 10:56