AI资讯新闻榜单内容搜索-CR

首个3D生成解构模型PartCrafter问世，GitHub狂揽2k星标

从单张图像创建可编辑的 3D 模型是计算机图形学领域的一大挑战。传统的 3D 生成模型多产出整体式的「黑箱」资产，使得对个别部件进行精细调整几乎成为不可能。

来自主题: AI技术研报

10967 点击 2025-11-27 15:01

并行扩散架构突破极限，实现5分钟AI视频生成，「叫板」OpenAI与谷歌？

近日，一家名为 CraftStory 的 AI 初创公司推出了 Model 2.0 视频生成系统，凭借可生成长达五分钟的富有表现力、可媲美专业水准、以人为中心的视频，破解了困扰 AI 视频生成行业长久以来的「视频时长」难题，引起热议，并被视为或将是 OpenAI 的 Sora 和 Google 的 Veo 的强有力竞争者。

来自主题: AI资讯

8065 点击 2025-11-21 10:52

刚刚，PyTorch之父光速入职TML！离职Meta刚过一天，投身500亿估值独角兽

刚刚，才离开 Meta 不久的 Soumith Chintala 发布了一条推文，盛赞 Thinking Machines Lab（以下简称 TML）的人很了不起（incredible）。与此同时，这位 PyTorch 之父也更新了自己的个人介绍，正式官宣加入 TML，并表示正在这家估值已达 500 亿美元的创业公司「创造新东西（Building new things）」。

来自主题: AI资讯

8608 点击 2025-11-19 11:06

金山与华科发布多模态模型MonkeyOCR v1.5：文档解析能力超越PaddleOCR-VL，复杂表格解析首次突破90%

是金山派来的猴子，复杂文档解析有救了！

来自主题: AI技术研报

11679 点击 2025-11-18 15:16

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

上海人工智能实验室推出了一款革新的多模态生成理解一体化的扩散语言模型 ——Lumina-DiMOO。基于离散扩散建模（Discrete Diffusion Modeling），Lumina-DiMOO 打破了多模态任务之间的壁垒，在同一离散扩散框架下，完成从文本→图像、图像→图像、图像→文本的全栈能力闭环。

来自主题: AI技术研报

9306 点击 2025-11-17 14:33