AI资讯新闻榜单内容搜索-生成模型

上下文记忆力媲美Genie3，且问世更早：港大和可灵提出场景一致的交互式视频世界模型

要让视频生成模型真正成为模拟真实物理世界的「世界模型」，必须具备长时间生成并保留场景记忆的能力。然而，交互式长视频生成一直面临一个致命短板：缺乏稳定的场景记忆。镜头稍作移动再转回，眼前景物就可能「换了个世界」。

来自主题: AI技术研报

7279 点击 2025-08-21 11:25

简单即强大：全新生成模型「离散分布网络DDN」是如何做到原理简单，性质独特？

本项工作提出了一种全新的生成模型：离散分布网络（Discrete Distribution Networks），简称 DDN。相关论文已发表于 ICLR 2025。

来自主题: AI技术研报

6927 点击 2025-08-17 13:35

6秒造一个「视频博主」，Pika让一切图片开口说话

制作一个视频需要几步？可以简单概括为：拍摄 + 配音 + 剪辑。还记得 veo3 发布时引起的轰动吗？「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦，拍摄 + 配音 + 粗剪一键搞定。

来自主题: AI资讯

7004 点击 2025-08-13 16:59

AI代码生成，上下文示例怎样写最有效？港科大最新

长久以来我们都知道在Prompt里塞几个好例子能让LLM表现得更好，这就像教小孩学东西前先给他做个示范。在Vibe coding爆火后，和各种代码生成模型打交道的人变得更多了，大家也一定用过上下文学习（In-Context Learning, ICL）或者检索增强生成（RAG）这类技术来提升它的表现。

来自主题: AI技术研报

8193 点击 2025-08-13 10:45

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

近年来，文生图模型（Text-to-Image Models）飞速发展，从早期的 GAN 架构到如今的扩散和自回归模型，生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛，为设计、教育、艺术创作等领域带来了前所未有的便利。

来自主题: AI技术研报

7143 点击 2025-08-12 11:31

全球第一再升级！MiniMax Speech 2.5上线：多语种表现力更强，音色复刻更“像”

今天，MiniMax发布新一代语音生成模型Speech 2.5，再次刷新全球最强语音模型的上限。

来自主题: AI资讯

6263 点击 2025-08-08 14:17

Flux.1 Krea Dev超大杯实测：开源模型能否撼动Midjourney V7 ？

7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev，最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的，参数规模12B，专注于提升图像的美学和真实感，避免了常见的 AI 生成痕迹（过度饱和或不自然高光等等），更倾向于追求自然细节、照片级真实感和多样性。

来自主题: AI资讯

7318 点击 2025-08-07 10:54