AI资讯新闻榜单内容搜索-训练

对标GPT-4o和香蕉！浙大开源ContextGen：布局身份协同新SOTA

浙江大学ReLER团队开源ContextGen框架，攻克多实例图像生成中布局与身份协同控制难题。基于Diffusion Transformer架构，通过双重注意力机制，实现布局精准锚定与身份高保真隔离，在基准测试中超越开源SOTA模型，对标GPT-4o等闭源系统，为定制化AI图像生成带来新突破。

来自主题: AI技术研报

9917 点击 2025-12-22 16:08

让AI像人类画家一样边画边想，港中文&美团让模型「走一步看一步」

在文生图（Text-to-Image）和视频生成领域，以FLUX.1、Emu3为代表的扩散模型与自回归模型已经能生成极其逼真的画面。

来自主题: AI技术研报

11311 点击 2025-12-22 16:05

智能体如何学会「想象」？深度解析世界模型嵌入具身系统的三大技术范式

长期以来，具身智能系统主要依赖「感知 - 行动」的反应式回路，缺乏对未来的预测能力。而世界模型的引入，让智能体拥有了「想象」未来的能力。

来自主题: AI技术研报

10043 点击 2025-12-22 16:04

迪士尼真的造出了「雪宝」Olaf！但为了不让它“融化”，工程师逼疯了AI

还记得之前非常火的雪宝Olaf机器人吗？

来自主题: AI技术研报

9884 点击 2025-12-22 16:03

震撼，英伟达新模型NitroGen能打遍几乎所有游戏

和传统的游戏自动化脚本不同，这是一个完整的通用的大模型，不仅限于单一游戏的操作，能够玩遍市面上几乎全部的游戏类型。于是，让我们正式介绍主角，来自英伟达的最新开源基础模型 NitroGen。该模型的训练目标是玩 1000 款以上的游戏 —— 无论是 RPG、平台跳跃、吃鸡、竞速，还是 2D、3D 游戏，统统不在话下！

来自主题: AI资讯

8695 点击 2025-12-22 12:18