AI资讯新闻榜单内容搜索-ima

机器人界的「Imagenet 时刻」，李飞飞团队官宣全球顶级具身智能挑战赛

答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣：首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。这是一个为具身智能量身定制的 “超级 benchmark”，涵盖真实家庭场景下最关键的 1000 个日常任务（烹饪、清洁、整理……），并首次以 50 个完整长时段任务作为核心赛题，考验机器人能否在逼真的虚拟环境中完成真正贴近人类生活的操作。

来自主题: AI资讯

9059 点击 2025-09-25 10:58

Qwen开源版Banana来了！原生支持ControlNet

刚刚，Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。不仅支持多图融合，提供“人物+人物”，“人物+商品”，“人物+场景” 等多种玩法，还增强了人物、商品、文字等单图一致性。

来自主题: AI资讯

10832 点击 2025-09-24 09:58

阿里一夜扔出三个开源王炸！猛刷32项开源SOTA

深夜，阿里通义大模型团队连放三个大招：开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音输出。

来自主题: AI资讯

9786 点击 2025-09-23 16:33

谷歌的香蕉和字节的梦，相逢在 Lovart 的无限画布上

谷歌这只「香蕉」火得有些疯狂：Nano Banana（即 Gemini 2.5 Flash Image）自 8 月底上线以来，仅用几周就吸引了超过 1,000 万新用户，并在 Gemini 应用中完成了 2 亿次图像编辑请求

来自主题: AI产品测评

10146 点击 2025-09-16 09:58

为什么说现在所有的 AI Agent，都像 3D 打印机？｜AI 上新

GPT-5 的发布，可以看作是一个分水岭。练习时长两年半的 GPT-5，并没有展现出和 GPT-4 本质上的差别，甚至因为模型的预设人格引发了用户的反感情绪。

来自主题: AI资讯

9703 点击 2025-09-15 16:12

美团悄悄上线了生活Agent，懒人的春天真的要来了。

啊？今天早上9点多的时候。美团上线了他们的首个生活类Agent。名字，叫小美。大厂们卷疯了。这战场，真的从WAIMAI打到了AI了我靠。而且还真的居然被我猜中了。我上周写过美团的开源大模型

来自主题: AI资讯

10780 点击 2025-09-13 11:28

任意骨骼系统的模型都能驱动？AnimaX提出基于世界模型的3D动画生成新范式

在游戏、影视制作、虚拟人和交互式内容创作等行业中，高质量的 3D 动画是实现真实感与表现力的基础。然而，传统计算机图形学中的动画制作通常依赖于骨骼绑定与关键帧编辑，这一流程虽然能够带来高质量与精细控制，但需要经验丰富的艺术家投入大量人力与时间，代价昂贵。

来自主题: AI技术研报

9507 点击 2025-09-07 11:38

又多了一个哄孩子AI神器，一张破涂鸦竟能秒变迪士尼动画

年轻父母又多了一个哄小孩法子。前段时间，博主 Rory Flynn 在 X 上发了个帖子，说他妈妈发来一张 30 年前的涂鸦画，他反手就用 Midjourney 做成了「妈妈拿彩虹木勺大战巨龙」动画。

来自主题: AI资讯

8610 点击 2025-09-05 12:38

Nano-Banana 核心团队首次揭秘，全球最火的 AI 生图工具是怎么打造的

在图像生成上，Google 其实已经有 Imagen 4 这样的文生图模型，为什么 nano banana 最后还是由 Google 带来的？但这确实不是偶然或者瞎猜的，nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力，其次就是 Google 内部顶尖文生图模型 Imagen，所提供的极致图像美学与自然度追求。

来自主题: AI技术研报

12019 点击 2025-09-02 09:24

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

没想到啊，最新SOTA的开源大模型…… 来自一个送外卖（Waimai）的——有两个AI，确实不一样。这个最新开源模型叫：Longcat-Flash-Chat，美团第一个开源大模型，发布即开源，已经在海内外的技术圈子里火爆热议了。

来自主题: AI资讯

10394 点击 2025-09-01 15:12