AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ima
具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

近日,RoboChallenge 重磅推出!这是全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试。

来自主题: AI技术研报
8144 点击    2025-10-16 12:45
告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

AI竟然画不好一张 “准确” 的图表?AI生图标杆如FLUX.1、GPT-Image,已经能生成媲美摄影大片的自然图像,却在柱状图、函数图这类结构化图像上频频出错,要么逻辑混乱、数据错误,要么就是标签错位。

来自主题: AI技术研报
9957 点击    2025-10-12 15:03
李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞要用ImageNet的方式,推动具身智能了。就在最近,由李飞飞团队发起、英伟达赞助(其中之一)的首届BEHAVIOR家务挑战赛正式启动。这一次,他们下定决心凝聚学术界和产业界的力量,共同向机器人做家务这一高地发起冲击。

来自主题: AI资讯
7241 点击    2025-10-11 12:10
硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与

硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与

硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与

今天凌晨,马斯克的大模型独角兽xAI祭出最新视频生成模型Imagine v0.9,免费向所有用户开放。一周前,OpenAI发布了旗舰视频和音频生成模型Sora 2,此次更新或许是马斯克对Sora 2的直接回应。

来自主题: AI资讯
8719 点击    2025-10-08 22:35
清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华大学朱军教授团队,NVIDIA Deep Imagination 研究组与斯坦福 Stefano Ermon 团队联合提出了一种全新的扩散模型强化学习(RL)范式 ——Diffusion Negative-aware FineTuning (DiffusionNFT)。该方法首次突破现有 RL 对扩散模型的基本假设,直接在前向加噪过程(forward process)上进行优化

来自主题: AI技术研报
10324 点击    2025-10-08 11:43
刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

全球文生图大模型王座,易主了。就在刚刚,LMArena竞技场发布了最新的文生图榜单,第一名来自中国,属于腾讯混元图像3.0!不仅超越了谷歌的Nano Banana,也超越了字节的Seedream和OpenAI的gpt-Image,在全球26个大模型中稳居第一。

来自主题: AI资讯
9738 点击    2025-10-05 21:36
给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。 然而,现有方法大多依赖模板生成图像 - 文本对,泛化能力有限,且视

来自主题: AI技术研报
7316 点击    2025-09-26 13:30
机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。这是一个为具身智能量身定制的 “超级 benchmark”,涵盖真实家庭场景下最关键的 1000 个日常任务(烹饪、清洁、整理……),并首次以 50 个完整长时段任务作为核心赛题,考验机器人能否在逼真的虚拟环境中完成真正贴近人类生活的操作。

来自主题: AI资讯
8235 点击    2025-09-25 10:58
Qwen开源版Banana来了!原生支持ControlNet

Qwen开源版Banana来了!原生支持ControlNet

Qwen开源版Banana来了!原生支持ControlNet

刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。不仅支持多图融合,提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。

来自主题: AI资讯
9659 点击    2025-09-24 09:58
阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

深夜,阿里通义大模型团队连放三个大招:开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。

来自主题: AI资讯
8654 点击    2025-09-23 16:33