AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段,图像编辑(Image Editing)正逐渐取代一次性生成,成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型?

来自主题: AI技术研报
6675 点击    2025-10-25 14:26
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

随着多模态大模型的不断演进,指令引导的图像编辑(Instruction-guided Image Editing)技术取得了显著进展。然而,现有模型在遵循复杂、精细的文本指令方面仍面临巨大挑战,往往需要用户进行多次尝试和手动筛选,难以实现稳定、高质量的「一步到位」式编辑。

来自主题: AI技术研报
9748 点击    2025-10-23 12:28
谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

Reve AI 是一家 2023 年 12 月才建立的加州 AI 初创公司,他们在 2025 年 3 月推出了第一个生图模型叫 Reve Image 1.0,内部代号是「Halfmoon」。6 个月过后,再次升级该模型为「图像编辑模型」。

来自主题: AI资讯
9873 点击    2025-10-17 08:39
NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

一张图片包含的信息是多维的。例如下面的图 1,我们至少可以得到三个层面的信息:主体是大象,数量有两头,环境是热带稀树草原(savanna)。然而,如果由传统的表征学习方法来处理这张图片,比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer,往往得到的表征只会体现其主体信息,也就是会简单地将该图片归为大象这一类别。这显然是不合理的。

来自主题: AI技术研报
6961 点击    2025-10-16 14:43
具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

近日,RoboChallenge 重磅推出!这是全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试。

来自主题: AI技术研报
7786 点击    2025-10-16 12:45
告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统

AI竟然画不好一张 “准确” 的图表?AI生图标杆如FLUX.1、GPT-Image,已经能生成媲美摄影大片的自然图像,却在柱状图、函数图这类结构化图像上频频出错,要么逻辑混乱、数据错误,要么就是标签错位。

来自主题: AI技术研报
9503 点击    2025-10-12 15:03
李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞要用ImageNet的方式,推动具身智能了。就在最近,由李飞飞团队发起、英伟达赞助(其中之一)的首届BEHAVIOR家务挑战赛正式启动。这一次,他们下定决心凝聚学术界和产业界的力量,共同向机器人做家务这一高地发起冲击。

来自主题: AI资讯
6931 点击    2025-10-11 12:10
刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

全球文生图大模型王座,易主了。就在刚刚,LMArena竞技场发布了最新的文生图榜单,第一名来自中国,属于腾讯混元图像3.0!不仅超越了谷歌的Nano Banana,也超越了字节的Seedream和OpenAI的gpt-Image,在全球26个大模型中稳居第一。

来自主题: AI资讯
9184 点击    2025-10-05 21:36
给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。 然而,现有方法大多依赖模板生成图像 - 文本对,泛化能力有限,且视

来自主题: AI技术研报
6899 点击    2025-09-26 13:30