AI资讯新闻榜单内容搜索-Image

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑新基准，360道人类专家严选难题

GPT-4o-Image也只能完成28.9%的任务，图像编辑评测新基准来了！360个全部由人类专家仔细思考并校对的高质量测试案例，暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报

10248 点击 2025-05-31 14:37

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型，支持文本与图像提示，角色一致性强，速度快达GPT-Image-1的8倍。

来自主题: AI资讯

8574 点击 2025-05-31 14:26

中国团队让AI拥有「视觉想象力」，像人类一样脑补画面来思考

在人类的认知过程中，视觉思维（Visual Thinking）扮演着不可替代的核心角色，这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报

10231 点击 2025-05-30 12:53

一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。

今年，Google算是打了个翻身仗。

来自主题: AI资讯

9810 点击 2025-05-22 10:06

史上最强AI全家桶！谷歌Gemini 2.5双杀OpenAI，上架250美金天价VIP

今夜，谷歌彻底杀疯！2小时发布会，Gemini提及95次点亮全场。Gemini 2.5家族全系升级，Pro深度思考模型正刷榜。全新Imagen 4生成细节超逼真，Veo 3首次实现音视频融合。

来自主题: AI资讯

6137 点击 2025-05-21 12:16

鹅厂放大招，混元图像2.0「边说边画」：描述完，图也生成好了

刚刚，鹅厂把文生图卷出了新高度——发布混元图像2.0模型（Hunyuan Image 2.0），首次实现毫秒级响应，边说边画，实时生成！用户一边描述，它紧跟着绘制，整个过程那叫一个丝滑。不用等待，专治各种没有耐心。

来自主题: AI资讯

9249 点击 2025-05-16 16:10

刚刚，OpenAI最强图像生成API上线，一张图1毛5

OpenAI推出图像生成API，低至0.02美元/张，支持多模态定制。

来自主题: AI资讯

9596 点击 2025-04-24 20:53

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯

9246 点击 2025-04-24 09:44

HiDream：最强文生图开源模型，来自合肥

刚出道的 HiDream-I1，拿下了 Hugging Face 趋势榜第二（图像榜第一），Artificial Analysis 文生图第二，排在Midjourney、Google Imagen、FLUX、SDXL 之前，仅次于 GPT-4o 。

来自主题: AI资讯

11368 点击 2025-04-16 10:10

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而，机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。

来自主题: AI技术研报

8317 点击 2025-04-09 08:59