AI资讯新闻榜单内容搜索-视觉理解模型

告别AI“乱画图表”！港中文团队发布首个结构化图像生成编辑系统

AI竟然画不好一张 “准确” 的图表？AI生图标杆如FLUX.1、GPT-Image，已经能生成媲美摄影大片的自然图像，却在柱状图、函数图这类结构化图像上频频出错，要么逻辑混乱、数据错误，要么就是标签错位。

来自主题: AI技术研报

11076 点击 2025-10-12 15:03

百度开源视觉理解模型Qianfan-VL！全尺寸领域增强+全自研芯片计算

今天，百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL，并全面开源！该系列包含3B、8B和70B三个尺寸版本，是面向企业级多模态应用场景，进行了深度优化的视觉理解大模型。

来自主题: AI资讯

8911 点击 2025-09-23 10:09

画到哪，动到哪！字节跳动发布视频生成「神笔马良」ATI，已开源！

近年来，随着扩散模型（Diffusion Models）、Transformer 架构与高性能视觉理解模型的蓬勃发展，视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务（Image-to-Video generation）尤其受到关注，其关键优势在于：能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。

来自主题: AI技术研报

9434 点击 2025-07-03 10:07