AI资讯新闻榜单内容搜索-多模态

龙虾冲浪终于不迷路了！网页智能体新框架Avenir-Web开源即SOTA

伦敦大学学院（UCL）、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web，让现有多模态模型像人类一样使用网页。现有的Web Agent在面对复杂的网页结构（如 iframe、Shadow DOM）时，往往会陷入“定位不准”“缺乏常识”或“走着走着就忘了”的窘境。

来自主题: AI技术研报

8812 点击 2026-04-30 08:32

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni，将文本、视觉、语音三大模态能力深度融合至单一模型体系，目前可免费使用。

来自主题: AI资讯

9763 点击 2026-04-29 19:52

开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下｜商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型，它的 Lite 系列 8B 和 A3B 参数版本，目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格，我们发现商汤这款新一代原生理解生成统一模型，就开源模型来说，已经做到了最好水平。

来自主题: AI产品测评

10803 点击 2026-04-29 19:51

刚刚，DeepSeek大更新！终于「开眼」了| 附大量实测

就在刚刚， DeepSeek 上线了识图模式，显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力，终于来了！目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式，APPSO 第一时间给大家进行了实测。

来自主题: AI资讯

8905 点击 2026-04-29 17:54

国产多模态Agent拿下医学分割SOTA！不用改模型、不加token | 浙大&上海AI Lab

这个生物医学视觉推理框架，被CVPR 2026接收了！

来自主题: AI技术研报

6986 点击 2026-04-22 09:11

AURA：让视频大模型从“看完再答”，走向“边看边理解、边看边响应”

近年来，视频多模态大模型（VideoLLM）发展迅猛，在视频描述、视频问答、时序定位等任务上不断刷新性能上限。随着模型能力持续增强，业界也开始思考一个更重要的问题：视频大模型能不能不再只是 “看完一段视频再回答”，而是真正进入实时世界，持续观察、实时理解，并在关键时刻主动给出反馈？

来自主题: AI技术研报

6642 点击 2026-04-21 09:23

速递｜AI内容电商OS「K2 Lab」再完成数千万天使轮融资，内测用户首周出单率70%，抢跑A2A原生电商新时代

近日，AI内容电商OS K2Lab宣布再次完成数千万元天使轮融资，这也是K2Lab三个月以来完成的第二轮融资，本轮融资由华控资本领投、云时资本跟投，心流资本FlowCapital担任长期财务顾问。本轮融资资金将用于A2A原生电商Agent OS建设、多模态垂直模型打造、海外用户规模化增长和AI Native团队的持续建设。

来自主题: AI资讯

9947 点击 2026-04-18 07:26

阿里首个世界模型：快乐…生蚝

就在刚刚，成立恰满一个月的阿里ATH（Alibaba Token Hub）事业群，发布全球首个主动式实时交互的世界模型产品。名也挺有趣的，叫HappyOyster（快乐生蚝）。HappyOyster搭载原生多模态架构，背后是支持多模态输入与音视频联合生成的流式生成世界模型，核心主打漫游（Wander）、导演（Direct）、创造（Create）、分享（Share）。

来自主题: AI资讯

8807 点击 2026-04-17 15:24

智象未来完成超5亿元新一轮融资，全力打造下一代原生全模态世界模型｜AlphaFamily

近日，国内多模态生成式人工智能公司智象未来（HiDream.ai）宣布完成超5亿元新一轮融资。本轮融资由东方富海、安徽省投资集团旗下的省产业投资公司、峰华资本等新股东联合投资，同时合肥产投、兴泰集团、合肥高投、安徽省人工智能母基金等老股东持续加注。

来自主题: AI资讯

8486 点击 2026-04-16 13:01

刚刚，腾讯最新世界模型开源！一句话造出3D世界，兼容游戏引擎

今日，腾讯正式发布并开源混元3D世界模型2.0（HY-World 2.0）。作为一款多模态的世界模型，HY-World 2.0支持文字、图片和视频等形式输入，可自动生成、重建并模拟完整的3D世界。

来自主题: AI资讯

9334 点击 2026-04-16 11:14