AI资讯新闻榜单内容搜索-模型

多模态幻觉的病因「高熵节点」找到了！全基准幻觉率下降

多模态大推理模型的幻觉，很多时候并非「没看见」，而是在最不确定的推理阶段想偏了。最新研究发现，模型在生成because、however、wait等transition words时，往往处于高熵关键节点，更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token，而是先在潜在语义空间保留多种候选推理方向，并通过视觉锚点持续拉回图像证据，显著缓解幻觉。

来自主题: AI技术研报

9445 点击 2026-04-11 09:37

又一国产模型黑马出世，追平Gemini 2.5 Pro，空间编辑反超视频模型？

近日，京东开源图像模型JoyAI-Image-Edit，将空间智能纳入图像理解与编辑，让AI开始处理真实世界中的空间关系，让模型真正“理解空间，编辑空间”。简单解释，这是一个以空间智能为核心的图像生成与编辑模型，让 AI 真正“看懂”三维空间，从而让生成更合理、编辑更精准。

来自主题: AI资讯

9012 点击 2026-04-10 21:09

刚刚，MiniMax新模型接管「音乐圈」！20秒出歌Cover全风格

4 月 10 日，MiniMax 又带来一次重磅更新，其中最核心的新功能，就是 Cover 翻唱。一首平平无奇的生日快乐歌，可以被 cover 成 EDM 风格：经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调：

来自主题: AI资讯

8471 点击 2026-04-10 21:07

马斯克说漏嘴了！Claude Opus参数5T，Sonnet 1T

哦豁，马斯克一个“不小心”，把Claude参数抖出来了？？？长话短说：Sonnet 1T、Opus 5T。起因是老马发帖表示，xAI的Colossus 2超算正在训练7个模型，其中最大的一款，参数量直接冲到了10万亿。

来自主题: AI资讯

8647 点击 2026-04-10 16:11

SVG性能比肩GPT/Claude，腾讯开源3B模型HiVG，让Token「懂几何」

HiVG是一个面向SVG生成的层次化分词框架，在减少63.8% token数量的同时，以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG，在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。

来自主题: AI资讯

7890 点击 2026-04-10 16:04

刚刚，阿里官方认领神秘「欢乐马」，来自ATH郑波团队

刚刚，这只爆火的「欢乐马」被认领了！是来自阿里巴巴 ATH 旗下郑波团队的模型，ATH 也就是不久前阿里刚成立的 AI 核心事业群 Alibaba Token Hub。阿里巴巴 ATH 表示：HappyHorse 是阿里 ATH 旗下创新事业部研发的模型，目前正处于内测中，也会于近期开放 API。

来自主题: AI资讯

8376 点击 2026-04-10 16:02

视频生成不再「断片」：OneStory给模型装上「选择性记忆」，跨镜头讲故事人物场景始终如一丨CVPR'26

最近，来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory（收录于CVPR 2026）。这项工作聚焦于一个核心问题：如何在生成多镜头视频时，有效保留长程跨镜头上下文，从而实现更强的叙事一致性。

来自主题: AI技术研报

7039 点击 2026-04-10 15:36