AI资讯新闻榜单内容搜索-ima

AI实验室Agnes AI开放全模态不限时免费API！重点是免费！

在这场日益蔓延的“Token焦虑”中，Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布，自6月1日起，旗下全模态模型API无限期免费开放。Agnes AI本次开放覆盖其三款核心模型：文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。

来自主题: AI资讯

13304 点击 2026-06-01 11:24

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

MiniMax M3 今日正式发布。MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了我们提出的全新注意力架构 MSA （MiniMax Sparse Attention），最高支持 1M 超长上下文。如外界所期待的那样，它也是一个原生多模态模型，支持图片和视频的输入，并能操作电脑桌面。

来自主题: AI资讯

10256 点击 2026-06-01 09:49

从Token无上限到全员Agent：MiniMax的AI Native组织进化实践丨MiniMax胡维琦 @AIGC2026

本次2026中国AIGC产业峰会上，MiniMax ToB中国区商业化负责人胡维琦，分享了自己在AI创业公司中的实践与思考。与其焦虑AI，不如加入AI。大家不用看营销号，更多的还是自己动手试试。

来自主题: AI资讯

8739 点击 2026-05-31 11:21

李飞飞造了ImageNet，现在她又带人超越了它

就在前两天，斯坦福大学等机构发布了一个名为 GPIC（Giant Permissive Image Corpus，巨型开放图像语料库）的数据集。

来自主题: AI技术研报

9797 点击 2026-05-30 15:57

上海大模型龙头MiniMax，启动A股上市！

证监会官网显示，上海AI大模型龙头企业MiniMax已于5月29日向上海证监局提交了上市辅导备案报告，开启A股上市进程，中信证券担任辅导机构。这也意味着，MiniMax将与已经提交A股上市辅导备案的智谱，一同冲刺A股大模型第一股。

来自主题: AI资讯

9657 点击 2026-05-30 10:55

DeepSeek陈德里开发自动研究Skill，用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里，在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch，DeepSeek-V4-Pro研究和写作，GPT-Image2画图。论文共迭代6次（V1：4 次，V2：1 次，V3：1 次），总耗时6天，进行了约108轮Agent调用，消耗64.8万token，写了2234行LaTeX代码。

来自主题: AI资讯

10291 点击 2026-05-27 09:47

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

8034 点击 2026-05-26 10:26

刚刚，10万人排队的ima copilot全面开放！

灰度一个月，这个数字让我们有点坐不住——它说明大家对"让AI用我的知识替我干活"这件事，等不及了。好消息是，从今天起，所有人打开 ima，都可以直接使用copilot。同时，ima知识号也开始能发布 Skill 了，知识广场从“内容平台”延伸为“能力平台”。

来自主题: AI资讯

9477 点击 2026-05-25 11:31

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer（UiT）打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型，不仅在多个基准测试中刷新 SOTA 纪录，也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。

来自主题: AI资讯

9249 点击 2026-05-25 09:49

22.9倍加速！FlashAR：仅用0.05%数据，让预训练好的自回归图像模型飞起来

来自浙江大学和阿德莱德大学的研究团队提出了 FlashAR—— 一个轻量级的后训练加速框架。不需要从头训练，在 Emu3.5-Image-34B 模型上，仅用原始训练数据的 0.05%（约 8 万张图片），就能将预训练好的自回归模型改造成高度并行的生成器 Emu3.5-34B-Flash，实现最高 22.9 倍的端到端加速。

来自主题: AI技术研报

8909 点击 2026-05-24 10:07