AI资讯新闻榜单内容搜索-模型

ICML 2025 | 长视频理解新SOTA！蚂蚁&人大开源ViLAMP-7B，单卡可处理3小时视频

在视觉语言模型（Vision-Language Models，VLMs）取得突破性进展的当下，长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例，仅需数分钟即可产生逾百万的视觉 token，这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报

7330 点击 2025-05-13 08:54

CMU朱俊彦等上新LEGOGPT，一句话就能搭乐高，网友：复杂零件行不行？

AI 不允许有人不会搭乐高。

来自主题: AI技术研报

10297 点击 2025-05-12 16:14

全球首次实测通过！CMU华人用AI设计的乐高「不翻车」

如何将一句简单的文字描述变成物理稳定的乐高模型？LegoGPT通过物理感知技术，确保98.8%的设计稳如磐石。

来自主题: AI资讯

10135 点击 2025-05-12 16:12

强迫模型自我争论，递归思考版CoT热度飙升！网友：这不就是大多数推理模型的套路吗？

递归思考 + 自我批判，CoRT 能带来 LLM 推理力的飞跃吗？

来自主题: AI技术研报

7581 点击 2025-05-12 15:27

清华&通院推出"绝对零"训练法，零外部数据大模型自我博弈解锁推理能力

不用引入外部数据，通过自我博弈（Self-play）就能让预训练大模型学会推理？

来自主题: AI技术研报

7846 点击 2025-05-12 15:18

国内首个光子芯片专用大模型 OptoChat AI 重磅亮相

在新一轮科技革命与产业变革的汹涌浪潮中，光子技术作为构筑未来信息社会的核心基建，正以加速度驶入智能化与规模化协同发展的深水区。作为支撑新质生产力体系的重要支柱，光子技术在信息传输、智能计算、感知交互等战略领域，发挥着不可替代的关键作用，已然成为驱动未来产业生态跃迁的核心引擎。

来自主题: AI资讯

9397 点击 2025-05-12 15:12

Agentic AI 要终结数据库和 SaaS？大厂掌门人公开互撕，焦虑的 CEO 们押上了不同的技术路线

Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。

来自主题: AI资讯

9014 点击 2025-05-12 15:07

CVPR2025｜MCA-Ctrl：多方协同注意力控制助力AIGC时代图像精准定制化

近年来，生成式人工智能（Generative AI）技术的突破性进展，特别是文本到图像 T2I 生成模型的快速发展，已经使 AI 系统能够根据用户输入的文本提示（prompt）生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型，这一领域的技术迭代呈现出加速发展的态势。

来自主题: AI技术研报

12193 点击 2025-05-12 14:59

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。

来自主题: AI技术研报

9398 点击 2025-05-12 14:51

8秒极速生成！复杂场景图像定制低成本轻松驾驭，已开源丨字节北大联合发布

可控图片生成，如今已经不是什么新鲜事。甚至也不需要复杂的提示词，用户通过简单的文本描述，就能快速生成符合个人需求的创意图像。

来自主题: AI技术研报

9954 点击 2025-05-12 14:07