AI资讯新闻榜单内容搜索-模型

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

12230 点击 2025-03-20 09:48

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成，Github Star破千

近年来，扩散模型在图像与视频合成领域展现出强大能力，为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面，该技术能够基于一系列预设姿态驱动参考图像，使其动态化，从而生成高度可控的人体动画视频。

来自主题: AI技术研报

10126 点击 2025-03-20 09:34

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

近年来，大型语言模型（LLM）通过大量计算资源在推理阶段取得了解决复杂问题的突破。推理速度已成为 LLM 架构的关键属性，市场对高效快速的 LLM 需求不断增长。

来自主题: AI技术研报

6991 点击 2025-03-20 09:26

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像（Text-to-Image, T2I）生成任务近年来取得了飞速进展，其中以扩散模型（如 Stable Diffusion、DiT 等）和自回归（AR）模型为代表的方法取得了显著成果。然而，这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量，导致计算成本高昂、落地困难，难以高效地应用于实际生产环境。

来自主题: AI技术研报

8223 点击 2025-03-20 09:18

速递｜将2D照片转化为3D视频，新模型能否解决Stability AI商业困境

Stability AI 发布了一款新 AI 模型——Stable Virtual Camera，该公司宣称该模型能将 2D 图像转化为，具有真实深度和视角的“沉浸式”视频。

来自主题: AI资讯

8669 点击 2025-03-19 15:08

世界模型在机器人任务规划中的全新范式：NUS邵林团队提出通用机器人规划模型FLIP

人类具有通用的、解决长时序复杂任务的规划能力，这在我们处理生活中的复杂操作任务时很有用。

来自主题: AI技术研报

8757 点击 2025-03-19 14:57

NAACL2025｜中国移动九天团队提出大模型调色板：一种可控文本生成的解决方案

大模型在文本生成方面取得了卓越的成就，通过合适的prompt设计，往往可以使得生成结果符合特定的需求。但是为属性繁多的任务设计出合适的prompt是很困难的。一种解决方案是通过线性组合方式或者其变种将每个属性对应的模型在生成logits上进行融合。鉴于属性之间可能存在的冲突现象，这种方案无法保证模型的主属性不受其他模型的干扰。

来自主题: AI技术研报

10237 点击 2025-03-19 14:52