AI资讯新闻榜单内容搜索-模型

清华NLP开源RAG开箱即用框架，自动适配知识库无需纠结模型选型

RAG系统的搭建与优化是一项庞大且复杂的系统工程，通常需要兼顾测试制定、检索调优、模型调优等关键环节，繁琐的工作流程往往让人无从下手。

来自主题: AI资讯

9564 点击 2025-01-29 12:34

突发公告：受到大规模恶意攻击！DeepSeek爆火，英伟达股价暴跌

今天（1月28日）凌晨，国内火爆的AI大模型公司深度求索（DeepSeek）称遭受大规模恶意攻击。据悉，DeepSeek旗下AI（人工智能）服务在24小时内经历多次宕机。

来自主题: AI资讯

8923 点击 2025-01-28 12:28

超全推理语言模型蓝图来了！揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构提出了推理语言模型（RLM）蓝图，超越LLM局限，更接近AGI，有望人人可用o3这类强推理模型。

来自主题: AI技术研报

8359 点击 2025-01-28 12:20

新范式，自回归大一统！北大提出VARGPT：单一框架实现视觉「理解」与「生成」

VARGPT是一种新型多模态大模型，能够在单一框架内实现视觉理解和生成任务。通过预测下一个token完成视觉理解，预测下一个scale完成视觉生成，展现出强大的混合模态输入输出能力。

来自主题: AI技术研报

8271 点击 2025-01-28 12:07

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map，提高学生模型的准确性。迁移学习则通常通过预训练和微调，将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。

来自主题: AI技术研报

5842 点击 2025-01-28 11:57

CityDreamer4D: 下一个世界模型，何必是视频生成模型？

在过去的两年里，城市场景生成技术迎来了飞速发展，一个全新的概念 ——世界模型（World Model）也随之崛起。当前的世界模型大多依赖 Video Diffusion Models（视频扩散模型）强大的生成能力，在城市场景合成方面取得了令人瞩目的突破。然而，这些方法始终面临一个关键挑战：如何在视频生成过程中保持多视角一致性？

来自主题: AI技术研报

7944 点击 2025-01-28 11:53