AI资讯新闻榜单内容搜索-北京大学

北大发布ConsisID：无需训练Lora，就可以定制化个人视频写真！

这两天，北京大学等研究团队发布了一个视频生成的可控生成工作：ConsisID。ConsisID可以实现无需训练Lora的保持参考人脸一致性的文生视频，类似之前图像生成的IP-Adapter-Face和InstantID等工作。虽然之前也有类似的工作，但是ConsisID在效果更上一个台阶。

来自主题: AI技术研报

7316 点击 2024-12-06 09:25

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式，相比传统模型在多项任务中表现出色，同时降低了参数量和计算量，增强了对周期性特征的建模能力，应用潜力广泛。

来自主题: AI技术研报

6239 点击 2024-11-26 13:43

NeurIPS 2024 | 无需训练，一个框架搞定开放式目标检测、实例分割

本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景，该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM，在无需训练的情况下，取得了良好的开放式 (Open-ended) 目标检测和实例分割结果，论文已被 NeurIPS 2024 录用。

来自主题: AI技术研报

4072 点击 2024-11-16 15:21

全球首个法律o1大模型发布，System2范式下慢思考法律专家｜港科大&北大

OpenAI o1风格的推理大模型，有行业垂直版了。HK-O1aw，是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队（PKU-Alignment Team）推出的全球首个慢思考范式法律推理大模型。

来自主题: AI资讯

4297 点击 2024-11-09 15:34

一块显卡理解一部电影，最新超长视频理解大模型出炉！“大海捞针”准确率近95%，代码已开源

仅需1块80G显卡，大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。

来自主题: AI技术研报

4846 点击 2024-10-28 16:52

世界模型新突破！极佳科技提出DriveDreamer4D，首次利用世界模型增强4D驾驶场景重建效果

近日，极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D，是首个利用世界模型增强 4D 驾驶场景重建效果的工作。

来自主题: AI技术研报

4814 点击 2024-10-28 15:00

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

北京大学的研究人员开发了一种新型多模态框架FakeShield，能够检测图像伪造、定位篡改区域，并提供基于像素和图像语义错误的合理解释，可以提高图像伪造检测的可解释性和泛化能力。

来自主题: AI技术研报

5280 点击 2024-10-25 11:03

北大陈宝权教授：从图形计算到世界模型

近日，北京大学陈宝权教授在第九届计算机图形学与混合现实研讨会（GAMES 2024）上，发表了题为《从图形计算到世界模型》的主旨报告，分享了他从图形仿真角度对世界模型的思考。本文是对陈教授报告的完整整理，以供大家学习。

来自主题: AI技术研报

7560 点击 2024-09-30 15:48

北大提出首个通用指令导航大模型系统 | CoRL 24

如今这种科幻电影中的场景正在变为现实，来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。

来自主题: AI资讯

4378 点击 2024-09-12 15:22

让不足百元的AI数字人替人打工，风平智能获近亿元A轮系列融资

《智能涌现》获悉，AI数字人公司风平智能（Fullpeace）已完成累计近亿元A轮系列融资，由璀璨者资本及华为系企业家华鲲资本基金共同投资，包括汇财资本、北京大学人工智能创新中心主任雷鸣、清华大学杰出校友系的基金在内的老股东全部跟投。该笔资金将用于加强核心技术研发，优化AI数字人应用产品和AI营销解决方案。

来自主题: AI资讯

9804 点击 2024-09-11 16:56