AI资讯新闻榜单内容搜索-数据集

中国科学院携手全球顶尖机构发布首个十亿参数级的手术视频基础模型SurgMotion！

手术 AI 正在从 “单帧感知” 迈向 “全流程视频理解” 的全新时代！近日，由中国科学院香港创新研究院人工智能与机器人创新中心领衔，发布了全球首个十亿级参数、最大规模数据集练成的手术视频原生基础模型 ——SurgMotion！

来自主题: AI技术研报

8325 点击 2026-07-08 15:03

近日，北京航空航天大学史振威教授和邹征夏教授团队发布了一个面向通用遥感目标检测的大规模数据集与基础模型框架 ——LEVIRDet。该研究构建了目前最大规模、最全面的遥感目标检测数据集 LEVIRDet-159，并在此基础上提出了面向通用遥感检测的基础模型 LEVIRDetNet。

来自主题: AI技术研报

7470 点击 2026-07-07 10:20

看《堡垒之夜》的游戏录像，也能训练AI？没错，一家靠着海量游戏录像训练AI的公司General Intuition，刚刚完成3.2亿美元（约合人民币21.77亿元）融资。General Intuition公开披露的融资总额已达4.54亿美元，估值23亿美元。

来自主题: AI资讯

10440 点击 2026-06-28 00:22

DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集，包含4818个真实任务实例。它通过结构化文档和严格验证机制，帮助智能体掌握复杂系统构建能力，而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。

来自主题: AI技术研报

9991 点击 2026-06-25 10:04

本研究由快手科技语言大模型团队完成，核心作者吕民轩、梅铁桦、杜坦隆等。快手科技与中国科学院大学联合提出 GoLongRL，一套完全开源的长上下文强化学习后训练方案，包含 23K 样本 RLVR 数据集

来自主题: AI技术研报

7776 点击 2026-06-20 10:21

硬氪获悉，具身智能企业穹彻智能（Noematrix）近日完成新一轮数亿元融资，本轮融资由无锡数据集团领投，投资方包括上海交通大学AI未来基金（创业基金）、上海创之智科技有限公司（上海创智学院全资子公司）、一村资本等。

来自主题: AI资讯

7766 点击 2026-06-19 10:42

从原始视频出发，无需人工介入，自动生成 3D 重建、深度、2D mask、3D 框、实例描述、3D grounding 和空间问答。Holi-Spatial 试图把「空间智能」的数据生产，推进到自动化、可扩展的新阶段。

来自主题: AI技术研报

6732 点击 2026-06-19 10:16

北大彭宇新团队提出「美学照片重构」新任务，从摄影教学视频中自动构建数据集AesRecon，并开发两阶段模型AesFormer，通过优化构图、视角与人物姿态，提升照片的美感与艺术表现力。

来自主题: AI技术研报

10988 点击 2026-06-08 14:49

就在前两天，斯坦福大学等机构发布了一个名为 GPIC（Giant Permissive Image Corpus，巨型开放图像语料库）的数据集。

来自主题: AI技术研报

10114 点击 2026-05-30 15:57

我去搜了下 MiniCPM5-1B 的数据，发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集：Ultra-FineWeb-L3 ：600B tokens，中英文都有，是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报

9846 点击 2026-05-30 10:06