AI资讯新闻榜单内容搜索-数据集

EMNLP 2025 | CARE：无需外部工具，让大模型原生检索增强推理实现上下文高保真

近日，来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架，一个新颖的原生检索增强推理框架，教会 LLM 将推理过程中的上下文事实与模型自身的检索能力有机结合起来。该框架现已全面开源，包括训练数据集、训练代码、模型 checkpoints 和评估代码，为社区提供一套完整的、可复现工作。

来自主题: AI技术研报

7812 点击 2025-10-07 22:10

CAIR开源发布超声基座大模型EchoCare“聆音”，10余项医学任务性能登顶

2025年9月17日，中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”）。该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成，在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越，性能全面登顶。

来自主题: AI技术研报

8633 点击 2025-10-06 15:53

NIPS 2025 Spotlight | 港大提出TreeSynth方法，一句话生成百万规模数据集

“TreeSynth” 就这样起源于作者们最初的构想：“如何通过一句任务描述生成海量数据，完成模型训练？” 同时，大规模 scalibility 对合成数据的多样性提出了新的要求。

来自主题: AI技术研报

8198 点击 2025-10-03 14:45

7000万种子轮，Synthesize Bio要做生物医药的OpenAI

近日Synthesize Bio宣布完成1000万美元种子轮融资，以加速生成基因组学模型的开发。Synthesize Bio已推出GEM-1，这是一个专为生成基因组学设计的基础模型，其基于迄今为止最完善的RNA测序数据集进行训练，使用者通过描述实验设计，就能获得接近真实实验的模拟数据。

来自主题: AI资讯

9758 点击 2025-09-28 23:01

给几何图片写标题就能让AI更聪明，UIUC发布高质量可泛化几何数据集

随着多模态大语言模型（MLLMs）在视觉问答、图像描述等任务中的广泛应用，其推理能力尤其是数学几何问题的解决能力，逐渐成为研究热点。然而，现有方法大多依赖模板生成图像 - 文本对，泛化能力有限，且视

来自主题: AI技术研报

7169 点击 2025-09-26 13:30

超10万亿Tokens的高质量数据集是怎么炼成的？专访中国电信天翼AI阮宜龙

正所谓“得数据者得天下”，这家央企算是把高质量数据集给玩明白了——超过10万亿tokens的通用大模型语料数据，以及覆盖14个关键行业的专业数据集，总存储量高达350TB！

来自主题: AI资讯

8609 点击 2025-09-26 10:59

谷歌DeepMind「粪坑淘金」全新方法，暗网毒数据也能训出善良模型

谷歌DeepMind研究团队一年前的研究成果直到昨晚才姗姗揭秘，提出了一种叫做GDR的新方法，颠覆了传统训练中设法剔除脏数据的思路，将饱含恶意内容的数据「变废为宝」，处理后的数据集用于训练，甚至比直接剔除脏数据训练出的模型效果还好，「出淤泥而不染」，「择善而从」。

来自主题: AI技术研报

9106 点击 2025-09-17 09:43

We-Math 2.0：全新多模态数学推理数据集 × 首个综合数学知识体系

近期，多模态大模型在图像问答与视觉理解等任务中进展迅速。随着 Vision-R1 、MM-Eureka 等工作将强化学习引入多模态推理，数学推理也得到了一定提升。

来自主题: AI技术研报

9155 点击 2025-08-28 12:20

为防AI刷题，Nature等顶刊最新封面被做成数据集，考验模型科学推理能力|上海交通大学

近年来，以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型，在各大基准测试（如MMMU）中捷报频传，纷纷刷榜成功。

来自主题: AI技术研报

8345 点击 2025-08-26 10:41

ICCV 2025 | 打造通用工具智能体的基石：北大提出ToolVQA数据集，引领多模态多步推理VQA新范式

本文提出了一个旨在提升基础模型工具使用能力的大型多模态数据集 ——ToolVQA。现有研究已在工具增强的视觉问答（VQA）任务中展现出较强性能，但在真实世界中，多模态任务往往涉及多步骤推理与功能多样的工具使用，现有模型在此方面仍存在显著差距。

来自主题: AI技术研报

6986 点击 2025-08-22 16:20