AI资讯新闻榜单内容搜索-数据集

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据集
虚拟细胞将迎来GPT时刻!华人联合创办,中东土豪投资,剑指百亿级细胞数据集!

虚拟细胞将迎来GPT时刻!华人联合创办,中东土豪投资,剑指百亿级细胞数据集!

虚拟细胞将迎来GPT时刻!华人联合创办,中东土豪投资,剑指百亿级细胞数据集!

虚拟细胞(AIVC),被誉为生物学的圣杯之一。 设想一下,如果能在临床前阶段使用AI较为准确的模拟新药在细胞内的反应,临床阶段所面临的问题将会显著减少。

来自主题: AI资讯
5985 点击    2025-08-13 13:06
独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

硅星人独家了解到,星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,及其G0-快慢双系统全身智能VLA模型。这一举动无疑在相对各自为战的机器人行业打开了一条新的路径。

来自主题: AI资讯
8895 点击    2025-08-11 14:05
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报
5869 点击    2025-08-09 15:52
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

众所周知,大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。

来自主题: AI技术研报
7729 点击    2025-08-08 11:22
面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架

面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架

面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架

当前环境感知通信正逐步成为第六代移动通信系统(6G)的核心使能技术之一。为支撑其在复杂三维环境下的部署需求,西安电子科技大学、香港中文大学(深圳)和加拿大滑铁卢大学的研究团队联合提出了一个面向6G的高分辨率多模态三维无线电图谱数据集UrbanRadio3D,并构建了基于扩散模型的三维无线电图生成框架RadioDiff-3D。

来自主题: AI技术研报
6558 点击    2025-08-05 16:07
ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

大语言模型(LLM)已经在多项自然语言处理任务中展现出卓越能力,但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集,往往偏重于「词汇多样性」,即让同一种风险指令尽可能用不同的表达方式出现,却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。

来自主题: AI技术研报
6469 点击    2025-08-01 10:37
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。

来自主题: AI技术研报
5959 点击    2025-07-29 10:12
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成又补齐了一块重要拼图——物理属性! 南洋理工大学-商汤联合研究中心S-Lab,及上海人工智能实验室合作提出了PhysXNet,号称首个系统性标注的物理基础3D数据集。

来自主题: AI技术研报
6361 点击    2025-07-23 13:18
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报
6604 点击    2025-07-18 11:44
全球首个亚洲人脸超大规模数据集发布:让AI终于“认识”亚洲面孔

全球首个亚洲人脸超大规模数据集发布:让AI终于“认识”亚洲面孔

全球首个亚洲人脸超大规模数据集发布:让AI终于“认识”亚洲面孔

近日,ICCV 2025(国际计算机视觉大会)公布论文录用结果,理想汽车共有 8 篇论文入选,其中 3 篇来自基座模型团队。

来自主题: AI技术研报
7140 点击    2025-07-17 12:12