AI资讯新闻榜单内容搜索-数据集

Figure人形机器人首秀灵巧手叠衣服！神经网络架构不变，只增加数据集就搞定

Figure人形机器人首秀，靠神经网络叠衣服！在没有任何架构改变、仅增加了数据的情况下，就让原本在物流场景干活的它，轻松习得了新技能。

来自主题: AI资讯

10093 点击 2025-08-14 12:37

o3 Gemini 都翻车？首个可验证长链 GUI 数据集 VeriGUI 重磅开源，探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起，有望彻底改变人机交互的方式。然而，这一领域的进展正面临瓶颈：现有数据集大多聚焦于 10 步以内的短程交互，且仅验证最终结果，无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯

8738 点击 2025-08-13 16:17

虚拟细胞将迎来GPT时刻！华人联合创办，中东土豪投资，剑指百亿级细胞数据集！

虚拟细胞（AIVC），被誉为生物学的圣杯之一。设想一下，如果能在临床前阶段使用AI较为准确的模拟新药在细胞内的反应，临床阶段所面临的问题将会显著减少。

来自主题: AI资讯

8109 点击 2025-08-13 13:06

独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

硅星人独家了解到，星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset，及其G0-快慢双系统全身智能VLA模型。这一举动无疑在相对各自为战的机器人行业打开了一条新的路径。

来自主题: AI资讯

11187 点击 2025-08-11 14:05

史上最大高质量科学推理后训练数据集开源，快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了！上海创智学院、上海交通大学（GAIR Lab）发布MegaScience。该数据集包含约125万条问答对及其参考答案，广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域，旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报

8214 点击 2025-08-09 15:52

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

众所周知，大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」，开发者利用大规模文本数据集训练模型，让它学会预测句子中的下一个词。第二阶段是「后训练」，旨在教会模型如何更好地理解和执行人类指令。

来自主题: AI技术研报

9979 点击 2025-08-08 11:22

面向6G环境感知通信！西电开源3Dx3D无线电地图数据集与生成式基准框架

当前环境感知通信正逐步成为第六代移动通信系统（6G）的核心使能技术之一。为支撑其在复杂三维环境下的部署需求，西安电子科技大学、香港中文大学（深圳）和加拿大滑铁卢大学的研究团队联合提出了一个面向6G的高分辨率多模态三维无线电图谱数据集UrbanRadio3D，并构建了基于扩散模型的三维无线电图生成框架RadioDiff-3D。

来自主题: AI技术研报

8539 点击 2025-08-05 16:07