# 热门搜索 #
搜索
搜索: 数据集
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰

近日,又一惊人结论登上Hacker News热榜:没有指数级数据,就没有Zero-shot!多模态模型被扒实际上没有什么泛化能力,生成式AI的未来面临严峻挑战。

来自主题: AI技术研报
8938 点击    2024-05-21 15:27
西浦、利物浦大学提出:点云数据增强首个全面综述

本文是对发表于模式识别领域顶刊Pattern Recognition 2024的最新综述论文:「Advancements in Point Cloud Data Augmentation for Deep Learning: A Survey 」的解读。

来自主题: AI技术研报
2546 点击    2024-05-14 13:17
前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库

今年 3 月,以构建大型开源社区而闻名的 AI 初创公司 Hugging Face,挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot,引起了轰动。

来自主题: AI技术研报
5718 点击    2024-05-08 11:05
为了给大模型找语料,有人开始进行“互联网考古”

过去一年,AI大模型无疑是科技行业中最亮眼的主角,从FAAMG到BAT、再到一众初创企业,无数优秀的大脑、海量的资源都投入到了这个有望解放人类生产力的赛道中。

来自主题: AI资讯
9912 点击    2024-05-06 12:54
开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键,但现状是,开源的大模型有一堆,可开源的大规模数据却没多少,而收集、清洗数据又是一项极其费时费力的工作,也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报
4396 点击    2024-05-05 19:51