AI资讯新闻榜单内容搜索-数据集

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据集
山东工艺美术学院入选“北数所”首批100个AI大模型高质量训练数据集

山东工艺美术学院入选“北数所”首批100个AI大模型高质量训练数据集

山东工艺美术学院入选“北数所”首批100个AI大模型高质量训练数据集

3月29日,以“数据驱动,智绘未来”为主题的2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会举办。会上,北京国际大数据交易所(以下简称“北数所”)牵头正式发布首批100个人工智能大模型高质量训练数据集,经联盟牵头推荐,中关村数字媒体产业联盟成员单位新华网、山东工艺美术学院、中国搜索、中文在线、北京服装学院、硅星人等院校、企业的高质量数据集入选。

来自主题: AI资讯
8529 点击    2024-04-05 11:17
没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

如果让你在互联网上给大模型选一本中文教材,你会去哪里取材?是知乎,是豆瓣,还是微博?一个研究团队为了构建高质量的中文指令微调数据集,对这些社交媒体进行了测试,想找到训练大模型最好的中文预料,结果答案保证让你大跌眼镜——

来自主题: AI资讯
6697 点击    2024-04-04 15:47
弱智吧:大模型变聪明,有我一份贡献

弱智吧:大模型变聪明,有我一份贡献

弱智吧:大模型变聪明,有我一份贡献

「被门夹过的核桃,还能补脑吗?」

来自主题: AI技术研报
6332 点击    2024-04-04 15:36
UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一

UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一

UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一

Claude 3不但数据集跑分领先,用户体验上也将成为最强大的LLM,GPT-5在哪里?

来自主题: AI资讯
7301 点击    2024-03-24 21:24
何恺明刘壮新作:消除数据集偏差的十年之战

何恺明刘壮新作:消除数据集偏差的十年之战

何恺明刘壮新作:消除数据集偏差的十年之战

MIT新晋副教授何恺明,新作新鲜出炉:瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。数据集偏差之战,在2011年由知名学者Antonio Torralba和Alyosha Efros提出——

来自主题: AI技术研报
3987 点击    2024-03-16 11:24
刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

StepCoder将长序列代码生成任务分解为代码完成子任务课程来缓解强化学习探索难题,对未执行的代码段以细粒度优化;还开源了可用于强化学习训练的APPS+数据集。

来自主题: AI技术研报
5436 点击    2024-03-15 15:38
强壮全球200个大模型,OpenBMB推动开源社区对齐研究

强壮全球200个大模型,OpenBMB推动开源社区对齐研究

强壮全球200个大模型,OpenBMB推动开源社区对齐研究

迄今,全球超 200 个模型基于来自 OpenBMB 开源社区的 Ultra Series 数据集(面壁 Ultra 对齐数据集)对齐,数据集包括 UltraFeedback 和 UltraChat,共计月均下载量超 100 万。

来自主题: AI资讯
4446 点击    2024-03-14 16:33
零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。

来自主题: AI技术研报
4452 点击    2024-03-11 17:17
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。

来自主题: AI技术研报
8838 点击    2024-03-10 16:10