# 热门搜索 #
搜索
搜索: 数据集
网文作者打响AI训练反击战

伴随着人工智能的高速发展,用户或创作者与平台间围绕AI侵权的纠纷时有发生。

来自主题: AI资讯
7846 点击    2024-07-27 14:07
「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

近日,《连线》杂志联合ProofNews联合发表一篇调查文章,指责苹果、Anthropic等科技巨头未经许可使用YouTube视频训练AI模型。但训练数据的使用边界究竟在哪里?创作者、大公司和开发者正在陷入知识产权的罗生门……

来自主题: AI资讯
8945 点击    2024-07-19 12:21
双向赋能:AI与数据库的修行之道

在这个数据为王的时代,数据是人工智能的三大支柱之一,其重要性不言而喻。最近,OpenAI 收购了数据库初创公司 Rockset,迅速引起了业内外的广泛关注。OpenAI 早已在算法和计算能力方面遥遥领先,通过这次战略性的收购,OpenAI 将在其产品中融合 Rockset 的先进数据索引和查询技术,帮助 OpenAI 将数据转化为 “可操作智能”。

来自主题: AI资讯
5686 点击    2024-06-29 00:10
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?

来自主题: AI技术研报
7853 点击    2024-06-24 15:25