AI资讯新闻榜单内容搜索-训练数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练数据
小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米大模型第二代来了! 相比第一代,训练数据规模更大、品质更高,训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报
4855 点击    2024-11-13 09:12
胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

去年以来,包括纽约时报、Raw Story、The Intercept和AlterNet等在内的多家机构,针对ChatGPT所属的公司OpenAI提起诉讼,指控ChatGPT非法使用了新闻网站文章用于训练。近日,纽约联邦法官驳回了Raw Story和Alternet对OpenAI聊天机器人的训练数据提起的版权诉讼。

来自主题: AI资讯
11127 点击    2024-11-12 15:15
英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

人类只需要演示五次,就能让机器人学会一项复杂技能。英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。

来自主题: AI技术研报
6144 点击    2024-11-04 15:36
大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据

大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据

大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据

清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。

来自主题: AI技术研报
3915 点击    2024-10-31 14:41
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」

深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」

深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」

哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回答。

来自主题: AI资讯
4280 点击    2024-10-25 14:51
基于人类视频数据学习,「零次方科技」四个月已完成两款人形机器人研发|早期项目

基于人类视频数据学习,「零次方科技」四个月已完成两款人形机器人研发|早期项目

基于人类视频数据学习,「零次方科技」四个月已完成两款人形机器人研发|早期项目

目前,机器人的训练数据大体上可分为三类:第一类是真实的遥操数据,第二类是高质量的仿真合成数据,第三类是人类的行为数据、其主要源于互联网视频。

来自主题: AI资讯
3751 点击    2024-10-24 11:26
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点

全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点

全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点

Time-MoE采用了创新的混合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。

来自主题: AI技术研报
4367 点击    2024-10-23 13:40
OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

AI对待每个人类都一视同仁吗? 现在OpenAI用53页的新论文揭示:ChatGPT真的会看人下菜碟。 根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。

来自主题: AI技术研报
3417 点击    2024-10-16 14:20
软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

Skild AI 是一家位于匹兹堡的初创公司,由两位前 CMU 教授创立,旨在打造具身智能的通用大脑。Skild 宣称其模型展示了无与伦比的泛化和涌现能力,并且有多于竞争对手 1000 倍的训练数据。

来自主题: AI资讯
6746 点击    2024-09-25 20:28
AI训练数据之困:垃圾进,垃圾出

AI训练数据之困:垃圾进,垃圾出

AI训练数据之困:垃圾进,垃圾出

所有模型都是通过在来自互联网的海量数据上进行训练来工作的,然而,随着人工智能越来越多地被用来生成充满垃圾信息的网页,这一过程可能会受到威胁。

来自主题: AI资讯
7976 点击    2024-09-09 10:29