AI资讯新闻榜单内容搜索-训练数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练数据
第一个100%开源的MoE大模型,7B的参数,1B的推理成本

第一个100%开源的MoE大模型,7B的参数,1B的推理成本

第一个100%开源的MoE大模型,7B的参数,1B的推理成本

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。

来自主题: AI技术研报
8492 点击    2024-09-05 22:02
AI落地前端实操,带你成为公司最懂AI的前端大佬!

AI落地前端实操,带你成为公司最懂AI的前端大佬!

AI落地前端实操,带你成为公司最懂AI的前端大佬!

基于公司私有组件生成代码,这个问题的本质是:由于大模型的训练数据集不包含你公司的私有组件数据,因此不能够生成符合公司私有组件库的代码。

来自主题: AI技术研报
9814 点击    2024-09-02 12:42
「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落

「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落

「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落

人工智能系统依靠充足、高质量的训练数据来获得高性能,但MIT等机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。

来自主题: AI资讯
7325 点击    2024-08-13 17:36
李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot

李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot

李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot

李飞飞老师提出了空间智能 (Spatial Intelligence) 这一概念,作为回应,来自上交、斯坦福、智源、北大、牛津、东大的研究者提出了空间大模型 SpatialBot,并提出了训练数据 SpatialQA 和测试榜单 SpatialBench, 尝试让多模态大模型在通用场景和具身场景下理解深度、理解空间。

来自主题: AI技术研报
9938 点击    2024-08-07 14:12
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。

来自主题: AI技术研报
6309 点击    2024-08-01 15:55
Nature封面:AI训练AI,越训越离谱

Nature封面:AI训练AI,越训越离谱

Nature封面:AI训练AI,越训越离谱

训练数据是用 GPT-4o 生成的?那质量不好说了。

来自主题: AI资讯
8839 点击    2024-07-25 18:13
「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

近日,《连线》杂志联合ProofNews联合发表一篇调查文章,指责苹果、Anthropic等科技巨头未经许可使用YouTube视频训练AI模型。但训练数据的使用边界究竟在哪里?创作者、大公司和开发者正在陷入知识产权的罗生门……

来自主题: AI资讯
9765 点击    2024-07-19 12:21
生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平

生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平

生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平

生成式模型原本被设计来模仿人类的各种复杂行为,但人们普遍认为它们最多只能达到与其训练数据中的专家相当的水平。不过,最新的研究突破了这一限制,表明在特定领域,如国际象棋,通过采用低温采样技术,这些模型能够超越它们所学习的那些专家,展现出更高的能力。

来自主题: AI技术研报
9662 点击    2024-07-12 17:18