AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!

世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!

世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!

MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「鹦鹉学舌」。也就说,在未来,LLM会比今天更深层地理解语言。

来自主题: AI资讯
9401 点击    2024-08-18 10:34
Nature子刊 | 基于内生复杂性,自动化所新类脑网络构筑人工智能与神经科科学的桥梁

Nature子刊 | 基于内生复杂性,自动化所新类脑网络构筑人工智能与神经科科学的桥梁

Nature子刊 | 基于内生复杂性,自动化所新类脑网络构筑人工智能与神经科科学的桥梁

让模型具有更加广泛和通用的认知能力,是当前人工智能(AI)领域发展的重要目标。目前流行的大模型路径是基于 Scaling Law (尺度定律) 去构建更大、更深和更宽的神经网络提升模型的表现,可称之为 “基于外生复杂性” 的通用智能实现方法。然而,这一路径也面临着一些难以克服的困境,例如高昂的计算资源消耗和能源消耗,并且在可解释性方面存在不足。

来自主题: AI资讯
5503 点击    2024-08-18 10:16
大模型正在从黄金时代进入白银时代

大模型正在从黄金时代进入白银时代

大模型正在从黄金时代进入白银时代

越来越多人开始关注大模型,很多做工程开发的同学问我怎么入门大模型训练推理系统软件(俗称大模型Infra)。

来自主题: AI资讯
9604 点击    2024-08-16 20:52
10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

发布40天后,最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta,而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报
6187 点击    2024-08-16 14:49
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?

来自主题: AI技术研报
5595 点击    2024-08-16 14:17
“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

有个怪事儿,前段时间,大模型竞技场上,一位代码为sus-column-r的匿名模型横空出世

来自主题: AI资讯
7201 点击    2024-08-16 10:45
大模型指令调优数据集万字评测!腾讯上交大联合出品

大模型指令调优数据集万字评测!腾讯上交大联合出品

大模型指令调优数据集万字评测!腾讯上交大联合出品

随着大模型的快速发展,指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。

来自主题: AI技术研报
9923 点击    2024-08-15 17:10