AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

训练一次经历 419 次意外故障，英伟达 GPU 也差点玩不转 405B 模型，全靠 Meta 工程师后天救场

训练一次经历 419 次意外故障，英伟达 GPU 也差点玩不转 405B 模型，全靠 Meta 工程师后天救场

训练一次经历 419 次意外故障，英伟达 GPU 也差点玩不转 405B 模型，全靠 Meta 工程师后天救场

一半以上的故障都归因于 GPU 及其高带宽内存。

来自主题: AI资讯

6772 点击 2024-07-29 17:47

破解AI“胡说八道”，这家公司要给大模型投喂好原料｜产品观察

破解AI“胡说八道”，这家公司要给大模型投喂好原料｜产品观察

破解AI“胡说八道”，这家公司要给大模型投喂好原料｜产品观察

已在多家头部大模型厂商的预训练流程中使用。

来自主题: AI资讯

2957 点击 2024-07-29 12:32

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

自回归训练方式已经成为了大语言模型（LLMs）训练的标准模式，今天介绍一篇来自阿联酋世界第一所人工智能大学MBZUAI的VILA实验室和CMU计算机系合作的论文，题为《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch via Autoregressive Distillation》

来自主题: AI技术研报

8689 点击 2024-07-28 23:25

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。

来自主题: AI技术研报

10100 点击 2024-07-28 22:00

ECCV 2024｜是真看到了，还是以为自己看到了？多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024｜是真看到了，还是以为自己看到了？多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024｜是真看到了，还是以为自己看到了？多模态大模型对文本预训练知识的过度依赖该解决了

随着大型语言模型（LLMs）的进步，多模态大型语言模型（MLLMs）迅速发展。它们使用预训练的视觉编码器处理图像，并将图像与文本信息一同作为 Token 嵌入输入至 LLMs，从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。

来自主题: AI技术研报

9772 点击 2024-07-27 19:33

万亿token！史上最大多模态数据集诞生

万亿token！史上最大多模态数据集诞生

万亿token！史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。

来自主题: AI技术研报

8458 点击 2024-07-27 19:29

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

用来运行 Llama 3 405B 优势明显。

来自主题: AI技术研报

10484 点击 2024-07-27 19:22

反转了？在一场新较量中，号称替代MLP的KAN只赢一局

反转了？在一场新较量中，号称替代MLP的KAN只赢一局

反转了？在一场新较量中，号称替代MLP的KAN只赢一局

KAN 在符号表示中领先，但 MLP 仍是多面手。

来自主题: AI技术研报

8247 点击 2024-07-27 19:13

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。

来自主题: AI资讯

9118 点击 2024-07-27 19:02

牛津剑桥「投毒」AI失败9次登Nature封面，引爆学术圈激辩！AI训AI能否打破崩溃魔咒？

牛津剑桥「投毒」AI失败9次登Nature封面，引爆学术圈激辩！AI训AI能否打破崩溃魔咒？

牛津剑桥「投毒」AI失败9次登Nature封面，引爆学术圈激辩！AI训AI能否打破崩溃魔咒？

牛津剑桥的9次投毒导致模型崩溃的论文，已经遭到了诸多吐槽：这也能上Nature？学术圈则对此进行了进一步讨论，大家的观点殊途同归：合成数据被很多人视为灵丹妙药，但天下没有免费的午餐。

来自主题: AI技术研报

6294 点击 2024-07-27 17:38

上一页当前第419页,共489页下一页