AI资讯新闻榜单内容搜索-训练

英伟达被曝「偷」数据，每天爬取超 80 年视频数据量，北大学术数据集也遭殃

最近的英伟达似乎步入了多事之秋。

来自主题: AI技术研报

9382 点击 2024-08-07 10:48

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

8344 点击 2024-08-05 15:25

The Information近日爆出了一则OpenAI的亏损新闻，其中新增的关键数据包括： OpenAI目前单月收入约为2.83mnUSD，全年营收可能在35~45亿美金。 OpenAI 24年推理成本将达到40亿美金，训练成本将达到30亿美金。

来自主题: AI资讯

7351 点击 2024-08-05 15:17

简而言之：矩阵 → ReLU 激活 → 矩阵

来自主题: AI技术研报

11230 点击 2024-08-05 14:11

为了对齐 LLM，各路研究者妙招连连。

来自主题: AI技术研报

12465 点击 2024-08-05 14:09

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

10109 点击 2024-08-05 14:04

在 RAG 系统开发中，良好的 Reranker 模型处于必不可少的环节，也总是被拿来放到各类评测当中，这是因为以向量搜索为代表的查询，会面临命中率低的问题，因此需要高级的 Reranker 模型来补救，这样就构成了以向量搜索为粗筛，以 Reranker 模型作精排的两阶段排序架构。

来自主题: AI技术研报

11340 点击 2024-08-05 13:58

如今一场席卷人工智能圈的“石油危机”已经出现，几乎每一家AI厂商都在竭力寻求新的语料来源，但再多的数据似乎也填不满AI大模型的胃口。更何况越来越多的内容平台意识到了手中数据的价值，纷纷开始敝帚自珍。为此，“合成数据”也成为了整个AI行业探索的新方向。

来自主题: AI资讯

8713 点击 2024-08-05 12:23

在当前 AI 领域，大语言模型采用的主流架构是 Transformer。不过，随着 RWKV、Mamba 等架构的陆续问世，出现了一个很明显的趋势：在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进入人们的视线。

来自主题: AI资讯

11270 点击 2024-08-04 14:04

你规定路线，Tora 来生成相应轨迹的视频。

来自主题: AI技术研报

9760 点击 2024-08-04 14:01