AI资讯新闻榜单内容搜索-模型训练

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报

12469 点击 2024-08-19 14:47

一文看懂Mamba，Transformer最强竞争者

Mamba 虽好，但发展尚早。

来自主题: AI资讯

8287 点击 2024-08-19 14:46

打脸“AI灭绝伦”，研究反驳：大模型涌现能力不会威胁人类生存

研究发现：大模型尚无法独立学习或获得新技能。

来自主题: AI资讯

4848 点击 2024-08-19 14:15

横扫16大榜单，最强开源单目深度估计算法来了，精度可以直接用于3D重建｜TPAMI 2024

单目深度估计新成果来了！

来自主题: AI技术研报

7857 点击 2024-08-18 16:51

世界模型又近了？MIT惊人研究：LLM已模拟现实世界，绝非随机鹦鹉！

MIT CSAIL的研究人员发现，LLM的「内心深处」已经发展出了对现实的模拟，模型对语言和世界的理解，绝不仅仅是简单的「鹦鹉学舌」。也就说，在未来，LLM会比今天更深层地理解语言。

来自主题: AI资讯

9989 点击 2024-08-18 10:34

Nature子刊 | 基于内生复杂性，自动化所新类脑网络构筑人工智能与神经科科学的桥梁

让模型具有更加广泛和通用的认知能力，是当前人工智能（AI）领域发展的重要目标。目前流行的大模型路径是基于 Scaling Law (尺度定律) 去构建更大、更深和更宽的神经网络提升模型的表现，可称之为 “基于外生复杂性” 的通用智能实现方法。然而，这一路径也面临着一些难以克服的困境，例如高昂的计算资源消耗和能源消耗，并且在可解释性方面存在不足。

来自主题: AI资讯

6783 点击 2024-08-18 10:16