AI资讯新闻榜单内容搜索-训练

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报

11133 点击 2024-02-29 13:27

Reddit和OpenAI及谷歌，竟有着如此错综复杂的关系？最近，Reddit和谷歌双双官宣了一项6000万美元的合作协议，Reddit的数据将帮助谷歌训练AI模型。巧的是，Altman正是Reddit股东之一。

来自主题: AI资讯

9715 点击 2024-02-28 16:08

随着大语言模型（LLMs）在近年来取得显著进展，它们的能力日益增强，进而引发了一个关键的问题：如何确保他们与人类价值观对齐，从而避免潜在的社会负面影响？

来自主题: AI技术研报

10720 点击 2024-02-27 14:03

大模型的成功很大程度上要归因于 Scaling Law 的存在，这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系，为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报

3445 点击 2024-02-27 14:00

没有微软账户就用不了 Windows？马斯克怒斥大厂收集用户数据训练 AI。

来自主题: AI资讯

11230 点击 2024-02-26 18:44

AAAI 2024 奖项陆续公布，继杰出论文奖后，今天博士论文奖也公布了。

来自主题: AI资讯

8715 点击 2024-02-26 18:41

扩散模型，迎来了一项重大新应用——像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！

来自主题: AI技术研报

8647 点击 2024-02-25 16:00

好消息，好消息，真·Sora视频上新了！走过路过不要错过！

来自主题: AI资讯

8353 点击 2024-02-25 15:45

谷歌团队推出「通用视觉编码器」VideoPrism，在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练，性能刷新30项SOTA。

来自主题: AI技术研报

5125 点击 2024-02-25 15:39

困扰可控核聚变的一项重大难题，被AI成功攻克了！普林斯顿团队通过训练神经网络，提前300毫秒就预测了核聚变中的等离子不稳定态，因而能够防止等离子体的逃逸。人类离无穷尽的清洁能源，又近了一步。

来自主题: AI技术研报

8510 点击 2024-02-24 14:59