AI资讯新闻榜单内容搜索-io

开源数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s｜已上线阿里ModelScope魔搭社区

开源数字人实时对话Demo来了～

来自主题: AI技术研报

9435 点击 2024-10-23 14:53

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训练速度暴涨18倍

在NLP领域，研究者们已经充分认识并认可了表征学习的重要性，那么视觉领域的生成模型呢？最近，谢赛宁团队发表的一篇研究就拿出了非常有力的证据：Representation matters！

来自主题: AI技术研报

4774 点击 2024-10-23 13:37

刚刚！Stable Diffusion 3.5最强模型全家桶来了，三个型号

就在刚刚，Stability AI发布了自家最强的模型Stable Diffusion 3.5，而且是一个全家桶，包含三个版本。

来自主题: AI资讯

4504 点击 2024-10-23 10:38

Jurgen、曼宁等大佬新作：MoE重塑6年前的Universal Transformer，高效升级

7 年前，谷歌在论文《Attention is All You Need》中提出了 Transformer。就在 Transformer 提出的第二年，谷歌又发布了 Universal Transformer（UT）。它的核心特征是通过跨层共享参数来实现深度循环，从而重新引入了 RNN 具有的循环表达能力。

来自主题: AI技术研报

10104 点击 2024-10-19 14:29

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

来自主题: AI技术研报

10467 点击 2024-10-19 14:15

Bengio团队新论文！KL正则化有漏洞，强化学习新策略：不要做我可能不会做的事情

在强化学习中，当智能体的奖励机制与设计者的意图不一致时，可能会导致不理想的行为，而KL正则化作为一种常用的解决方案，通过限制智能体的行为来防止这种情况，但智能体在某些情况下仍可能表现出意料之外的行为；为了提高智能体的可靠性，研究人员提出了新的理论方案，通过改变指导原则来增强智能体在未知情况下的谨慎性。

来自主题: AI技术研报

7049 点击 2024-10-19 13:55