AI资讯新闻榜单内容搜索-transforme

Transformer作者回流谷歌，Character.AI创始团队被「收购」，只要人不要公司

AI 初创者的归宿还是大厂？

来自主题: AI资讯

10822 点击 2024-08-03 14:23

Transformer大模型尺寸变化，正在重走CNN的老路！

来自主题: AI资讯

11021 点击 2024-08-01 17:30

RNN每个step的隐状态都取决于上一个step的输出，这种连续的状态转移方式使得RNN天然带有位置信息。

来自主题: AI技术研报

7240 点击 2024-07-26 09:23

Transformer中的信息流动机制，被最新研究揭开了：

来自主题: AI技术研报

10593 点击 2024-07-25 22:24

大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性

来自主题: AI技术研报

11632 点击 2024-07-19 12:31

好家伙！为了揭秘Transformer内部工作原理，陈丹琦团队直接复现——

来自主题: AI技术研报

10865 点击 2024-07-18 16:37

“欧洲OpenAI”和“Transformer挑战者”强强联合了！

来自主题: AI资讯

11353 点击 2024-07-17 19:09

把因果链展示给 LLM，它就能学会公理。

来自主题: AI技术研报

9413 点击 2024-07-16 19:53

来自微软、MIT等机构的学者提出了一种创新的训练范式，攻破了大模型的推理缺陷。他们通过因果模型构建数据集，直接教模型学习公理，结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。

来自主题: AI技术研报

9661 点击 2024-07-14 13:52

Mamba模型由于匹敌Transformer的巨大潜力，在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下，这两个架构还未有「一较高低」的机会。最近，英伟达、CMU、普林斯顿等机构联合发表的实证研究论文填补了这个空白。

来自主题: AI技术研报

5001 点击 2024-07-13 19:32