AI资讯新闻榜单内容搜索-AI框架

反转了？在一场新较量中，号称替代MLP的KAN只赢一局

KAN 在符号表示中领先，但 MLP 仍是多面手。

来自主题: AI技术研报

7537 点击 2024-07-27 19:13

位置编码发展史：从零开始带你推导神秘的RoPE

RNN每个step的隐状态都取决于上一个step的输出，这种连续的状态转移方式使得RNN天然带有位置信息。

来自主题: AI技术研报

7115 点击 2024-07-26 09:23

打乱/跳过Transformer层会怎样？最新研究揭开其信息流动机制，一口气解答8大问题

Transformer中的信息流动机制，被最新研究揭开了：

来自主题: AI技术研报

10509 点击 2024-07-25 22:24

贾扬清共一论文获ICML时间检验奖：首个开源版AlexNet，著名框架Caffe前身，最佳论文奖也已公布

ICML 2024时间检验奖出炉，贾扬清共同一作论文获奖！

来自主题: AI资讯

10794 点击 2024-07-24 20:33

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀起了一场技术革命。

来自主题: AI技术研报

9677 点击 2024-07-24 17:03

快手可灵团队最新开源项目火了：大叔实时变身少女，GitHub狂揽7.5K星

离大谱！！不看视频完整版谁知道里面的美少女竟是一位大叔。

来自主题: AI资讯

4139 点击 2024-07-24 10:07

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

不用H100，三台苹果电脑就能带动400B大模型。背后的功臣，是GitHub上的一个开源分布式AI推理框架，已经斩获了2.5k星标。

来自主题: AI技术研报

8684 点击 2024-07-23 00:26

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？

来自主题: AI资讯

9335 点击 2024-07-22 14:50

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

随着大语言模型展现出惊人的语言智能，各大 AI 公司纷纷推出自己的大模型。这些大模型通常在不同领域和任务上各有所长，如何将它们集成起来以挖掘其互补潜力，成为了 AI 研究的前沿课题。

来自主题: AI技术研报

9341 点击 2024-07-19 16:21

清华提出时间序列大模型：面向通用时序分析的生成式Transformer | ICML 2024

大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性

来自主题: AI技术研报

11489 点击 2024-07-19 12:31

AI资讯新闻榜单内容搜索-AI框架

反转了？在一场新较量中，号称替代MLP的KAN只赢一局

位置编码发展史：从零开始带你推导神秘的RoPE

打乱/跳过Transformer层会怎样？最新研究揭开其信息流动机制，一口气解答8大问题

贾扬清共一论文获ICML时间检验奖：首个开源版AlexNet，著名框架Caffe前身，最佳论文奖也已公布

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

快手可灵团队最新开源项目火了：大叔实时变身少女，GitHub狂揽7.5K星

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星​

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

清华提出时间序列大模型：面向通用时序分析的生成式Transformer | ICML 2024

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星