AI TNT— 让一部分先用AI实现商业化

微软打破Decoder-Only架构！大幅降低GPU内存需求，网友：把Llama3 70B弄20GB GPU上运行

微软&清华最新研究，打破GPT系列开创的Decoder-Only架构——

来自主题: AI技术研报

4751 点击 2024-05-12 12:51

与AI共舞，RISC-V芯片加速落地生根

自计算机诞生以来，指令集架构一直是计算机体系结构中的核心概念之一。目前市场上主流的指令集架构两大巨头是x86和ARM，前者基本垄断了PC、笔记本电脑和服务器领域，后者则在智能手机和移动终端市场占据主导地位。

来自主题: AI技术研报

4401 点击 2024-05-11 11:08

爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

多层感知器（MLP），也被称为全连接前馈神经网络，是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。

来自主题: AI技术研报

8537 点击 2024-05-07 18:21

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

没想到，自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。

来自主题: AI技术研报

6457 点击 2024-05-05 19:48

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

机器如何能像人类和动物一样高效地学习？机器如何学习世界运作方式并获得常识？机器如何学习推理和规划……

来自主题: AI技术研报

1303 点击 2024-05-05 19:45

平均准确率达96.4%，中山大学&重庆大学开发基于Transformer的单细胞注释方法

使用测序 (scATAC-seq) 技术对转座酶可及的染色质进行单细胞测定，可在单细胞分辨率下深入了解基因调控和表观遗传异质性，但由于数据的高维性和极度稀疏性，scATAC-seq 的细胞注释仍然具有挑战性。现有的细胞注释方法大多集中在细胞峰矩阵上，而没有充分利用底层的基因组序列。

来自主题: AI技术研报

9493 点击 2024-05-04 20:01

CVPR‘24：与任务无关的多模态数据也能提升Transformer性能｜港中文&腾讯

万万没想到，与任务无直接关联的多模态数据也能提升Transformer模型性能。

来自主题: AI技术研报

4321 点击 2024-05-04 19:29

在12个视频理解任务中，Mamba先打败了Transformer

探索视频理解的新境界，Mamba 模型引领计算机视觉研究新潮流！传统架构的局限已被打破，状态空间模型 Mamba 以其在长序列处理上的独特优势，为视频理解领域带来了革命性的变革。

来自主题: AI技术研报

5288 点击 2024-04-30 18:28

CVPR 2024 | 文本一键转3D数字人骨骼动画，阿尔伯塔大学提出MoMask框架

想象一下，你仅需要输入一段简单的文本描述，就可以生成对应的 3D 数字人动画的骨骼动作。而以往，这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发，影视制作，或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架，MoMask，正在让这一切变得可能。

来自主题: AI技术研报

6452 点击 2024-04-29 20:45

Transformer解码真实场景！Meta推出70M参数SceneScript模型

抛弃传统方法，只采用Transformer来解码真实场景！

来自主题: AI技术研报

9003 点击 2024-04-27 12:37