AI技术研报-这里有最前沿的人工智能技术解读

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

在开源社区引起「海啸」的Mamba架构，再次卷土重来！这次，Mamba-2顺利拿下ICML。通过统一SSM和注意力机制，Transformer和SSM直接成了「一家亲」，Mamba-2这是要一统江湖了？

来自主题: AI技术研报

8501 点击 2024-06-04 15:20

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

6 月 2 日，英伟达创始人黄仁勋在 Computex 2024（2024 台北国际电脑展）上发表主题演讲，分享了人工智能时代如何助推全球新产业革命，并且展示了最新的 Blackwell 芯片和后续的一系列更新节奏。

来自主题: AI技术研报

9880 点击 2024-06-04 12:08

土耳其，怎么就在AI应用赛道“遥遥领先”了？

在 a16z 给出的按照 MAU 排名的全球 Top50 AI App 榜单中，来自土耳其的 Codeway 和 HubX 两个公司各有三款产品进入了 Top50 当中，除了这 6 款产品，还有 Genie 和 Lisa AI 两款产品也是由土耳其开发者推出的。单论上榜数量，美国开发者排在第一，土耳其敢称第二。

来自主题: AI技术研报

10041 点击 2024-06-04 11:39

深度：生成式AI的存储选型建议

合理选择存储，助推生成式AI应用。麦肯锡研究报告显示，到2030年前，生成式AI有望为全球经济贡献7万亿美元的价值。

来自主题: AI技术研报

9910 点击 2024-06-04 11:19

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报

6940 点击 2024-06-03 17:55

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

如何突破 Transformer 的 Attention 机制？中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。将图片特征块视为热源，并通过预测热传导率、以物理学热传导原理提取图像特征。相比于基于Attention机制的视觉模型， vHeat 同时兼顾了：计算复杂度（1.5次方）、全局感受野、物理可解释性。

来自主题: AI技术研报

9518 点击 2024-06-03 17:51

黄仁勋：英伟达将一年推一款全新芯片，没有英伟达就没有今天AI的一切（附最新演讲全文）

英伟达是今天生成式AI浪潮里最大的赢家，而黄仁勋要告诉世界，这一切跟运气无关，是英伟达预见并用实力创造了今天的一切。

来自主题: AI技术研报

9196 点击 2024-06-03 15:54

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

除了OpenAI自己，居然还有别人能用上GPT-4-Base版？？

来自主题: AI技术研报

9050 点击 2024-06-03 15:46

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

改进Transformer核心机制注意力，让小模型能打两倍大的模型！

来自主题: AI技术研报

9525 点击 2024-06-03 15:44

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象

来自主题: AI技术研报

10014 点击 2024-06-03 15:39

活体脑细胞做成16核芯片，用Python就能编程，9个机构开展实验36所大学排队

首个“脑PU”来了！由“16核”类人脑器官（human brain organoids）组成。

来自主题: AI技术研报

9687 点击 2024-06-03 11:12

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

研究人员提出了一种新的大型语言模型训练方法，通过一次性预测多个未来tokens来提高样本效率和模型性能，在代码和自然语言生成任务上均表现出显著优势，且不会增加训练时间，推理速度还能提升至三倍。

来自主题: AI技术研报

9381 点击 2024-06-03 11:00

LLM的「母语」是什么？

在以英语为主的语料库上训练的多语言LLM，是否使用英语作为内部语言？对此，来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报

9907 点击 2024-06-03 10:53

老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题

刚刚，老黄又高调向全世界秀了一把：已经量产的Blackwell，8年内将把1.8万亿参数GPT-4的训练能耗狂砍到1/350；英伟达惊人的产品迭代，直接原地冲破摩尔定律；Blackwell的后三代路线图，也一口气被放出。

来自主题: AI技术研报

9547 点击 2024-06-03 10:48

高效、可泛化的高斯重建框架，只需3张视图即可快速推理，45秒便可完成优化

3D 重建和新视图合成技术在虚拟现实和增强现实等领域有着广泛的应用。NeRF 通过隐式地将场景编码为辐射场，在视图合成上取得了显著的成功。

来自主题: AI技术研报

9563 点击 2024-06-02 14:46

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10162 点击 2024-06-02 14:42

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。

来自主题: AI技术研报

9062 点击 2024-06-02 14:38

AlphaFold 3引不满！服务器被黑，全世界科学家竞相破解

AlphaFold3的横空出世再次震撼了整个学术界，然而谷歌DeepMind的「不开源」引起学界不满，AlphaFold服务器遭到黑客攻击，开源项目也开始发力。

来自主题: AI技术研报

9972 点击 2024-06-02 14:34

首次解密Claude 3大脑！25岁Anthropic参谋长预言3年内自己将被AI淘汰

Anthropic的25岁参谋长自曝因为深感AGI，未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说，Claude 3模型已经初现AGI了吗？

来自主题: AI技术研报

8962 点击 2024-06-02 14:24

CVPR 2024 | 合成视频数据集里只有单人数据？M3Act破解人群行为标注难题

通过视觉信息识别、理解人群的行为是视频监测、交互机器人、自动驾驶等领域的关键技术之一，但获取大规模的人群行为标注数据成为了相关研究的发展瓶颈。如今，合成数据集正成为一种新兴的，用于替代现实世界数据的方法，但已有研究中的合成数据集主要聚焦于人体姿态与形状的估计。它们往往只提供单个人物的合成动画视频，而这并不适用于人群的视频识别任务。

来自主题: AI技术研报

9886 点击 2024-06-01 19:06

超长小说可以用AI翻译了，新型多智能体协作系统媲美人工翻译

机器翻译 (MT) 的最新进展显着提高了各个领域的翻译质量。然而，由于其复杂的语言、比喻表达和文化差异，文学文本的翻译仍然是一个艰巨的挑战。

来自主题: AI技术研报

9556 点击 2024-06-01 19:03

单GPU训练一天，Transformer在100位数字加法上就达能到99%准确率

乘法和排序也有效。

来自主题: AI技术研报

8880 点击 2024-06-01 19:00

AI读论文新神器：多栏密集文字、中英图文混排文档都能读的多模态大模型Fox｜旷视

虽然多模态大模型都能挑西瓜了，但理解复杂文档方面还是差点意思。

来自主题: AI技术研报

10170 点击 2024-06-01 18:49

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

时空预测技术，迎来ChatGPT时刻。

来自主题: AI技术研报

9807 点击 2024-06-01 18:44

AI视觉算法登柳叶刀！看CT提前10年预测致命心脏疾病，已进入临床使用

最近，《柳叶刀》上的一篇医学文章发表了有关心血管疾病风险预测的里程碑式结果。之所以如此有影响力，是因为这项名为CaRi-Heart的技术结合了AI视觉识别和预测算法，可以在没有明显症状时提前10年识别出重大的心血管疾病风险。

来自主题: AI技术研报

9987 点击 2024-06-01 18:11

ChatGPT真能记住你的话吗？DeepMind与开源大佬揭示LLM记忆之谜

LLM有记忆能力吗？有，也没有。虽然ChatGPT聊天时好像可以记住你之前说的话，但实际上，模型在推理时记不住任何内容，而且它们在训练时的记忆方式也不像我们想象的那么简单。

来自主题: AI技术研报

8920 点击 2024-06-01 18:08

谷歌DeepMind：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类！此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面了。

来自主题: AI技术研报

9546 点击 2024-06-01 18:04

神笔马良画出三维世界，基于线稿的3D生成编辑方法SketchDream来了

基于人工智能的数字内容生成，即 AIGC 在二维图像生成领域取得了很大的成功，但在三维生成方面仍存在挑战。智能化生成三维模型在 AR/VR、工业设计、建筑设计和游戏影视等方面都有应用价值，现有的智能化三维生成方法已经可以生成高质量的三维模型，但如何对生成结果进行精确控制，并对真实模型或生成的模型进行细节的修改，从而让用户自由定制高质量的三维模型仍然是一个待解决的问题。

来自主题: AI技术研报

9359 点击 2024-05-31 19:31

2D头像生成3D虚拟人开视频会，谷歌新作让人难绷

未来人与人的交流，难道是这个样？

来自主题: AI技术研报

9116 点击 2024-05-31 19:27

无需3D数据也能训练，港科&港中文联手华为推出3D自动驾驶场景生成模型

无需采集3D数据，也能训练出高质量的3D自动驾驶场景生成模型。

来自主题: AI技术研报

9799 点击 2024-05-31 18:58