AI技术研报-这里有最前沿的人工智能技术解读

详解AI芯片参数，英伟达凭啥不能被替代？

2月22日，英伟达发布2024财年四季报，营收221亿美元，同比增长265%，净利润123亿美元，同比激增769%，双双大超市场预期。

来自主题: AI技术研报

9431 点击 2024-02-28 16:19

AI x 机器人爆发年！英伟达Jim Fan领衔登月任务，谷歌DeepMind新技术曝光

AI x 机器人正逐渐走上时代的风口，近日，谷歌DeepMind以及英伟达两家AI大厂都在机器人领域有所动作。

来自主题: AI技术研报

5729 点击 2024-02-28 16:02

老黄祭出全新RTX 500 GPU，AIGC性能狂飙14倍！AI应用的门槛彻底被打下来了

英伟达发布移动工作站产品线最后一块拼图，号称与竞品相比效率提升14倍。随着今年大量AI消费级硬件的上市，AI应用的门槛彻底被老黄打下来了。

来自主题: AI技术研报

2674 点击 2024-02-28 15:56

南大俞扬深度解读：什么是「世界模型」？

世界模型是什么？Sora是世界模型吗？

来自主题: AI技术研报

6347 点击 2024-02-27 14:20

大模型+智能城市=城市通用智能！港科大（广州）发布最新「城市基础大模型UFM」综述与方案

城市通用智能该如何发展？如何解决概念定义模糊、缺乏系统文献述评和通用解决方案等难题？

来自主题: AI技术研报

3344 点击 2024-02-27 14:17

MATRIX：社会模拟推动大模型价值自对齐，比GPT4更「体贴」

随着大语言模型（LLMs）在近年来取得显著进展，它们的能力日益增强，进而引发了一个关键的问题：如何确保他们与人类价值观对齐，从而避免潜在的社会负面影响？

来自主题: AI技术研报

10246 点击 2024-02-27 14:03

大模型Scaling Law同样适用于下游任务性能？斯坦福、谷歌最新研究揭秘

大模型的成功很大程度上要归因于 Scaling Law 的存在，这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系，为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报

3190 点击 2024-02-27 14:00

刚刚，谷歌发布基础世界模型：11B参数，能生成可交互虚拟世界

问世才两个星期，谷歌的世界模型也来了，能力看起来更强大：它生成的虚拟世界「自主可控」。

来自主题: AI技术研报

5987 点击 2024-02-26 18:34

国内公司有望做出Sora吗？这支清华系大模型团队给出了希望

2023 年年底，很多人都预测，未来一年将是视频生成快速发展的一年。但出人意料的是，农历春节刚过，OpenAI 就扔出了一个重磅炸弹 —— 能生成 1 分钟流畅、逼真视频的 Sora。

来自主题: AI技术研报

7963 点击 2024-02-26 18:30

Sora·创世纪·大统一模型

无数人类天才穷尽一生才合伙建立残缺的大统一理论（GUT）：它只统一了强相互作用、弱相互作用和电磁力，引力至今无法统一到模型之中。

来自主题: AI技术研报

9153 点击 2024-02-26 18:11

首席分析师揭秘爆火Groq，每小时要烧168美元！10倍H100拥有成本，老黄笑而不语

SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解，测算出其持有成本依然高达现有H100的10倍，看来要赶上老黄的步伐，初创公司还有很多要做。

来自主题: AI技术研报

5495 点击 2024-02-26 18:03

GPT-4、Gemini同时被曝重大缺陷，逻辑推理大翻车！DeepMind上交校友团队发现LLM严重降智

谷歌DeepMind最新研究发现，问题中前提条件的呈现顺序，对于大模型的推理性能有着决定性的影响，打乱顺序能让模型表现下降30%。

来自主题: AI技术研报

3719 点击 2024-02-26 17:56

提前300毫秒预测聚变中等离子体「撕裂」，普林斯顿团队AI控制器登上Nature

近日，普林斯顿大学和普林斯顿等离子体物理实验室研究核聚变能的科学家表示，他们已经找到了一种使用人工智能的方法，预测这些潜在不稳定性并实时阻止其发生。

来自主题: AI技术研报

7495 点击 2024-02-25 16:04

打入AI底层！NUS尤洋团队用扩散模型构建神经网络参数，LeCun点赞

扩散模型，迎来了一项重大新应用——像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！

来自主题: AI技术研报

8118 点击 2024-02-25 16:00

谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

谷歌团队推出「通用视觉编码器」VideoPrism，在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练，性能刷新30项SOTA。

来自主题: AI技术研报

4394 点击 2024-02-25 15:39

GPT-4正接管人类数据专家！先验知识让LLM大胆预测，准确率堪比传统方式

终有一天，LLM可以成为人类数据专家，针对不同领域进行数据分析，大大解放AI研究员。

来自主题: AI技术研报

7053 点击 2024-02-24 15:07

可控核聚变新里程碑！AI成功预测等离子体撕裂登Nature，清洁能源「圣杯」更近一步

困扰可控核聚变的一项重大难题，被AI成功攻克了！普林斯顿团队通过训练神经网络，提前300毫秒就预测了核聚变中的等离子不稳定态，因而能够防止等离子体的逃逸。人类离无穷尽的清洁能源，又近了一步。

来自主题: AI技术研报

8057 点击 2024-02-24 14:59

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。

来自主题: AI技术研报

6174 点击 2024-02-24 14:54

补齐Transformer规划短板，田渊栋团队的Searchformer火了

最近几年，基于 Transformer 的架构在多种任务上都表现卓越，吸引了世界的瞩目。使用这类架构搭配大量数据，得到的大型语言模型（LLM）等模型可以很好地泛化用于真实世界用例。

来自主题: AI技术研报

7985 点击 2024-02-24 14:51

200万上下文窗口创飞Gemini 1.5！微软来砸谷歌场子了（doge）

谷歌刚刷新大模型上下文窗口长度记录，发布支持100万token的Gemini 1.5，微软就来砸场子了。

来自主题: AI技术研报

7114 点击 2024-02-24 11:58

YOLOv9来了：实时目标检测新SOTA，完胜各种轻量或大型模型！出自v7作者

距离YOLOv8发布仅1年的时间，v9诞生了！

来自主题: AI技术研报

5741 点击 2024-02-24 11:53

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！

来自主题: AI技术研报

7888 点击 2024-02-23 14:42

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

谷歌Research Lead，负责VideoPoet项目的蒋路，即将加入TikTok，负责视频生成AI的开发。

来自主题: AI技术研报

7804 点击 2024-02-22 15:44

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。

来自主题: AI技术研报

5987 点击 2024-02-22 15:31

超越AF2？Iambic、英伟达、加州理工学院开发多尺度深度生成模型，进行状态特异性蛋白质-配体复合物结构预测

由蛋白质和小分子配体形成的结合复合物无处不在，对生命至关重要。虽然最近科学家在蛋白质结构预测方面取得了进展，但现有算法无法系统地预测结合配体结构及其对蛋白质折叠的调节作用。

来自主题: AI技术研报

4889 点击 2024-02-22 15:28

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。

来自主题: AI技术研报

10281 点击 2024-02-22 15:25

谷歌最强开源大模型亮相！Gemini技术下放，笔记本就能跑，可商用

谷歌大模型，开源了！一夜之间，Gemma系列正式上线，全面对外开放。

来自主题: AI技术研报

9476 点击 2024-02-22 15:14

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

大语言模型之大，成本之高，让模型的稀疏化变得至关重要。

来自主题: AI技术研报

5965 点击 2024-02-21 16:51

芯片专家详解刷屏的Groq芯片：目前并不能替代英伟达

财报发布前两天，英伟达突然冒出来一个劲敌。一家名叫Groq的公司今天在AI圈内刷屏，杀招就一个：快。

来自主题: AI技术研报

7229 点击 2024-02-21 11:40

GPT-4可能也在用的推测解码是什么？一文综述前世今生和应用情况

推测解码（Speculative Decoding）是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下，获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。

来自主题: AI技术研报

7890 点击 2024-02-20 17:22