AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。

来自主题: AI技术研报
9883 点击    2024-03-11 17:22
零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。

来自主题: AI技术研报
5809 点击    2024-03-11 17:17
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。

来自主题: AI技术研报
10296 点击    2024-03-10 16:19
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多,这让开发人员拥有了更大的发挥空间,而不是像现在使用 ChatGPT 网页应用程序和移动应用程序那样仅仅使用用户提示。

来自主题: AI技术研报
5893 点击    2024-03-10 16:13
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。

来自主题: AI技术研报
9837 点击    2024-03-10 16:10
AI数学基础扫盲

AI数学基础扫盲

AI数学基础扫盲

AI中的应用:在机器学习中,单条数据样本的表征都是以向量化的形式来完成的。向量化的方式可以帮助AI算法在迭代与计算过程中,以更高效的方式完成。

来自主题: AI技术研报
9855 点击    2024-03-10 10:37
Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

北京时间 2 月 22 日,半导体巨头 Arm 更新了 Arm® Neoverse™ 产品路线图,宣布推出两款基于全新第三代 Neoverse IP 构建的全新计算子系统(CSS):Arm Neoverse CSS V3 和 Arm Neoverse CSS N3。

来自主题: AI技术研报
6112 点击    2024-03-09 15:16
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免被发现。那么,如果让 AI 加入游戏,会产生怎样的新变化呢?

来自主题: AI技术研报
6619 点击    2024-03-09 15:12
谷歌具身智能新研究:比RT-2优秀的RT-H来了

谷歌具身智能新研究:比RT-2优秀的RT-H来了

谷歌具身智能新研究:比RT-2优秀的RT-H来了

RT-H 在一系列机器人任务中的表现都优于 RT-2。

来自主题: AI技术研报
7729 点击    2024-03-09 15:09
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为现有的决策智能算法提供更优的选择。

来自主题: AI技术研报
6671 点击    2024-03-09 15:05
全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

刚刚发布的AI人才报告显示,全世界的顶尖AI人才中,几乎每两人中就有一人是中国培养出的人才!开卷后,美国码农们也都被迫开启了地狱模式,为一个offer面试12场。

来自主题: AI技术研报
5546 点击    2024-03-08 15:36
揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

Groq一夜爆火的背后,是自研的语言处理单元硬件LPU,近日,Substack的专栏作家Abhinav Upadhyay为我们一步步揭示了LPU底层架构的奥秘

来自主题: AI技术研报
4633 点击    2024-03-08 15:17
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。

来自主题: AI技术研报
4740 点击    2024-03-08 15:11
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

3 月 6 日,田渊栋又一项研究出炉,这次,他们主攻 LLM 内存效率。除了田渊栋本人,还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。

来自主题: AI技术研报
11110 点击    2024-03-08 15:07
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任意物体的遮挡补全问题,并且为这一问题提出了一个新的更加精确的评估数据集。该工作受到了 MPI 大佬 Michael Black、CVPR 官方账号、南加州大学计算机系官方账号等在 X 平台的点赞。

来自主题: AI技术研报
7512 点击    2024-03-08 15:04
谷歌的AI搜索策略,为何如此矛盾?

谷歌的AI搜索策略,为何如此矛盾?

谷歌的AI搜索策略,为何如此矛盾?

3月6日,Alphabet旗下搜索引擎Google宣布更新其搜索排名系统,以便更好地推荐高质量内容,减少那些低质量网页的曝光。对此公司发言人Jennifer Kutz表示,排名变化将“直接解决人工智能生成的低质量内容问题,这些内容旨在吸引点击,但这并没有增加太多原始价值”。

来自主题: AI技术研报
4098 点击    2024-03-08 10:27
中科院等万字详解:最前沿图像扩散模型综述

中科院等万字详解:最前沿图像扩散模型综述

中科院等万字详解:最前沿图像扩散模型综述

针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。

来自主题: AI技术研报
5323 点击    2024-03-07 14:24
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。

来自主题: AI技术研报
4882 点击    2024-03-07 14:01
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型量化显得更加重要。

来自主题: AI技术研报
9238 点击    2024-03-07 13:53
阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

彭博社消息称,新一轮融资或将使MiniMax估值超25亿美元。目前阿里和红杉已承诺将参与本轮融资,其余跟投者还在洽谈中,相关条款可能会有所调整。

来自主题: AI技术研报
9273 点击    2024-03-07 10:59
你花钱想消除的 AI 水印,其实也是虚假内容的克星

你花钱想消除的 AI 水印,其实也是虚假内容的克星

你花钱想消除的 AI 水印,其实也是虚假内容的克星

我们将介绍 AI 生成内容加水印的方法,讨论其优缺点,并展示 Hugging Face Hub 上一些可用于添加/检测水印的工具。

来自主题: AI技术研报
5912 点击    2024-03-07 10:38
Claude 3成功破解未公开算法?智商测试101分超越人类/碾压GPT-4!网友惊呼:实测比跑分还强

Claude 3成功破解未公开算法?智商测试101分超越人类/碾压GPT-4!网友惊呼:实测比跑分还强

Claude 3成功破解未公开算法?智商测试101分超越人类/碾压GPT-4!网友惊呼:实测比跑分还强

网友测试Claude之后惊呼:实测比跑分厉害多了!智商测试中碾压GPT-4,得分高达101。而且能发现量子物理学家还未发表的量子算法。

来自主题: AI技术研报
8810 点击    2024-03-06 14:43
Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?

Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?

Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?

Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新的高度。

来自主题: AI技术研报
6715 点击    2024-03-06 14:38
如何看待Anthropic公司在ChatGPT4.5推出前,宣布推出Claude 3?

如何看待Anthropic公司在ChatGPT4.5推出前,宣布推出Claude 3?

如何看待Anthropic公司在ChatGPT4.5推出前,宣布推出Claude 3?

已经第一时间氪金到了 claude 3 Pro,准备接下来停用GPT-4(直到GPT-4.5出来),日常工作完全用Claude 3 Opus。

来自主题: AI技术研报
10253 点击    2024-03-06 10:50
国内的这两支队伍,正在尝试开源Sora!

国内的这两支队伍,正在尝试开源Sora!

国内的这两支队伍,正在尝试开源Sora!

在2024年2月份,OpenAI推出了一项创新的文本转视频模型,名为Sora。这一模型标志着视频生成技术取得了显著的进步。Sora具备将简短文本描述转化为长达一分钟的详尽且高清晰度视频片段的能力。

来自主题: AI技术研报
8266 点击    2024-03-05 14:43
ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

在 2024 世界经济论坛的一次会谈中,图灵奖得主 Yann LeCun 提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间 [1]。借助文本信息的多模态视频表征学习可抽取利于视频理解或内容生成的特征,

来自主题: AI技术研报
11001 点击    2024-03-05 14:36