AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景

CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景

CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景

传统的 3D 重建算法需要不同视角拍摄的多张图片作为输入从而重建出 3D 场景。近年来,有相当多的工作尝试从单张图片构建 3D 场景。然而,绝大多数此类工作都依赖生成式模型(如 Stable Diffusion),换句话说,此类工作仍然需要通过预训练的生成式模型推理场景中的 3D 信息。

来自主题: AI技术研报
12319 点击    2024-05-03 21:00
跨越300多年的接力:受陶哲轩启发,数学家决定用AI形式化费马大定理的证明

跨越300多年的接力:受陶哲轩启发,数学家决定用AI形式化费马大定理的证明

跨越300多年的接力:受陶哲轩启发,数学家决定用AI形式化费马大定理的证明

在陶哲轩的启发下,越来越多的数学家开始尝试利用人工智能进行数学探索。这次,他们瞄准的目标是世界十大最顶尖数学难题之一的费马大定理。

来自主题: AI技术研报
6200 点击    2024-05-02 18:05
热归热,Groq离取代英伟达GPU有多远?

热归热,Groq离取代英伟达GPU有多远?

热归热,Groq离取代英伟达GPU有多远?

2024 年 4 月 20 日,即 Meta 开源 Llama 3 的隔天,初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本,每秒可输出token输提升至800。

来自主题: AI技术研报
6754 点击    2024-05-02 18:03
Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

自2021年诞生,CLIP已在计算机视觉识别系统和生成模型上得到了广泛的应用和巨大的成功。我们相信CLIP的创新和成功来自其高质量数据(WIT400M),而非模型或者损失函数本身。虽然3年来CLIP有大量的后续研究,但并未有研究通过对CLIP进行严格的消融实验来了解数据、模型和训练的关系。

来自主题: AI技术研报
12198 点击    2024-05-02 17:54
全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究

全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究

全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究

一种全新的神经网络架构KAN,诞生了! 与传统的MLP架构截然不同,且能用更少的参数在数学、物理问题上取得更高精度。

来自主题: AI技术研报
4461 点击    2024-05-02 17:52
3300亿美元不够用!多家AI独角兽钱包告急,裁员、CEO离职不断,大模型创业要降温?

3300亿美元不够用!多家AI独角兽钱包告急,裁员、CEO离职不断,大模型创业要降温?

3300亿美元不够用!多家AI独角兽钱包告急,裁员、CEO离职不断,大模型创业要降温?

智东西4月30日报道,据外媒4月29日报道,当下,Inflection AI、Stability AI和Anthropic等知名AI初创公司都正面临财务危机。

来自主题: AI技术研报
6327 点击    2024-05-02 10:47
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。

来自主题: AI技术研报
5657 点击    2024-05-01 20:59
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型 (如 GPT-4V) 的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行动作仍面临挑战。

来自主题: AI技术研报
9931 点击    2024-05-01 19:35