AI技术研报-这里有最前沿的人工智能技术解读

首个像人类一样思考的网络！Nature子刊：AI模拟人类感知决策

近日，来自佐治亚理工学院的研究人员开发了RTNet，首次表明其「思考方式」与人类非常相似。

来自主题: AI技术研报

11559 点击 2024-08-14 16:45

超级AI即将诞生？史上最强超算9月上线，英伟达最强芯片加持

天网离我们还有多远？现在，科学家们希望通过一个强大的超算网络，来加速发展人类级别的人工智能，预计在2025年前全面投入运行。

来自主题: AI技术研报

9881 点击 2024-08-14 16:40

北大王选所：让多模态大模型更懂人类在做什么｜ECCV 2024

只用提示词，多模态大模型就能更懂场景中的人物关系了。

来自主题: AI技术研报

11256 点击 2024-08-13 16:56

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩，证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报

5868 点击 2024-08-12 17:18

中科大/华为诺亚出手！芯片性能≠布局评分，EDA物理设计框架全面开源

芯片物理布局，有了直指性能指标的新测评标准！

来自主题: AI技术研报

11087 点击 2024-08-12 13:53

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

9739 点击 2024-08-12 13:50

数百万晶体数据训练、解决晶体学相位问题，深度学习方法PhAI登Science

时至今日，晶体学所测定的结构细节和精度，从简单的金属到大型膜蛋白，是任何其他方法都无法比拟的。然而，最大的挑战——所谓的相位问题，仍然是从实验确定的振幅中检索相位信息。

来自主题: AI技术研报

11117 点击 2024-08-11 16:58

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

10590 点击 2024-08-11 13:25

给视频模型安上快慢两只眼睛，苹果免训练新方法秒了一切SOTA

自从 Sora 发布以来，AI 视频生成领域变得更加「热闹」了起来。过去几个月，我们见证了即梦、Runway Gen-3、Luma AI、快手可灵轮番炸场。

来自主题: AI技术研报

10933 点击 2024-08-11 13:18

最高提速1440倍！15秒用GCN搞定随机规划，中科院自动化所新成果入选ICML 24

仅需15秒即可搞定随机规划问题，速度比传统方法快了1440倍！

来自主题: AI技术研报

8736 点击 2024-08-10 19:00

OpenAI开发者福音！ API上线结构化输出功能，新版GPT-4o响应达100%满分

OpenAI推出了结构化输出功能，确保API输出与JSON模式精确匹配，提高数据生成的可靠性。

来自主题: AI技术研报

11214 点击 2024-08-10 16:58

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

8063 点击 2024-08-10 11:45

LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」

前段时间冲上热搜的问题「9.11比9.9大吗？」，让几乎所有LLM集体翻车。看似热度已过，但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷，以及未来的潜在改进方向。

来自主题: AI技术研报

10169 点击 2024-08-09 14:38

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

有CPU就能跑大模型，性能甚至超过NPU/GPU！

来自主题: AI技术研报

11800 点击 2024-08-09 14:16

清华光学AI登Nature！物理神经网络，反向传播不需要了

用光训练神经网络，清华成果最新登上了Nature！

来自主题: AI技术研报

11454 点击 2024-08-09 13:57

MSU世界视频编码器大赛成绩出炉，腾讯包揽全部指标第一名

今日获悉，由莫斯科国立大学举办的 MSU 世界视频编码器大赛结果揭晓。在全部参赛编码器中，腾讯编码器包揽所有 15 项指标的全部第一，再次斩获全场最佳。

来自主题: AI技术研报

9377 点击 2024-08-09 13:09

两篇论文同时获最佳论文荣誉提名，SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界

专注于计算机图形学的全球学术顶会 SIGGRAPH，正在出现新的趋势。

来自主题: AI技术研报

10855 点击 2024-08-09 13:06

ICML 2024 | 人物交互图像，现在更懂你的提示词了，北大推出基于语义感知的人物交互图像生成框架

该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 MIPL实验室，第一作者为博士生徐铸，通讯作者为博士生导师刘洋。MIPL 实验室近年来在 IJCV、CVPR、AAAI、ICCV、ICML、ECCV 等顶会上有多项代表性成果发表，多次荣获国内外 CV 领域重量级竞赛的冠军奖项，和国内外知名高校、科研机构广泛开展合作。

来自主题: AI技术研报

6713 点击 2024-08-08 18:44

中国AI制药成果登Nature子刊：分子模拟设计糖尿病药物，效果优化2-3倍

AI辅助制药，找到传统方法难以发现的关键盐桥，激动剂活性直接提升2-3倍！

来自主题: AI技术研报

11107 点击 2024-08-08 15:05

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。

来自主题: AI技术研报

10430 点击 2024-08-08 14:41

无比喻，不论文！用「画家流水线」的方式理解Transformer中间层

Transformer架构层层堆叠，包含十几亿甚至几十亿个参数，这些层到底是如何工作的？当一个新奇的比喻——「画家流水线」，被用于类比并理解Transformer架构的中间层，情况突然变得明朗起来，并引出了一些有趣的发现。

来自主题: AI技术研报

11650 点击 2024-08-08 14:37

拆解SearchGPT后，我们发现了AI搜索的壁垒、突破和未来

为什么说AI搜索不只是搜索？

来自主题: AI技术研报

11591 点击 2024-08-08 11:32

AI模型提早5年预警乳腺癌，MIT研究登Science获LeCun转发

科学家正在通过AI的力量，改变乳腺癌的现状。

来自主题: AI技术研报

11884 点击 2024-08-07 15:33

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！

来自主题: AI技术研报

10837 点击 2024-08-07 14:58

八问八答搞懂Transformer内部运作原理

七年前，论文《Attention is all you need》提出了 transformer 架构，颠覆了整个深度学习领域。

来自主题: AI技术研报

10387 点击 2024-08-07 14:31

李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型SpatialBot

李飞飞老师提出了空间智能 (Spatial Intelligence) 这一概念，作为回应，来自上交、斯坦福、智源、北大、牛津、东大的研究者提出了空间大模型 SpatialBot，并提出了训练数据 SpatialQA 和测试榜单 SpatialBench，尝试让多模态大模型在通用场景和具身场景下理解深度、理解空间。

来自主题: AI技术研报

11714 点击 2024-08-07 14:12

准确率达60.8%，浙大基于Transformer的化学逆合成预测模型，登Nature子刊

逆合成是药物发现和有机合成中的一项关键任务，AI 越来越多地用于加快这一过程。

来自主题: AI技术研报

11582 点击 2024-08-07 14:04

英伟达被曝「偷」数据，每天爬取超 80 年视频数据量，北大学术数据集也遭殃

最近的英伟达似乎步入了多事之秋。

来自主题: AI技术研报

9407 点击 2024-08-07 10:48

AI芯片独角兽宣布杨立昆加盟，估值暴涨到200亿

谷歌TPU核心团队创立，要做世界最快推理。

来自主题: AI技术研报

11758 点击 2024-08-06 15:27

实战：手把手教你Prompt到底该怎么写

新加坡举办了首届GPT-4提示工程竞赛，Sheila Teo取得了冠军，我们来学习借鉴她采用的三项提示技巧：使用CO-STAR框架构建提示词 2.使用分隔符将提示词分段 3.使用LLM系统提示

来自主题: AI技术研报

9669 点击 2024-08-06 14:47

AI技术研报-这里有最前沿的人工智能技术解读

首个像人类一样思考的网络！Nature子刊：AI模拟人类感知决策

超级AI即将诞生？史上最强超算9月上线，英伟达最强芯片加持

北大王选所：让多模态大模型更懂人类在做什么｜ECCV 2024

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

中科大/华为诺亚出手！芯片性能≠布局评分，EDA物理设计框架全面开源

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

数百万晶体数据训练、解决晶体学相位问题，深度学习方法PhAI登Science

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

给视频模型安上快慢两只眼睛，苹果免训练新方法秒了一切SOTA

最高提速1440倍！15秒用GCN搞定随机规划，中科院自动化所新成果入选ICML 24

OpenAI开发者福音！ API上线结构化输出功能，新版GPT-4o响应达100%满分

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

清华光学AI登Nature！物理神经网络，反向传播不需要了

MSU世界视频编码器大赛成绩出炉，腾讯包揽全部指标第一名

两篇论文同时获最佳论文荣誉提名，SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界

ICML 2024 | 人物交互图像，现在更懂你的提示词了，北大推出基于语义感知的人物交互图像生成框架

中国AI制药成果登Nature子刊：分子模拟设计糖尿病药物，效果优化2-3倍

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

无比喻，不论文！用「画家流水线」的方式理解Transformer中间层

拆解SearchGPT后，我们发现了AI搜索的壁垒、突破和未来

AI模型提早5年预警乳腺癌，MIT研究登Science获LeCun转发

无一大模型及格！ 北大/通研院提出超难基准，专门评估长文本理解生成

八问八答搞懂Transformer内部运作原理

李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型SpatialBot

准确率达60.8%，浙大基于Transformer的化学逆合成预测模型，登Nature子刊

英伟达被曝「偷」数据，每天爬取超 80 年视频数据量，北大学术数据集也遭殃

AI芯片独角兽宣布杨立昆加盟，估值暴涨到200亿

实战：手把手教你Prompt到底该怎么写

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成