AI技术研报-这里有最前沿的人工智能技术解读

ECCV 2024 oral | 首次基于深度聚类的多模态融合，上交、伯克利提出双向结构对齐的融合网络新SOTA！

视觉 / 激光雷达里程计是计算机视觉和机器人学领域中的一项基本任务，用于估计两幅连续图像或点云之间的相对位姿变换。它被广泛应用于自动驾驶、SLAM、控制导航等领域。最近，多模态里程计越来越受到关注，因为它可以利用不同模态的互补信息，并对非对称传感器退化具有很强的鲁棒性。

来自主题: AI技术研报

11393 点击 2024-09-22 14:00

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

9758 点击 2024-09-21 18:19

强化学习让大模型自动纠错，数学、编程性能暴涨，DeepMind新作

无需依赖外部反馈或额外模型，纯纯的自我纠正。

来自主题: AI技术研报

7905 点击 2024-09-21 18:07

OpenAI o1 self-play RL 技术路线推演

OpenAI的self-play RL新模型o1最近交卷，直接引爆了关于对于self-play的讨论。

来自主题: AI技术研报

9858 点击 2024-09-21 14:20

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

o1，Inference law，推理定律，模型训练

来自主题: AI技术研报

12117 点击 2024-09-20 20:25

大佬亲身示范：操纵AI如此简单，LLM不仅「发疯」还造谣诽谤

当谷歌的Gemini建议给比萨加胶水时，网友尚能发挥娱乐精神玩梗解构；但当LLM输出的诽谤信息中伤到到真实人类时，AI搜索引擎的未来是否值得再三思量？

来自主题: AI技术研报

10180 点击 2024-09-20 20:04

KG+LM超越传统架构！海德堡提出全新图语言模型GLM | ACL 2024

近日，来自海德堡大学的研究人员推出了图语言模型 (GLM)，将语言模型的语言能力和知识图谱的结构化知识，统一到了同一种模型之中。

来自主题: AI技术研报

9669 点击 2024-09-20 20:01

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。

来自主题: AI技术研报

12205 点击 2024-09-20 19:58

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？

来自主题: AI技术研报

10884 点击 2024-09-20 19:48

港大发布智能交通大模型全家桶OpenCity！打破时空零样本预测壁垒，训练速度最多提升50倍

近日，香港大学发布最新研究成果：智能交通大模型OpenCity。该模型根据参数大小分为OpenCity-mini、OpenCity-base和OpenCity-Pro三个模型版本，显著提升了时空模型的零样本预测能力，增强了模型的泛化能力。

来自主题: AI技术研报

10300 点击 2024-09-19 21:58

AI探索宇宙结构新突破！超精准场级模拟，半秒完成冷暗物质仿真

AI开启模拟宇宙！近日，来自马克斯·普朗克研究所等机构，利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真，LeCun也在第一时间转发和推荐。

来自主题: AI技术研报

8391 点击 2024-09-19 19:29

QuestMobile2024 AI智能体应用洞察半年报：AI类APP月活超6600万，智能体形成八大玩法门类，商业化路径已开启

APP内“智能体”数量大增，如通义已经超过14000个、讯飞星火超过11000个、豆包超过5000个

来自主题: AI技术研报

9421 点击 2024-09-19 14:56

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生，师从黄高副教授，主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报

7564 点击 2024-09-19 11:14

Sigmoid注意力一样强，苹果开始重新审视注意力机制

注意力是 Transformer 架构的关键部分，负责将每个序列元素转换为值的加权和。将查询与所有键进行点积，然后通过 softmax 函数归一化，会得到每个键对应的注意力权重。

来自主题: AI技术研报

7904 点击 2024-09-19 11:10

2024年中国金融大模型产业发展洞察报告

金融大模型产业发展与应用趋势分析。

来自主题: AI技术研报

5231 点击 2024-09-19 09:43

单图就能解锁全景视角！北大/港中文/腾讯等推出ViewCrafter | 已开源

随便给张图就能从更多视角查看全景了？！

来自主题: AI技术研报

9394 点击 2024-09-18 16:05

关注o1必备GitHub仓库，上线3天狂揽1.5k星！英伟达工程师出品，承诺持续更新

关注o1必备的GitHub库，它来了！

来自主题: AI技术研报

7346 点击 2024-09-18 15:59

3类严重程度，6级不确定性！德州大学等首创全新胸部X光数据集，登IEEE TMI

研究人员提出了一个新的胸部X光图像数据集，该数据集包含临床不确定性和严重性感知的标签，并通过多关系图学习方法进行分析，以提高疾病分类的准确性，扩展了现有的疾病标签信息。

来自主题: AI技术研报

9113 点击 2024-09-18 15:48

Nature重磅研究：AlphaFold绘制病毒「族谱」，揭开身世之谜

除了蛋白质设计和药物发现，Nature上最近刊登的一篇论文又解锁了AlphaFold这类生物大模型的新用途——揭示生物的亲缘关系和进化史。

来自主题: AI技术研报

8102 点击 2024-09-18 15:45

OpenAI重金押注，机器人NEO世界模型登场！机器人迎来ChatGPT时刻？

刚刚，OpenAI重金押注的人形机器人初创1X终于揭秘了背后的「世界模型」——它能够根据真实数据，生成针对不同场景的中的行为预测！机器人领域的ChatGPT时刻，或许真的要来了。

来自主题: AI技术研报

8174 点击 2024-09-18 15:42

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

优秀的 GitHub 项目啊！有关 OpenAI ο1 的一切都在这里

来自主题: AI技术研报

7388 点击 2024-09-17 23:19

战胜100多位NLP研究人员！杨笛一团队最新百页论文：首次统计学上证明，LLM生成的idea新颖性优于人类

斯坦福大学的最新研究通过大规模实验发现，尽管大型语言模型（LLMs）在新颖性上优于人类专家的想法，但在可行性方面略逊一筹，还需要进一步研究以提高其实用性。

来自主题: AI技术研报

11188 点击 2024-09-17 23:12

COLM 24 | 从正确中学习？大模型的自我纠正新视角

大型语言模型（LLMs）虽然进展很快，很强大，但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】，大概就是看自己输出的结果，自己反思一下有没有错，如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报

9392 点击 2024-09-17 21:26

昂贵LLM的救星？Nature新研究提出新型忆阻器，比Haswell CPU高效460倍

前些天，OpenAI 发布了 ο1 系列模型，它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高，以至于 OpenAI 不得不限制每位用户的使用量：每位用户每周仅能给 o1-preview 发送 30 条消息，给 o1-mini 发送 50 条消息。

来自主题: AI技术研报

6859 点击 2024-09-17 19:14

比LoRA更高效！上交大&哈佛推出新微调框架，瞄准特定任务方向

比LoRA更高效的模型微调方法来了——

来自主题: AI技术研报

10390 点击 2024-09-16 21:35

DeepMind再迎挑战者，ESM作者带队6个月超越AlphaFold 3，代码权重全开源

一家刚成立6个月的初创公司Chai Discovery最近发布了能对打甚至超越AlphaFold 3的模型Chai-1，而且放出了模型权重和推理代码。不开源的DeepMind这回还能坐得住吗？

来自主题: AI技术研报

10801 点击 2024-09-16 21:12

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤纯文本问题、引入纯视觉问答

MMMU-Pro通过三步构建过程（筛选问题、增加候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。

来自主题: AI技术研报

10439 点击 2024-09-16 21:08

打开AI黑匣子，「三段式」AI用于化学研究，优化分子同时产生新化学知识，登Nature

AI 工具的强大功能，令人难以置信。但如果你试图打开引擎盖并了解它们在做什么，你通常会一无所获。AI 常常被视为「黑匣子」。

来自主题: AI技术研报

12678 点击 2024-09-16 21:05

超强o1模型智商已超120！1小时写出NASA博士1年代码，最新编程赛超越99.8%选手

OpenAI博士级别的智能，真的实现了！一位UCI物理学博士实测o1，发现自己用时1年完成的博士论文代码，竟被AI在1个小时之内实现了。

来自主题: AI技术研报

11399 点击 2024-09-16 21:02

KAN干翻MLP，开创神经网络新范式！一个数十年前数学定理，竟被MIT华人学者复活了

KAN的诞生，开启了机器学习的新纪元！而这背后，竟是MIT华人科学家最先提出的实践想法。从KAN到KAN 2.0，这个替代MLP全新架构正在打开神经网络的黑盒，为下一步科学发现打开速通之门。

来自主题: AI技术研报

10292 点击 2024-09-15 15:03