AI技术研报-这里有最前沿的人工智能技术解读

AI又一突破，10种痴呆症类型同时诊断，将人类医生准确率提高26%

准确诊断痴呆症有利于老年人晚年的身体健康，并减轻他们的家庭负担。

来自主题: AI技术研报

10111 点击 2024-07-15 13:24

自动驾驶雨天也能平稳规划，北理港中文腾讯提出端到端学习道路几何图形

用几何图形来实时构建高精地图，真香！

来自主题: AI技术研报

11010 点击 2024-07-14 14:10

AI大模型有望再扩1000倍！剑桥耶鲁康奈尔：PNN是变革关键

最近，多个机构学者合著的一篇研究为AI的规模化指了一条新路：物理神经网络（PNN），这一新兴的前沿领域还鲜少有人涉足，但绝对值得深耕！AI模型再扩展1000倍的秘密可能就藏在这里。

来自主题: AI技术研报

9329 点击 2024-07-14 14:01

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

来自微软、MIT等机构的学者提出了一种创新的训练范式，攻破了大模型的推理缺陷。他们通过因果模型构建数据集，直接教模型学习公理，结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。

来自主题: AI技术研报

9573 点击 2024-07-14 13:52

7B最强长视频模型！ LongVA视频理解超千帧，霸榜多个榜单

为什么说理解长视频难如 “大海捞针”？

来自主题: AI技术研报

10421 点击 2024-07-14 13:38

Meta开发System 2蒸馏技术，Llama 2对话模型任务准确率接近100%

研究者表示，如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征，则可以进一步提升 System 2 表现不那么好的推理任务的性能。

来自主题: AI技术研报

10352 点击 2024-07-14 13:36

端侧设备AI代理优化框架问世，领域内准确率可达97%

AI 代理得越来越重要，能够实现自主决策和解决问题。为了有效运作，这些代理需要一个确定最佳行动方案的规划过程，然后执行计划的行动。

来自主题: AI技术研报

4481 点击 2024-07-13 20:06

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

当前的视觉语言模型（VLM）主要通过 QA 问答形式进行性能评测，而缺乏对模型基础理解能力的评测，例如 detail image caption 性能的可靠评测手段。

来自主题: AI技术研报

10820 点击 2024-07-13 20:01

Mamba真比Transformer更优吗？Mamba原作者：两个都要！混合架构才是最优解

Mamba模型由于匹敌Transformer的巨大潜力，在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下，这两个架构还未有「一较高低」的机会。最近，英伟达、CMU、普林斯顿等机构联合发表的实证研究论文填补了这个空白。

来自主题: AI技术研报

4911 点击 2024-07-13 19:32

MSRA：视觉生成六大技术问题

文生图、文生视频，视觉生成赛道火热，但仍存在亟需解决的问题。

来自主题: AI技术研报

10602 点击 2024-07-13 18:39

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

10998 点击 2024-07-12 17:54