AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

简单的任务,传统的Transformer却错误率极高。Meta FAIR团队重磅推出多token注意力机制(MTA),精准捕捉复杂信息,带来模型性能飞升!

来自主题: AI技术研报
6039 点击    2025-04-04 14:14
DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖

DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖

DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖

谷歌DeepMind研发的DreamerV3实现重大突破:无需任何人类数据,通过强化学习与「世界模型」,自主完成《我的世界》中极具挑战的钻石收集任务。该成果被视为通往AGI的一大步,并已登上Nature。

来自主题: AI技术研报
6423 点击    2025-04-03 16:56
AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

通过完全启用并发多块执行,支持任意专家数量(MAX_EXPERT_NUMBER==256),并积极利用共享内存(5kB LDS)和寄存器(52 VGPRs,48 SGPRs),MoE Align & Sort逻辑被精心设计,实现了显著的性能提升:A100提升3倍,H200提升3倍,MI100提升10倍,MI300X/MI300A提升7倍...

来自主题: AI技术研报
3085 点击    2025-04-03 16:14
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

随着人工智能和大语言模型(LLMs)的不断突破,如何将其优势赋能于现实世界中可实际部署的高效工具,成为了业界关注的焦点。

来自主题: AI技术研报
2997 点击    2025-04-03 15:19
让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

大模型写代码早就是基操了,但让它写算法竞赛题或企业级系统代码,就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁板一块” 毫无章法,要么是 “一锅乱炖” 难以维护。

来自主题: AI技术研报
8391 点击    2025-04-03 15:12
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。

来自主题: AI技术研报
7436 点击    2025-04-03 10:57
类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

当我们遇到新问题时,往往会通过类比过去的经验来寻找解决方案,大语言模型能否如同人类一样类比?在对大模型的众多批判中,人们常说大模型只是记住了训练数据集中的模式,并没有进行真正的推理。

来自主题: AI技术研报
9523 点击    2025-04-03 10:50
6000字+6个案例:写给普通人的MCP入门指南

6000字+6个案例:写给普通人的MCP入门指南

6000字+6个案例:写给普通人的MCP入门指南

最近 MCP 协议很火,自己也发掘了一些玩法,但是目前来看 MCP 的配置还是过于繁琐了,对普通人门槛有点高。这几天终于摸索出来了一些方法让大家可以相对容易理解的方式配置 MCP 服务。

来自主题: AI技术研报
9761 点击    2025-04-02 16:55
用多模态模型,写新一代爬虫

用多模态模型,写新一代爬虫

用多模态模型,写新一代爬虫

字节有一个很实用但不怎么火的项目,叫 Midscene.js,Chrome 商店上的安装数仅有 1 万,它是一个由多模态模型驱动的前端自动化测试插件。自动化测试我平常很少用到,但我发现它特别适合用来写爬虫……

来自主题: AI技术研报
8820 点击    2025-04-02 16:09
从USB到MCP:AI 工具生态接口的革新

从USB到MCP:AI 工具生态接口的革新

从USB到MCP:AI 工具生态接口的革新

上周,OpenAI 正式支持 MCP 协议的消息,无疑成为 AI 基础设施演进的重要里程碑。短短几个月内,从 Anthropic 首次提出到微软、OpenAI 等巨头先后加入,这一标准正在以惊人的速度完成从提出、验证到主流采纳的跃迁。

来自主题: AI技术研报
4203 点击    2025-04-02 15:21
动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态变化网络实现语义特征的平滑建模,显著提升了动态语义场的建模能力。

来自主题: AI技术研报
3997 点击    2025-04-02 15:05
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。

来自主题: AI技术研报
7919 点击    2025-04-02 14:58
细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈

细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈

细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈

在自动驾驶领域,高精度仿真系统扮演着 “虚拟练兵场” 的角色。工程师需要在数字世界中模拟暴雨、拥堵、突发事故等极端场景,反复验证算法的可靠性。

来自主题: AI技术研报
6612 点击    2025-04-02 14:48
在DeepSearch中用DeepSeek-R1来做动作决策会更好么?

在DeepSearch中用DeepSeek-R1来做动作决策会更好么?

在DeepSearch中用DeepSeek-R1来做动作决策会更好么?

众所周知,DeepSeek R1 这种模型在推理任务上很能打,尤其是在数学和编程这些逻辑性强的领域。那么我们能直接把这种强大的推理能力搬到 DeepSearch 这种需要动态规划、多轮交互的深度搜索场景里吗?

来自主题: AI技术研报
6149 点击    2025-04-02 14:40
自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。

来自主题: AI技术研报
9206 点击    2025-04-02 10:09