AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
开源个 Skill|彻底解决小红、小绿书配图难题

开源个 Skill|彻底解决小红、小绿书配图难题

开源个 Skill|彻底解决小红、小绿书配图难题

前段时间开源了 guizang-ppt-skill,之后我自己用它做内容的时候发现一件事。

来自主题: AI技术研报
5939 点击    2026-05-28 11:25
T-PAMI|中国科大、合工大等提出CAPER++:让关节物体位姿感知真正迈向「又快又稳」

T-PAMI|中国科大、合工大等提出CAPER++:让关节物体位姿感知真正迈向「又快又稳」

T-PAMI|中国科大、合工大等提出CAPER++:让关节物体位姿感知真正迈向「又快又稳」

在具身智能快速发展的今天,机器人已经不再满足于「看见」刚体物体,而是开始真正走向复杂环境中的交互与操作。从机械臂开柜门,到服务机器人整理抽屉,再到工业场景中的工具操作,大量真实世界目标都属于关节物体(Articulated Objects)。

来自主题: AI技术研报
8147 点击    2026-05-28 10:18
这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过,我们每天用的 AI 大模型,可能在某些词汇上天生就有缺陷?不是因为训练数据不够,不是因为算力不足,而是因为语言本身的规律——那些用得少的词,模型就是学不好。更让人意外的是,这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报
6750 点击    2026-05-28 09:52
Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

就在几天前(5月22日),DeepSeek官方扔出了一枚重磅炸弹:DeepSeek-V4-Pro将在5月底结束优惠后,永久降价至原价的四分之一。各大媒体瞬间被诸如“白菜价”、“夯爆了”的标题刷屏。看看这组惊人的新定价:每百万Token输出6元,输入(缓存未命中)3元,而输入(缓存命中)仅仅只要0.025元!

来自主题: AI技术研报
6977 点击    2026-05-28 09:51
双榜SOTA!微软ACL2026新作重新定义AI长记忆

双榜SOTA!微软ACL2026新作重新定义AI长记忆

双榜SOTA!微软ACL2026新作重新定义AI长记忆

随着大语言模型在各类应用中加速落地,一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG(检索增强生成)方案依赖语义相似度检索历史信息,但“语义相似”并不等于“真正相关”,常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。

来自主题: AI技术研报
8453 点击    2026-05-28 09:50
用8年时间将向量数据库做到极致后,我们为何又推出了Vector Lakebase?

用8年时间将向量数据库做到极致后,我们为何又推出了Vector Lakebase?

用8年时间将向量数据库做到极致后,我们为何又推出了Vector Lakebase?

在这些场景,一个集合也许一个月只被查询几次,运行时间不超过5小时,用户也并不需要为此投入向量数据库级别的资源建设,让高性能资源一个月时间里有715小时都被浪费。相应的,成本也就成了这一场景下的优先考量要素。而解决这一问题,也是我们选择在近期推出Vector Lakebase 产品的初心所在。

来自主题: AI技术研报
6763 点击    2026-05-27 16:20
CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

不用百万级 3D 标注,模型也能从普通驾驶视频中学会「自己是怎么动的」。Wayve 的 LA-Pose 试图把未标注视频里的运动信号,转化为自动驾驶系统所需的相机位姿估计能力。

来自主题: AI技术研报
6745 点击    2026-05-27 16:10
从Foundation Model到Physical AI,三星「杀入」大模型核心战场

从Foundation Model到Physical AI,三星「杀入」大模型核心战场

从Foundation Model到Physical AI,三星「杀入」大模型核心战场

过去几年,大模型竞争主要发生在 AI 公司之间。但随着 AI 开始从数字世界进入真实设备与物理世界,竞争逻辑正在发生变化。

来自主题: AI技术研报
5228 点击    2026-05-27 16:09
Python逆天改命!开源Hermes首次击败OpenAI Codex

Python逆天改命!开源Hermes首次击败OpenAI Codex

Python逆天改命!开源Hermes首次击败OpenAI Codex

一个纯Python写的开源项目,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes直接上演工程暴力美学,解释型语言终于逆天改命。

来自主题: AI技术研报
6809 点击    2026-05-27 09:53
将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式

将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式

将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式

当你把一段长达9分钟、在“晴空万里”与“冰天雪地”间剧烈切换的冰岛旅行Vlog输入给大模型,并要求它做一份旅行攻略时,常规的视觉大模型通常只能给出一份基于字幕和画面标签拼凑的“流水账”。

来自主题: AI技术研报
8324 点击    2026-05-27 09:52
你以为在用 Claude,其实只碰了 1%

你以为在用 Claude,其实只碰了 1%

你以为在用 Claude,其实只碰了 1%

Anatoli Kopadze 这条帖子 2200 万阅读,我一开始以为又是那种「10 个 AI 技巧改变你人生」的流量帖。点进去一看——还真有东西。17 个功能里大概有 5 个我压根不知道存在,还有 3 个我一直在用但用法完全是错的。

来自主题: AI技术研报
5271 点击    2026-05-27 09:24
我们开源了一个可以降低 AIGC 率的模型

我们开源了一个可以降低 AIGC 率的模型

我们开源了一个可以降低 AIGC 率的模型

最近到了毕业季,好多朋友来找我聊一件事:有什么办法帮他降 AIGC。

来自主题: AI技术研报
8668 点击    2026-05-27 09:24
刚刚,中国AI闯入全球编程前二!前面只剩Claude

刚刚,中国AI闯入全球编程前二!前面只剩Claude

刚刚,中国AI闯入全球编程前二!前面只剩Claude

Code Arena最新放榜,Qwen3.7-Max以1541分冲进全球第四,成为前五中唯一的非Claude模型。编程,中国模型第一次杀到这个位置。

来自主题: AI技术研报
10171 点击    2026-05-27 09:14
Claude Code和机器人背后的共同机制,UIUC、Meta、Stanford这篇最新综述讲清楚了

Claude Code和机器人背后的共同机制,UIUC、Meta、Stanford这篇最新综述讲清楚了

Claude Code和机器人背后的共同机制,UIUC、Meta、Stanford这篇最新综述讲清楚了

说在前面:这又是一篇讲Harness的Survey,你最近可能已经看过了数篇讲Harness的文章、论文,其中还可能包括我上周解读的《Agent Harness Engineering:Agent的底盘工程综述|CMU、耶鲁、Amazon》。

来自主题: AI技术研报
10370 点击    2026-05-27 08:46
龙虾之父教你省钱:开源Skill给你的Skill减肥

龙虾之父教你省钱:开源Skill给你的Skill减肥

龙虾之父教你省钱:开源Skill给你的Skill减肥

Skill水平参差不齐,龙虾之父Peter看不下去了。

来自主题: AI技术研报
6267 点击    2026-05-26 16:05
一个月的活一周干完!英伟达世界模型训练速度飙升400%

一个月的活一周干完!英伟达世界模型训练速度飙升400%

一个月的活一周干完!英伟达世界模型训练速度飙升400%

英伟达世界动作模型 DreamZero 训练一次要烧 8 张 H100 整整 25 天,RLinf 从算子融合到 I/O 全链路系统级重构,把训练吞吐拉高近 4 倍——1 个月的活,1 周就能干完。

来自主题: AI技术研报
6503 点击    2026-05-26 16:04
“Token”必须死?

“Token”必须死?

“Token”必须死?

“我语言的局限,即意味着我世界的局限。”( Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt. )

来自主题: AI技术研报
8951 点击    2026-05-26 15:23
AI时代,流量不再“跳动”,字节进入“中年危机”!

AI时代,流量不再“跳动”,字节进入“中年危机”!

AI时代,流量不再“跳动”,字节进入“中年危机”!

字节跳动计划在今年将其在人工智能基础设施上的支出大幅提升惊人的25%。这意味着将投入2000亿元人民币,这可不是一个边缘性的微调,是一次由不断升级的存储芯片成本以及字节跳动想要主导AI领域的雄心共同推动的巨大升级。

来自主题: AI技术研报
8141 点击    2026-05-26 14:58
画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

当下视觉生成正陷入一个能力错位困境—— 扩散模型的像素画质已接近完美,但一遇到需要逻辑推理的生成任务就频频翻车。

来自主题: AI技术研报
5678 点击    2026-05-26 14:58
怎么知道 Agent 真干完活了?

怎么知道 Agent 真干完活了?

怎么知道 Agent 真干完活了?

判断 Agent 靠谱与否,核心指标只有一个:是不是真干完活了

来自主题: AI技术研报
7885 点击    2026-05-26 14:57
ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

大语言模型在地图、城市、交通等空间领域的应用越来越广泛。对于这些场景来说,问题往往不只是 “查一个地点” 或 “调用一次路线 API” 就能解决的,而是需要把用户的自然语言问题组织成一段可执行、可验证的地理分析流程。

来自主题: AI技术研报
8647 点击    2026-05-26 14:57