AI资讯新闻榜单内容搜索-TEN

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: TEN
Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

近年来,Vision-Language Models(视觉 — 语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。然而,这类模型在实际应用中往往面临推理开销大、效率受限的问题,研究者通常依赖 visual token pruning 等策略降低计算成本,其中 attention 机制被广泛视为衡量视觉信息重要性的关键依据。

来自主题: AI技术研报
9797 点击    2026-02-06 10:39
o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 —— SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

来自主题: AI技术研报
6910 点击    2026-02-02 09:31
「Dokie不如ListenHub」

「Dokie不如ListenHub」

「Dokie不如ListenHub」

我最近的快乐来自一篇名为《Dokie:被 AI 点亮的方式,可以不仅仅是因为效率》的文章:

来自主题: AI资讯
9482 点击    2026-01-28 14:55
 开源项目VibeTensor连论文都是AI写的,陈天奇、贾扬清点赞:Vibe Coding版PyTorch

开源项目VibeTensor连论文都是AI写的,陈天奇、贾扬清点赞:Vibe Coding版PyTorch

开源项目VibeTensor连论文都是AI写的,陈天奇、贾扬清点赞:Vibe Coding版PyTorch

刚刚,英伟达杰出工程师许冰(Bing Xu)在 GitHub 上开源了一个新项目 VibeTensor,让我们看到了 AI 在编程方面的强大实力。从名字也能看出来,这是 Vibe Coding 的成果。事实也确实如此,这位谷歌学术引用量超 20 万的工程师在 X 上表示:「这是第一个完全由 AI 智能体生成的深度学习系统,没有一行人类编写的代码。」

来自主题: AI资讯
10690 点击    2026-01-24 11:12
AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI推理基础设施公司Baseten完成 3 亿美元融资,英伟达、Alphabet联手下注

AI 推理基础设施公司 Baseten 近日完成一轮 3 亿美元的成长型融资,投后估值约 50 亿美元。与不到六个月前的一轮重要融资相比,公司估值几乎翻倍。 这一交易清晰地表明,在大模型训练之外,推理

来自主题: AI资讯
10350 点击    2026-01-24 10:54
AAAI 2026 Oral | 告别注意力与热传导!北大清华提出WaveFormer,首创波动方程建模视觉

AAAI 2026 Oral | 告别注意力与热传导!北大清华提出WaveFormer,首创波动方程建模视觉

AAAI 2026 Oral | 告别注意力与热传导!北大清华提出WaveFormer,首创波动方程建模视觉

“全局交互” 几乎等同于 self-attention:每个 token 都能和所有 token 对话,效果强,但代价也直观 —— 复杂度随 token 数平方增长,分辨率一高就吃不消。现有方法大多从 “相似度匹配” 出发(attention),或从 “扩散 / 传导” 出发(热方程类方法)。但热方程本质上是一个强低通滤波器:随着传播时间增加,高频细节(边缘、纹理)会迅速消失,导致特征过平滑。

来自主题: AI技术研报
8643 点击    2026-01-21 10:39
让机器人看视频学操作技能,清华等全新发布的CLAP框架做到了

让机器人看视频学操作技能,清华等全新发布的CLAP框架做到了

让机器人看视频学操作技能,清华等全新发布的CLAP框架做到了

近日,清华大学与星尘智能、港大、MIT 联合提出基于对比学习的隐空间动作预训练(Contrastive Latent Action Pretraining, CLAP)框架。这个框架能够将视频中提纯的运动空间与机器人的动作空间进行对齐,也就是说,机器人能够直接从视频中学习技能!

来自主题: AI技术研报
7655 点击    2026-01-19 15:13
从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

从过拟合到通用!ViMoGen开启3D人体动作生成新纪元

随着 AIGC(Artificial Intelligence Generated Content) 的爆发,我们已经习惯了像 Sora 或 Wan 这样的视频生成模型能够理解「一只宇航员在火星后空翻」这样天马行空的指令。然而,3D 人体动作生成(3D MoGen)领域却稍显滞后。

来自主题: AI技术研报
8777 点击    2026-01-08 16:13
一年从0到300万美元ARR,非典型AI创业者斩获千万融资|对话创始人

一年从0到300万美元ARR,非典型AI创业者斩获千万融资|对话创始人

一年从0到300万美元ARR,非典型AI创业者斩获千万融资|对话创始人

月前,Pollo.ai 拿下千万美元融资,而今日, ListenHub 也拿下了 200 万美元融资。两个产品都没有做自研模型,创始人也都不是典型的技术或者大厂出身,都是非典型的 AI 应用层创业,这个在 2024年“质疑”声很大的模式,在 2025 年却结出了不少的果实。

来自主题: AI资讯
8109 点击    2026-01-05 09:49