AI资讯新闻榜单内容搜索-清华

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 清华
独家|清华北大普林斯顿天才少年,用“空间Agent”重构AI健康硬件,高瓴、智元投了

独家|清华北大普林斯顿天才少年,用“空间Agent”重构AI健康硬件,高瓴、智元投了

独家|清华北大普林斯顿天才少年,用“空间Agent”重构AI健康硬件,高瓴、智元投了

空间 Agentic AI 公司 Fullive.AI,成立1个月内连续完成种子轮、种子+轮融资,由高瓴创投、慕华科创、智元机器人、北大苏南研究院与多家产业加持方共同投资,多维资本担任本轮融资财务顾问。本轮资金将用于 Bio-OS 空间 AI Agent的迭代、首款睡眠空间 AI 硬件的研发,以及 AI 生态建设。

来自主题: AI资讯
8836 点击    2026-03-15 08:58
UIUC清华微软联合提出PlugMem:当Agent记忆告别「经历」,开始存储「经验」

UIUC清华微软联合提出PlugMem:当Agent记忆告别「经历」,开始存储「经验」

UIUC清华微软联合提出PlugMem:当Agent记忆告别「经历」,开始存储「经验」

随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行,“记忆该如何设计” 正在成为一个绕不开的核心问题。

来自主题: AI技术研报
10250 点击    2026-03-12 09:53
CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

大家是否有这样的感觉?给定几张场景中拍摄的图片,往往能够在脑海中想象出这个场景的三维布局,然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示,限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报
8871 点击    2026-03-11 09:25
如何训练VLA?丰田研究院发布史上最大实验规模「保姆级」教程

如何训练VLA?丰田研究院发布史上最大实验规模「保姆级」教程

如何训练VLA?丰田研究院发布史上最大实验规模「保姆级」教程

是不是经常纠结于 VLA(视觉 - 语言 - 动作)模型的训练技巧?面对层出不穷的 VLA 算法,是不是常常感到眼花缭乱,不知道哪种数据模态、训练策略最有效? 别急,丰田研究院(TRI)和清华大学刚刚

来自主题: AI技术研报
9048 点击    2026-03-08 10:38
为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

一句话总结:社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了:在 BF16 等低精度训练里,FlashAttention 不是随机出 bug,而是会在特定条件下触发有方向的数值偏置,借助注意力中涌现的相似低秩更新方向被持续放大,最终把权重谱范数和激活推到失控,导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改,实测能显著稳定训练。

来自主题: AI技术研报
6789 点击    2026-03-04 13:49
再携手!清华陈建宇×斯坦福Chelsea团队发布VLAW,世界模型×VLA协同进化

再携手!清华陈建宇×斯坦福Chelsea团队发布VLAW,世界模型×VLA协同进化

再携手!清华陈建宇×斯坦福Chelsea团队发布VLAW,世界模型×VLA协同进化

机器之心编辑部 整个具身智能领域都在探索世界模型的实用化路径。这个被寄予厚望的「数字模拟器」,本应成为机器人训练的核心工具,却因物理保真度低等问题成为「空中楼阁」。 去年年中,谷歌发布了 Genie-

来自主题: AI资讯
10016 点击    2026-02-28 19:48
全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT

全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT

全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT

全球最大游戏博主 PewDiePie,又整活了。他靠着「偷师」DeepSeek、清华大学发布的技术文档,用一堆魔改显卡成功微调出一个自己的 AI 模型,而这个模型在编程基准测试中的表现,竟然超越了 GPT-4 和 Gemini 2.5 Pro。

来自主题: AI资讯
8971 点击    2026-02-28 15:34
DeepSeek新论文来了!联手清华、北大,优化智能体大模型推理

DeepSeek新论文来了!联手清华、北大,优化智能体大模型推理

DeepSeek新论文来了!联手清华、北大,优化智能体大模型推理

「DeepSeek V4 来了!」这样的消息是不是已经听烦了?总结来说,这篇新论文介绍了一个名为「DualPath」的创新推理系统,专门针对智能体工作负载下的大语言模型(LLM)推理性能进行优化。具体来讲,通过引入「双路径 KV-Cache 加载」机制,解决了在预填充 - 解码(PD)分离架构下,KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报
9088 点击    2026-02-27 11:35