AI资讯新闻榜单内容搜索-AI新闻

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI新闻
终结VLA?英伟达押注的具身新范式,首篇世界动作模型WAM综述重磅发布

终结VLA?英伟达押注的具身新范式,首篇世界动作模型WAM综述重磅发布

终结VLA?英伟达押注的具身新范式,首篇世界动作模型WAM综述重磅发布

Jim Fan 押注的这条 “先预测世界,再生成动作” 的新路,正是当下具身智能领域最炙手可热的下一代范式 —— 世界动作模型(World Action Models,简称 WAM)。虽然 WAM 正在迅速成为各大顶尖实验室的核心发力点,但业界至今仍然缺乏对它的统一标准和系统梳理。近期,复旦大学可信具身智能研究院,上海创智学院,新加坡国立大学发表了首篇 WAM 的详细综述。

来自主题: AI技术研报
8013 点击    2026-05-23 09:55
CVPR 2026 | 突破短视,理解变化!HiF-VLA:以motion为中心打造「边想边做」的世界动作模型

CVPR 2026 | 突破短视,理解变化!HiF-VLA:以motion为中心打造「边想边做」的世界动作模型

CVPR 2026 | 突破短视,理解变化!HiF-VLA:以motion为中心打造「边想边做」的世界动作模型

来自西湖大学、浙江大学、西湖机器人等机构的研究团队提出了一种以运动(Motion)为中心的全新双向时空推理框架 HiF-VLA。抛弃冗余的像素级输入,HiF-VLA 巧妙提取低维紧凑的 Motion 向量作为动态先验,在一个创新的「联合专家」模块中,同步完成未来视觉运动的预测与高精度动作序列的生成。

来自主题: AI技术研报
7998 点击    2026-05-23 09:55
DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

说实话,我原本以为 DeepSeek 的限时优惠会在5月31日结束。毕竟降价75%,打了2.5折,怎么看都像是一波限时引流。5月22号晚上,DeepSeek发了个通知,我看了两遍才确认没看错——DeepSeek V4-Pro永久降价!

来自主题: AI资讯
7863 点击    2026-05-23 09:38
刚刚,王小川掏出AI家庭医生:微信里喊你吃药、帮你盯紧全家健康

刚刚,王小川掏出AI家庭医生:微信里喊你吃药、帮你盯紧全家健康

刚刚,王小川掏出AI家庭医生:微信里喊你吃药、帮你盯紧全家健康

今天,百川智能发布了AI家庭医生产品“百小医”,并展示了即将发布的百川新一代医疗大模型Baichuan-M4。“百小医”目前已经上线各大应用市场,而Baichuan-M4会在下个月开放API服务。

来自主题: AI资讯
8842 点击    2026-05-22 22:26
久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

就在今天,美团龙猫大模型团队突然开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。在权威评测中,它的用户偏好胜率全面超越 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 这三个头部玩家,并且直接以 MIT 协议开放,连商用限制都懒得设。

来自主题: AI资讯
9178 点击    2026-05-22 21:38
20岁写出Transformer的人,真开源2180亿大模型Command A+

20岁写出Transformer的人,真开源2180亿大模型Command A+

20岁写出Transformer的人,真开源2180亿大模型Command A+

刚刚,Cohere放出2180亿参数的MoE大模型Command A+,单张B200可跑,支持48种语言,还带原生引用能力。但这次发布最炸的,不在参数表上,而在那一个许可证:Apache 2.0。

来自主题: AI资讯
8762 点击    2026-05-22 16:01
深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限

深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限

深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限

李诞带火了一个AI娱乐应用贝果,带着好奇,我第一时间通过内部朋友要到了内测资格。最上头的是贝果的“现实 Online”这个产品。它的玩法听上去极其简单:拿起手机,随手一扫,但就在这短短几秒钟里,整个办公室瞬间就被改造成了一个可以实时探索的游戏空间。

来自主题: AI资讯
9571 点击    2026-05-22 15:46
狂揽F轮融资+拿下4100万用户!兔展智能用 SkillsUI 把企业旧系统变成AI能力库

狂揽F轮融资+拿下4100万用户!兔展智能用 SkillsUI 把企业旧系统变成AI能力库

狂揽F轮融资+拿下4100万用户!兔展智能用 SkillsUI 把企业旧系统变成AI能力库

在会聊天的AI和会办事的AI之间,隔着的是一整套企业业务系统的调用能力。补上这一层,才相当于抓住了当下企业AI落地真正的“最后一公里”。一场关于企业IT架构的静水流深变革,已经由一个叫SkillsUI的新物种拉开了序幕,来自深圳兔展智能。

来自主题: AI资讯
9080 点击    2026-05-22 15:40
首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

英伟达提出了全球首个三模式的大语言模型系列,只需简单更改注意力模式 / 掩码,即可在自回归、扩散和自推测解码之间切换。一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。

来自主题: AI技术研报
9189 点击    2026-05-22 15:33
李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。

来自主题: AI技术研报
9005 点击    2026-05-22 15:32