AI资讯新闻榜单内容搜索-io

全球首个人形机器人通用视觉感知系统，Humanoid Occupancy建立多模态环境理解新范式

凭借类人化的结构设计与运动模式，人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域，而这些任务的高效完成，均以机器人对自身所处环境的全面精准理解为前提。

来自主题: AI技术研报

5576 点击 2025-08-05 16:14

面向6G环境感知通信！西电开源3Dx3D无线电地图数据集与生成式基准框架

当前环境感知通信正逐步成为第六代移动通信系统（6G）的核心使能技术之一。为支撑其在复杂三维环境下的部署需求，西安电子科技大学、香港中文大学（深圳）和加拿大滑铁卢大学的研究团队联合提出了一个面向6G的高分辨率多模态三维无线电图谱数据集UrbanRadio3D，并构建了基于扩散模型的三维无线电图生成框架RadioDiff-3D。

来自主题: AI技术研报

6062 点击 2025-08-05 16:07

别听模型厂商的，Prompt 不是功能，是 bug

除了是知名 AI 播客「No Priors」的主理人之外，Sarah Guo 更知名的身份，是风险投资 Conviction 的创始人。

来自主题: AI资讯

5854 点击 2025-08-05 13:41

马斯克再放大招！Grok AI短视频爆火，一夜全网刷屏

今天凌晨，马斯克再放大招更新Grok App。AI短视频30秒一键生成，真面对决谷歌Veo 3。刚刚，马斯克宣布：Grok Imagine今天开始向所有Grok Heavy用户推出。Grok iOS App升级，Imagine功能重磅升级！

来自主题: AI资讯

7562 点击 2025-08-03 23:26

全网苦等GPT-5，超级对齐团队遗作成重要线索，奥特曼发话「惊喜很多」

最近整个 AI 圈的目光似乎都集中在 GPT-5 上，相关爆料满天飞，但模型迟迟不见踪影。昨天我们报道了 The Information 扒出的 GPT-5 长文内幕，今天奥特曼似乎也坐不住，发了推文表示「惊喜很多，值得等待」。

来自主题: AI技术研报

5974 点击 2025-08-03 14:37

拥抱潘多拉，但按住盒子

通过AI，我们已经可以创造出具备迷人外表、动人声音与善解人意语言能力的“智能存在”——形象、语言、陪伴，都已不再是幻想。最近，号称“地表最强AI”的Grok进行了一次重要更新。与以往不同，这次更新的重点并非提升模型的“智力”，而是专注于增强其情感能力。在此次更新中，Grok首次引入了“伴侣”（Com－panions）功能，允许用户创建拥有定制声音、外观和个性的AI伴侣。

来自主题: AI资讯

6649 点击 2025-08-03 13:50

ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法

近年来，扩散模型（Diffusion Models）凭借出色的生成质量，迅速成为图像、视频、语音、3D 内容等生成任务中的主流技术。从文本生成图像（如 Stable Diffusion），到高质量人脸合成、音频生成，再到三维形状建模，扩散模型正在广泛应用于游戏、虚拟现实、数字内容创作、广告设计、医学影像以及新兴的 AI 原生生产工具中。

来自主题: AI技术研报

5930 点击 2025-08-03 13:04