
全球首个人形机器人通用视觉感知系统,Humanoid Occupancy建立多模态环境理解新范式
全球首个人形机器人通用视觉感知系统,Humanoid Occupancy建立多模态环境理解新范式凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。
凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。
当前环境感知通信正逐步成为第六代移动通信系统(6G)的核心使能技术之一。为支撑其在复杂三维环境下的部署需求,西安电子科技大学、香港中文大学(深圳)和加拿大滑铁卢大学的研究团队联合提出了一个面向6G的高分辨率多模态三维无线电图谱数据集UrbanRadio3D,并构建了基于扩散模型的三维无线电图生成框架RadioDiff-3D。
除了是知名 AI 播客「No Priors」的主理人之外,Sarah Guo 更知名的身份,是风险投资 Conviction 的创始人。
今天凌晨,马斯克再放大招更新Grok App。AI短视频30秒一键生成,真面对决谷歌Veo 3。刚刚,马斯克宣布:Grok Imagine今天开始向所有Grok Heavy用户推出。Grok iOS App升级,Imagine功能重磅升级!
最近整个 AI 圈的目光似乎都集中在 GPT-5 上,相关爆料满天飞,但模型迟迟不见踪影。昨天我们报道了 The Information 扒出的 GPT-5 长文内幕,今天奥特曼似乎也坐不住,发了推文表示「惊喜很多,值得等待」。
通过AI,我们已经可以创造出具备迷人外表、动人声音与善解人意语言能力的“智能存在”——形象、语言、陪伴,都已不再是幻想。最近,号称“地表最强AI”的Grok进行了一次重要更新。与以往不同,这次更新的重点并非提升模型的“智力”,而是专注于增强其情感能力。在此次更新中,Grok首次引入了“伴侣”(Com-panions)功能,允许用户创建拥有定制声音、外观和个性的AI伴侣。
近年来,扩散模型(Diffusion Models)凭借出色的生成质量,迅速成为图像、视频、语音、3D 内容等生成任务中的主流技术。从文本生成图像(如 Stable Diffusion),到高质量人脸合成、音频生成,再到三维形状建模,扩散模型正在广泛应用于游戏、虚拟现实、数字内容创作、广告设计、医学影像以及新兴的 AI 原生生产工具中。
你有没有想过,营销这件事可能彻底变了?两个24岁的UC Berkeley辍学生,刚刚拿到2800万美元融资,要挑战Salesforce和Adobe这样的巨头。他们的武器很简单:用AI让营销软件不再是企业的噩梦,而是真正能解决问题的工具。
中国首个推出兼容E2B接口Agent沙箱的公司。7月26日,2025世界人工智能大会(WAIC)现场人头攒动。在科技要素拉满的会场内,几乎每个展台都在讨论大模型和AI Agent。
用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。