北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵
北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵视觉–语言–动作(VLA)模型在机器人场景理解与操作上展现出较强的通用性,但在需要明确目标终态的长时序任务(如乐高搭建、物体重排)中,仍难以兼顾高层规划与精细操控。
视觉–语言–动作(VLA)模型在机器人场景理解与操作上展现出较强的通用性,但在需要明确目标终态的长时序任务(如乐高搭建、物体重排)中,仍难以兼顾高层规划与精细操控。
越来越多 AI 出海公司,把达人营销视为最重要的增长杠杆之一。与传统广告投放或内容营销相比,达人营销最大的优势在于它的「活人感」——真实的创作者在真实的使用场景中展示产品,天然降低了用户的信任门槛。
有人私信我:这种级别的干货,外面都是打包卖几千块的课,你就这么免费发出来了?
在计算机图形学、三维视觉、虚拟人、XR 领域,SIGGRAPH 是毫无争议的 “天花板级会议”。 SIGGRAPH Asia 作为 SIGGRAPH 系列两大主会之一,每年只接收全球最顶尖研究团队的成果稿件,代表着学术与工业界的最高研究水平与最前沿技术趋势。
当国产AI芯片接连发布、估值高涨之际,一个尖锐的问题依然悬在头顶:它们真的能撑起下一代万卡集群与万亿参数模型的训练吗?
我可能,刚刚成为了哈基米的儿子。 至少,AI是这么认为的。 事情是这样的。 前两天,我在小红书上闲逛,无意间用他们的AI搜索功能,搜了一下影视飓风的李四维。然后,就发现了一个神奇的AI回答。
周五凌晨,OpenAI 发布 GPT-5.2-Codex,这是迄今为止最先进的智能体编码模型,专为复杂的实际软件工程而设计。GPT-5.2-Codex 是 GPT-5.2 的升级版本,提高了指令遵循能力、对长远语境的理解能力,它针对 Codex 中的智能体编码进行了进一步优化,包括通过上下文压缩改进长期工作。
“暗涌Waves”独家获悉,AI硬件设计生成平台“指数科技”近日完成了近亿元人民币的Pre-A轮融资,由云启资本领投,誉尊资本、尚势资本跟投。而在此前的2024年,指数科技在刚成立不久、只有demo时,已完成由启赋资本和华盖资本联合领投的天使轮融资。
就在刚刚,ChatGPT 应用商店已经正式推出。
2027年落地,主攻AI推理。