复杂空间指令也能秒懂?RoboRefer 让机器人理解推理空间,开放世界也能精准行动!
复杂空间指令也能秒懂?RoboRefer 让机器人理解推理空间,开放世界也能精准行动!机器人走出实验室、进入真实世界真正可用,远比想象中更复杂。现实环境常常杂乱无序、物体种类繁多、灵活多变,远不像实验室那样干净、单一、可控。
机器人走出实验室、进入真实世界真正可用,远比想象中更复杂。现实环境常常杂乱无序、物体种类繁多、灵活多变,远不像实验室那样干净、单一、可控。
海外和国内AI上差异最大的点可能还不是模型的水平,而是真的没应用。这导致一个很可怕的后果:国内AI整个生态是断链的。
现在,国内研究机构就从数据基石的角度出发,拿出了还原真实动态世界的新进展:上海人工智能实验室、北京理工大学、上海创智学院、东京大学等机构聚焦世界生成的第一步——世界探索,联合推出一个持续迭代的高质量视频数据集项目——Sekai(日语意为“世界”),服务于交互式视频生成、视觉导航、视频理解等任务,旨在利用图像、文本或视频构建一个动态且真实的世界,可供用户不受限制进行交互探索。
大语言模型(LLM)在标准编程基准测试(如 HumanEval,Livecodebench)上已经接近 “毕业”,但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力?
言归正传,今天就给大家分享一下AI应用行业月度报告。QuestMobile数据显示,过去几个月里,在大模型能力没有出现“代际跃迁”的情况下,AI应用持续深入垂直探索
想象这样一个场景:你是一位生物学家,手握基因表达数据,直觉告诉你某些基因之间存在调控关系,但如何科学地验证这种关系?你听说过 "因果发现" 这个词,但对于具体算法如 PC、GES 就连名字都非常陌生。
新皮层独家获悉,具身智能公司星动纪元近期完成近5亿元A轮融资。这是该公司自2023年8月成立以来完成的第4轮融资,最近一次是去年10月近3亿元的Pre-A轮。本轮融资由鼎晖资本和海尔资本联合领投,厚雪资本、华映资本、襄禾资本、丰立智能等财务机构及产业资本跟投,老股东清流资本、清控基金等机构继续追加投资;华兴资本担任独家财务顾问。
华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:
又一个让大模型几乎全军覆没的难题出现了。
面对扩散模型推理速度慢、成本高的问题,HKUST&北航&商汤提出了全新缓存加速方案——HarmoniCa:训练-推理协同的特征缓存加速框架,突破DiT架构在部署端的速度瓶颈,成功实现高性能无损加速。