CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿
CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿不用百万级 3D 标注,模型也能从普通驾驶视频中学会「自己是怎么动的」。Wayve 的 LA-Pose 试图把未标注视频里的运动信号,转化为自动驾驶系统所需的相机位姿估计能力。
搜索
不用百万级 3D 标注,模型也能从普通驾驶视频中学会「自己是怎么动的」。Wayve 的 LA-Pose 试图把未标注视频里的运动信号,转化为自动驾驶系统所需的相机位姿估计能力。
每周25万亿tokens的真实流量、估值一年翻倍——OpenRouter拿下1.13亿美元B轮融资。
红星新闻报道,5月26日,记者联系了多家AI平台,其中豆包客服表示,豆包在高考期间可正常使用,但拍题答疑等类似功能会被禁用,具体情况要以当时页面显示为准,目前还未接到通知。
据 FT 报道,字节跳动正在向旗下 Seed 部门员工开放新一轮豆包股认购权,每股 13 美元。Seed 目前约有 2000 名员工,包括核心研究员、基础设施工程师、数据标注团队和翻译人员。
最近,谷歌的日子不太好过。
当你把一段长达9分钟、在“晴空万里”与“冰天雪地”间剧烈切换的冰岛旅行Vlog输入给大模型,并要求它做一份旅行攻略时,常规的视觉大模型通常只能给出一份基于字幕和画面标签拼凑的“流水账”。
DeepSeek研究员陈德里,在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch,DeepSeek-V4-Pro研究和写作,GPT-Image2画图。论文共迭代6次(V1:4 次,V2:1 次,V3:1 次),总耗时6天,进行了约108轮Agent调用,消耗64.8万token,写了2234行LaTeX代码。
Anatoli Kopadze 这条帖子 2200 万阅读,我一开始以为又是那种「10 个 AI 技巧改变你人生」的流量帖。点进去一看——还真有东西。17 个功能里大概有 5 个我压根不知道存在,还有 3 个我一直在用但用法完全是错的。
最近到了毕业季,好多朋友来找我聊一件事:有什么办法帮他降 AIGC。
同一周,Anthropic联创和DeepMind掌门同时预警!2028年AI递归自我改进概率超60%,2030年AGI或全面降临。100倍于工业革命的冲击波,正全速砸向全人类。