ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
自动驾驶的中美“赛跑”,正被大模型重置
3629点击    2023-11-28 10:27


今年,大型语言模型改变了自动驾驶技术路线的竞争格局。它正在教会规模量产的电动汽车,像个五星司机一样开车。特斯拉正处于有利位置,开始探索自动驾驶的世界模型。明年,如果它最新的FSD(完全自动驾驶)进入中国,将激发中国企业奋力阻击,保持当前似乎想领先美国的竞争格局。


美国的L4路线,过得不太好。今年,通用汽车旗下自动驾驶公司Cruise,在无人驾驶状态下撞上了行人,拖拽数米后才停下。这家明星公司摧毁了对自动驾驶的信任,它想隐瞒自己的算法有问题。它的无人驾驶车辆拥有庞大的远程操控团队。通用汽车每个季度为这一切烧掉6亿美元。自动驾驶的怀疑者马库斯,担心这是整个行业“黑暗真相”。


谷歌Waymo尝试用保险数据,挽回人们对自动驾驶汽车的信心。它的合作方是瑞士再保险公司,掌握着1250亿英里行驶里程的人类数据;Waymo提供了约0.4亿英里的无人驾驶数据。Waymo将人身伤害索赔频率降低了95%,将财产损失索赔频率降低了76%。质疑者认为Waymo的数据仍然太小。人类司机每行驶1亿英里就会发生一起致命交通事故,自动驾驶的明星企业们需要跑得更久更远。


Waymo的方式是继续在多个城市运营自动驾驶车队。它向凤凰城、旧金山、洛杉矶和奥斯汀的公众开放。中国加速更快,自动驾驶领域的融资总额,连续第二年超越美国。年初,北京与加州——中国与美国各自对自动驾驶最热情的地方——各自披露年度路测报告,百度近五年来的累计路测里程,也实现了对Waymo在加州的超越;小马智行也在飞驰。



北京速度仍在延伸。很多大中城市都将成为北京。截至今年三季度,百度的萝卜快跑累计服务订单超过了400万单,去年同期累计140万,按这个速度,明年将超越千万订单。百度的全无人自动驾驶车队,也已驶入北京、武汉、重庆、深圳、上海五城,还将进一步扩容。



在无驾驶员的自动驾驶领域,中国看起来试图领先美国。但变局在于大型语言模型以及生成式人工智能,尤其是今年以来,它迭代了包含机器视觉在内的多模态能力。很多学术机构认为GPT-4V对自动驾驶影响深远。特斯拉与英国初创企业Wayve,各自展示了探索阶段的世界模型(World Model),它们很有可能成为自动驾驶的基础模型(Foundation Model)


这个时代更有利于特斯拉这样的规模量产玩家。特斯拉的Autopilot(自动辅助驾驶功能)系统,此前依赖基于规则的方法。车辆的摄像头识别路况,然后,特斯拉的工程师们,手动编写并更新了数十万行代码,设定了诸如“红灯停、绿灯行”等繁杂的规则。很多人不相信这种方式能真正通往真正的自动驾驶。


今年,马斯克的全自动驾驶技术新版本FSD V12,开始用数十亿帧人类驾驶的视频,来教会自己如何驾驶,就像大型语言模型通过处理数十亿的文本词汇,来训练自己生成答案一样。在某些情况下,这种基于神经网络的方法,要比传统的基于规则的更好。


这是一种端到端(end-to-end)的训练,即“视频进,动作出”,不需要人类明确编写代码或脚本,来告诉它要怎么做。它的瓶颈,很大程度上不再是代码量,而是视频输入量。神经网络在训练了至少一百万个视频后才能见效。马斯克在财报会议上,将通往自动驾驶之路的四大要素,总结为“超大型真实世界数据集、神经网络训练、车辆硬件和车辆软件。”


特斯拉是全球电动汽车销售冠军,今年称考虑将FSD授权给同行;还传出将在中国继续扩建产能,从目前的每年125万辆,提高至175万辆。特斯拉拥有万卡H100集群的庞大算力,超算Dojo也已经投入生产,相当于明年再新增30万片全球稀缺的A100芯片,来对付随之而来的海量数据。



但Dojo架构早在几年前就定下,非常适合特斯拉当时独特的算法。如果拿它来跑大型语言模型,内存带宽恐怕不够友好。换道大模型的特斯拉,需要调整它的算力基础设施,或者突破模型底层技术的束缚。马斯克的应急方案是,赶紧抢购了万卡H100集群的庞大算力。


推理芯片同样如此。特斯拉自研的第二代FSD芯片,今年年初开始上车,单卡算力性能略有提升,但不及当前市场主流自动驾驶芯片英伟达Orin。英伟达会在2025年量产Thor,算力高达2000 TOPS,是Orin的近8倍,第二代FSD的近16倍。也许特斯拉需要在下一个AI Day给予回击。


马斯克渴望让完全体的FSD进入中国,承认“目前确实正在推进中。”特斯拉早已在上海建成用户数据中心,满足国内数据监管要求;今年,特斯拉中国车主的手册新增了FSD介绍。国内媒体爆料,特斯拉正在组建中国的FSD运营团队。


还剩下安全监管,但这道障碍也在有序撤去。11月,工信部等四部门发布了《关于开展智能网联汽车准入和上路通行试点工作的通知》,首次明确了不同情况下的交通事故责任归属,并鼓励汽车生产企业和使用主体组成联合体,在年底前完成试点的集体申报,并在此基础上遴选具备量产条件的智能网联汽车产品,在限定区域内开展上路通行试点。上海经信委“推动特斯拉自动驾驶在沪布局”或在明年成为现实。


中国汽车行业正在从电动化转向智能化,来自外来者的竞争,将加速中国量产车型拥抱大模型。工信部称,当前乘用车市场L2及以上智能驾驶渗透率已经超过了42%,预计2025年达到70%,并普及至10至20万的主流车型上。


很多车企没有错过大模型。除了自动驾驶技术企业外,大模型核心玩家的华为、以及“蔚小理”等一众造车新势力,也在尝试融入Transformer架构。毫末智行还发布了DriveGPT。但它们的规模量产与特斯拉相比,尚处于爬坡阶段。在技术的垂直整合能力方面还有距离。


比亚迪的电动汽车销量,最早将在年底实现对特斯拉的超越。它与特斯拉一样,正在垂直整合整条汽车产业链,但尚欠缺一点软实力。比亚迪也在走基于Transformer的决策规划大模型,今年大概会有6亿公里的数据,标注自动化率超过95%,并在未来保持指数级的数据储备。比亚迪内部架构也发生了调整,近期招聘了超过4000名软件工程师,“采用人海战术,保持颠覆性迭代能力”。



国内的算力也跟得上。英伟达的智能驾驶芯片,占国内前装NOA(自动辅助导航驾驶)市场超50%,并未被“高墙”所限。今年,比亚迪进一步扩大了与英伟达的合作,两家企业的共识是未来的汽车是可编程的。地平线占超30%,年底,它推出了征程6,专为大参数量Transformer设计,算力高达560 TOPS,明年正式交付。比亚迪是首批量产意向合作车企。



华为也拆分旗下智能汽车解决方案业务单元,引入长安汽车合伙。华为已经突破了高算力芯片的封锁。在“躯壳”与“灵魂”的争论中,“造车国家队”进入智能驾驶市场。


大模型将重置中国与美国这场从电动化转向智能化的竞争格局。2024年,在中国500多万公里的道路上,将上演国内智能驾驶车企守住领先身位,比拼大模型应用落地的一幕。但无论如何,安全第一。


主要参考报告

A Survey of Large Language Models for Autonomous Driving

GAIA-1: A Generative World Model for Autonomous Driving

Comparative Safety Performance of Autonomous- and Human Drivers

2022 Disengagement Report from California

北京市自动驾驶车辆道路测试报告(2022年)

关于开展智能网联汽车准入和上路通行试点工作的通知



本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究