元戎启行周光:打造好用、易用的智能驾驶系统
3月28日-30日,以“夯实电动化推进智能化实现高质量发展”为主题的中国电动汽车百人会论坛(2025)在京隆重召开!本届论坛汇聚20+政府有关部门领导、30+院士专家、100+汽车及相关领域的企业代表,共议汽车产业变革新路径。在30日召开的智能汽车论坛上,元戎启行CEO周光发表精彩演讲。以下内容为现场发言实录:
元戎启行CEO 周光
各位领导、各位同仁,大家好!我依稀记得去年在这个舞台第一次讲了端到端,去年端到端还是很新的一个词,去年在GTC也做了分享,后来了解在整个GTC演讲里面观看率前五,非常高的观看率。经过一年的进展,大家都在提端到端,整个技术没有再纠结于无图、端到端。
看元戎的历史,我们从2023年3月份第一次在上海车展前推出无图,当时对行业也是非常震撼的。这次GTC遇到智驾的同行,也是头部新势力目前最好的,当时看了我们发出来以为是假的,以为一定是作弊的,他们做了很长时间,发现这是可以的。我认为在今天这个时代,大家对于AI的理解,也许元戎理解比较深,今天我也会跟大家分享一下我们对这个技术的思考。我觉得整个技术大家挺怕走错技术线路,今天做大模型、VLA不只是一个词,各种各样的名词,每个名词花费很多的人力物力,我们有一个track record。我们元戎启行的技术选择,目前看来基本还是很高概率都是对的。
整个自动驾驶跟着大模型在走,语言系统有三个趋势,首先语言系统在GPT出来之前是一个弱专家系统,以此为代表的Siri、科大讯飞,可能是小学生或者幼儿园水平能对话的东西。GPT出来之后,大家第一次看到一个通才系统,GPT各种刷考试刷高考,大家觉得达到了211、985,今天逐渐达到博士的水平,这是整个智力的提升。接下来大语言的发展是强专家系统,今天AI for Science,在化学、数学层面落地,这是在语言世界发生的弱专家系统。通才系统到强专家系统,在智驾会发生同样类似的情形。
规则制不说了,很多模块一步连一步。端到端1.0是一个网络决定的,网络中有非常复杂的结构,都是在1.0范畴,都是弱专家系统。不管你是基于规则还是端到端1.0,都有大量的定义好的只能用于车的弱专家系统,因为整个智驾进入大模型比较晚,下一步VLA是我们开始,为什么说元戎启行开始做VLA,下一步的AI发展往通才系统走,整个VLA网络架构没有像以前define好的东西,整个复杂度不是在模型里面,而是在看不到的地方。我们在GTC我做了一个talk,我们发布做road brain,所谓的无图也算是通才,哪里都能开,这套系统不仅用于车,用于机器人、有移动能力,这也是通才。要实现下一步的strong specialist,要做到通才。Strong specialist代表什么?代表L5级自动驾驶,全域都能开的,这是一个AI的trend。为什么我们之所以能做对技术的判断,对整个AI最高的发展有认知,下面所有的这些名词我认为都是很容易让人confuse,也希望元戎启行在AI方面的能力,不管跟供应商伙伴还是主机厂一起合作。最近很多人意识到V13为什么会这么强,是一个fundamental的区别,大家期待我们接下来几个月的版本,我们可以做到接近的效果,这是整个技术代的提升。今天中国的智驾普遍还在V12阶段,到V13怎么突破?
我们的VLA架构,输入有摄像头、文本,encorder进去,整个网络是类GPT网络,还有输出,输出意图、轨迹。进入大模型时代的自动驾驶复杂程度不在于这里,在于你的数据training,在于你的training step,在于你的pretrain、posttrain、alignment。统统你都看不见了,为什么说今天像大模型能开源,我认为其实对大家来讲,大家不知道怎么回事,我开源给你,但是你无法去复现。
接下来真正进入大模型时代,现在有一些端到端大模型,也许没有理解什么叫端到端大模型,整个training,会带来产品体验代差级的体验。进入VLA有语言之后,自然就会顺带有思维链,顺带也做多模态的输出,人类偏好的对齐,做到这一步,MPI提升五到十倍是非常容易的,特斯拉已经走在前面,我们可能成为第二个做到非常安全的东西。
技术代差的变化,智驾进入大模型的时代,这是V12和V13的区别,有一些prompt。做这个还是要有很多基本功要做,比如感知部分要做得非常稳定去还原,进入V13架构的know how不在模型本身,而是在背后的这些东西,而且它的数据也是非常有trick的,data set的设计。
今年计划VLA上车,带激光或者不带激光,AI的发展要构建生物的Brain,作为生物来说其实激光不是必需的,也许可能为了最后这0.1个点的提升是有用的。我们在2017年提出前融合,第一波享受了多传感器前融合优势的公司,随着技术的进度,我们发现增加一个传感器,增益非常低,取决于成本,然后我们也会拓展到多芯片平台。搭载了我们智驾系统的车也上市了,开城三个月就全国了,现在累计里程5000万公里,有各种各样的数据集去辅助我们做好这个pre-training,还有整套的数据闭环,获得量产的数据、脱敏的数据去验证。
今年的智驾新的这套AI架构的智驾可以让智驾突破从可用到好用的阶段,智驾有三个:可激活,这个路口过去的成功率可能不是很高;另外一种可用,一会儿一次接管;好用像V13,安全接管是天级的。
去年单款车达到最高月销8000,一度成为6到7座suv最热销的车型,2024年第四季度凭借单款车型实现第三方供应商15%市场份额。元戎启行成功扮演了爆款“智”造机的角色,我们也希望我们自己的V13架构也能够为后面的车打造爆款效果,代差级的体验不会带来同质性的竞争。
今年我们也要加速量产,会有超过10款量产车,也不只是一个车企,我们预计会有超过20万台车搭载智驾系统进入消费者市场,我们也会适配Thor芯片,有更多的富足算力让我们做更多的时序推理。
我们也在积极推进出海,目前在日、韩、欧洲市场进行拓展,在欧洲会进行道路测试,加速整个从中国走向全球的脚步。
下一站上海见!我们现在在做一个冲刺,希望在上海之前有一版可以有点V13感觉的,整个按照大模型来training的话,大版本迭代,希望在上海车展可以给大家提供中国第一个V13架构的车,大家感受可能有些不同。
上海见!
评论