2024年全国两会
确定

网站 > 2024中国电动汽车百人会论坛

元戎启行周光:我们公司不是PPT公司,英伟达老黄非常认同我们

3月15日至3月17日,中国电动汽车百人会论坛(2024)在北京钓鱼台国宾馆召开。在17日召开的主题为“大算力、大模型、大平台等在汽车行业的创新应用”的汽车新质生产力论坛上,元戎启行CEO周光发表精彩演讲。以下内容为现场发言实录:



尊敬的各位来宾、专家,大家好,我是元戎启行CEO周光。今天我分享的主题是“端到端智驾模型如何催生新质生产力”,从去年开始,可以看到人工智能进入了2.0时代,我在技术的一线深有感触,在2018年的时候,我们都有机会跟伊利亚、OpenAI这些人一起交流,2018年的时候,伊利亚跟很多人讲,AIGC很快就会来了,在那个时间点上,硅谷人工智能顶尖的人都觉得伊利亚还是有点胡扯的,直到2022年底,ChatGPT出来,人工智能2.0在全球范围内五爆发,这中间是以语言大模型,AIGC,端到端,就是end to end的架构。今天我讲的是端到端,在汽车这个领域跟车企是最为相关的,是指连接物理事件的,在语言大模型可能对于座舱有帮助,端到端就是对于智能驾驶巨大的提升。

今天汽车竞争已经进入了下半场,上半场是电动化,下半场是智能化。过去两年装配NOA的车型越来越多,之前都是一些高速、高快场景,真正对于用户的需求进行了解你会发现,除了用户对于城市,其实每天上下班通勤,可能才是需求的痛点,提供一个城市好用的NOA是非常难的,技术层面是非常难的。我们元戎启行提供非常高质量的城市通行,不仅仅只是无图,轻地图,无地图是去年谈的,做到一个好的轻地图实际上是做到端到端很关键的点,所谓的端到端是指输入是传感器,输出是决策,其实你想象,你用一个结构化的高精度地图,根本无法端到端,因为他根本不是非结构化数据的输入。

这里有一个视频,完整的在GTC播放,这个视频是我们在深圳各种场景的展示,用的是我们的端到端系统,可以看到非常拟人化,非常复杂的场景,整个决策是没有数字感、顿挫感的,很多人做自动驾驶,哪怕今天已经量产的车,明显感觉有数码位,车子在执行加塞和变道的时候,明显的顿挫感,不同系统在切换,开车也只是会考虑到安全、舒适,其实根本不care其他的东西。在我们的系统里面,我们会考虑非常多,我们没有这种所谓的数码味,我们会考虑别人的通行效率,希望大家有机会去试一下元戎的车,你会感觉明显跟现有的智驾不同。

借这个机会说一下,元戎启行是唯一受邀请的人工智能企业出席英伟达GTC的,我会做一个演讲,整个中国的人工智能就我们一家,这是非常难得的,GTC今天是全世界人工智能盛会,中国也没有大模型公司受邀,国内做这些基本基于开源的改一改,其实在GTC没有原创是很难被邀请的,要不然就是你是他的大客户,他请你去做一个演讲。

元戎启行作为汽车产业链一环,我们也在思考元戎启行是什么,我们想要做什么,我们想得非常清楚,我们跟车企一起合作,打造能量产的高性价比的汽车,同时从客户的角度出发,打造客户日常可用的自动驾驶。其中全时全域毫无疑问,这是最基本的,为什么像之前很多自动驾驶,高速的NOA,或者是L4,不能被广泛的使用,就在于他不是一个全时全域的,可能我只在某个区可以用,或者我只在快速路上可以用,全时全域的。

同时,量产必须要做到低成本,能量产,车规级,我们在过去的一年多跟主机厂花了非常多的功夫,我们公司是中国第一个能够把端到端成功上车的人工智能企业,我们公司不是PPT,在去年3月份,我们就发布了清图,而且我们不是用PPT发布,现在非常多的公司发了几个PPT说自己干这个了,我们不是,我们清图去年3月份不少人试过,包括去年英伟达老黄非常认同我们公司。去年4月份我们就告诉了英伟达的高层,元戎启行的下一步是端到端上车,我们在去年8月份的时候整个集成了这个架构。今天的人工智能行业,业界是明显领先于学界的,并不是发了一篇论文就怎么样,其实都已经上车了,特斯拉已经上车跑了,非常的成熟。

这是我们能做好端到端的要素,我们去年3月份就发布了不依赖地图的清图方案,中国第一个,技术布局非常早了,我们早在2020年开始进行清图的布局,完全独立的研发,不是特斯拉开了AI Day之后我们开始搞,不是的,我们是完全独立的研发。去年一年我们完成了行泊一体,舱驾,舱驾可能有点牵强。

端到端的数据闭环是完全不同的,现在大家都提Data等等,基于模块的数据闭环跟端到端的数据闭环有非常大的不同。经常有人说,我的车子跑了多少万公里了,说到这句话非常外行,就是用人工智能1.0的思维来思考2.0的架构,今天整个业界就是闭源的,大家都不会说自己做了什么,只会展现效果,这是前几天出来的,就是VOM+E2E的架构,人工智能2.0的时代,单模块的提升加多块的打通是非常有用的,语言模型接入端到端之后,物理世界产生的影响是非常惊喜的。像我的同龄朋友基本上都是硅谷各个大厂的中坚力量,国内也有一些。

很多人会问,为什么又是元戎启行,我们真不是PPT公司,有的公司出来就搞一个PPT五,我们不是的,为什么我们又搞出来了,最关键的有三点。前两点是工程化能力,你要量产,工程化必须要做好,我们过去一年多走了很多坑,过去我们是L4公司,在2020年决定不搞L4了,这个就是骗人的,搞一个地图,画个图出来跑,这就是扯,没有任何商业模式。另外是人才的积累,我们公司有很好的人才,金牌、状元都有,但是这两点都不是关键原因,大厂一定比我们有更多的钱,更好的工程化,真正的techvision是非常关键的,OpenAI在硅谷把谷歌干得妈都不认识,谷歌缺人吗?缺钱吗?不是,都比Open AI好,没有vision,这个公司根本就不知道做什么。Transformer出来之后,他们没有意识到,伊利亚在Transformer出来第一时刻就意识到了,去打开大语言模型的窗口,Transformer在Long sequence上的这个能力,第一时间就catch到了,很多人没有意识到,CNN、RNN等等这些东西,人家在第一时间就get到了Transformer这个东西,在2018年、2019年就feeling到了Scaling Law,这就是techvision,没有根本就不行的。中国现在做AI的,很多都是抄,出来就抄,哪有原创。techvision是非常关键的,今年搭载我们端到端模型的会有量产车型上市交付。

讲端到端的很多人都没讲明白端到端为什么牛逼,比传统的自动驾驶牛?下一步我会讲进化路径,这一页我会讲为啥,之前都是感知模块,规划模块,预测模块,都是人想的,接口interface都是人想的,为什么要干这个?在30年前的机器人时,没有一个很好的算法可以handle这个事,必须做简化。在机器学习里面有一个叫PCA的,曾经奉为经典,其实根本就是反人工智能2.0的,当时为了简化问题讲这个玩意儿,导致机器人架构,以前有感知、预测、规划、决策,几十个模块,针对这个架构搞了机器人,搞了扫地机器人,搞了L4,限制区域的,看上去还是挺不错的。其实独立分开设计的模块,整个有非常大的弊端,因为其实人做这个主成分分析的时候,就把很多东西过滤掉了,导致今天能处理的场景有限,每个模块都寻求自己的局部最优根本不考虑global的问题,因为模块跟模块之间是不可且导的过程,完全是各搞各的。

人为定义规则有很多问题,谁告诉你感知和规划之间就只应该传点图,根本不是这么玩的。还有就是端到端的部署,算力会增加吗?不是的,其实端到端部署,算力会减少的,根本就不懂。端到端的整个架构,今天还没有stable,不像NLP里面有GPT的架构,我们希望能够适用端到端架构做出来,现在还没有,我们做了一些尝试,包括业界最好的,硅谷的,不要盯着中国,中国没有,我认为在E2E这一块儿,我们就是国内走得最前沿的了。

这是我们的roadmap,这个图我在去年年初的时候就展现了,一开始是大家很熟悉的机器人架构,这个是端到端的好处,你可以认为它可以处理非常多的corner cases。

这是我们公司的路径,2017年的时候,多传感器融合是我第一个提的,到2020年我们开始做清图,第一个作为国内发布的,我们不是抄的,不是靠别人发了PPT,出来说我们有了,不是的,我们有东西的。我们去年8月份就上车了,不是PPT那种玩意儿。我们公司2019年成立的,我们有这些东西。今年搭载这套E2E架构的车型就会正式量产。我们公司的愿景是打造在AGI For Robots,为物理世界打造一套通用的架构,这是我们公司的Vision,一个公司没有Vision也不行,商业化固然重要,没有Vision是不行的,Open AI之所以牛,真的就是他的Vision,他有talent people,他有他的技术的Vision。

我讲完了,谢谢大家!

所转载稿件如有侵权,请与我方联系删除;邮箱:daogecaijing@126.com

评论

暂无评论
已全部加载