2024年全国两会
确定

网站 > 2024中国电动汽车百人会论坛

腾讯智慧出行钟学丹:在自动驾驶这个领域,数据极大的不足

3月15日至3月17日,中国电动汽车百人会论坛(2024)在北京钓鱼台国宾馆召开。在17日召开的主题为“大算力、大模型、大平台等在汽车行业的创新应用”的汽车新质生产力论坛上,腾讯智慧出行副总裁、腾讯智慧出行负责人钟学丹发表精彩演讲。以下内容为现场发言实录:



各位领导、各位同仁,大家上午好!今天非常高兴能在这里跟大家一起来分享一下我们在AI大模型和新的技术领域的应用场景,以及在这些领域如何和大家一起,或者是和合作伙伴一起共建。

近期在大模型这个领域大家看到有非常多的进展,视觉生成大模型,Sora这样的模型,已经具备事件的感知、观察和交付的能力,距离事件模型更进一步,Claude 3出来,通过官方的评测,在很多指标上已经全面超越了GPT-4的水准。可以说进展的速度超出了我们的想象。腾讯也是在去年推出了自己的全栈、全员自研的通用大语言模型,混元大模型,达到了千亿级的参数,超过2万亿tokens预训练的语料。最近几天大家看到混元有一个新的,通过图去生成视频的新的模型,整个进展非常快。除此之外,混元作为通用基础的大模型,我们也把他应用于汽车行业,基于混元基础的能力面向汽车行业做了专有的汽车行业大模型,我们可以看到,今天行业在数字化上有新的演进,从原来的信息化和数字化是基于IT,基于信息技术的基础,在面向数字化阶段演进,更多的是基于今天在算力,以及模型在这方面的能力进展。

同时,我们看到汽车行业也在积极地拥抱整个大模型的演进,除了大家比较关心和看到的自动驾驶领域的应用以外,我们会看到研产供销服各个领域,都在尝试利用大模型是不是可以更好地帮助我们去提升效率,改善体验,以及如何用这些更好地融入到过程当中去。

在这个结合的过程当中,其实行业面临着比较大的挑战,主要是三个方面,模型的挑战、数据的挑战、算力的挑战。在模型方面我们看到,通用大模型真正应用到汽车这个领域垂直行业时,解决的问题,刚刚我们提到的语音交互一些基础的,但是我们真正解决一些行业领域时,数据的质量,以及训练的成本,周期部署,这些都是当前面临的比较大的挑战。

第二,数据上其实也存在着很大的不足,一方面是像自动驾驶这个领域,数据还是有极大的不足,另一方面,在数据的分类、标注,以及处理方面的技术还遇到很大的挑战,如何完成数据的合规相关的保护和处理。

算力方面,今天整个行业都面临着比较大的挑战,我们现在一方面希望加大训练的投入和效率,另一方面,整体的算力能力还是比较弱。第二,我们要进行更大规模的训练,基础的IT和算力的架构是不是能更好地满足,这也是当前面临着比较大的挑战。

面向这些挑战,腾讯行业向汽车行业提供了完整的能力架构,从AI基座、AI工程平台、AI应用这几个层面上助力行业在这个领域的发展。基座方面,硬件能力上、软件加速,包括刚才提到的面向汽车行业通用大模型能力的建设,同时,除了底层能力以外,今天要想在任何领域应用,AI工具工程平台的应用也是至关重要的,如何把今天很多工具能更好地助力大家高效地发展,包括我们在研发,在数据平台,在底层延伸的云平台的支持上,以及上层如何针对行业的Agent能力的提供,来帮助大家更好地加速,更聚焦于自身应用领域,更上层,技术和实际的应用还是有很大的需要去弥补的gap,这个过程中间,我们如何把具体的应用知识和行业的know how更好地结合起来,真正地应用起来,这是我们致力于去应用的地方。

在基础这一块儿,腾讯把算力作为更核心的能力去构建,这也是腾讯专长的领域。首先,腾讯在分布式云原生上,我们总的调度已经超过了1.5亿核,提供了16EFLOPS智能算力,不仅可以服务于大模型的训练,在智能驾驶的应用场景也可以应用。同时我们开发了新一代的HCC的高性能的计算集群,搭载了最新的GPU,可以支持超过10万卡GPU超大的计算规模,以及国内性能最强的大模型的计算集群。最快4天就可以训练万亿参数大模型的能力。除此之外,在网络带宽和痛心伤,分布式也是很重要的,腾讯自研的星脉网络,为新一代集群带来行业最高超过3.2T的业界最高带宽,保证更好的通信开销和吞吐的能力。同时GPU利用率有极大的提升,我们提升到了超过60%。

刚才提到的工程的领域,一方面我们在一些标准基础的产品,比如说AI原生向量数据库,腾讯推出自己的向量数据库产品,最高可以支持10亿级向量检索规模,以及百万级查询的能力,延迟的控制可以做到毫秒级的水准。基于腾讯行业的模型,可以帮助大家更好地进行精调,在模型的开发者和算法工程师上提供更好的解决方案,在调度能力以及计算的优化上都做了更多的处理。

应用方面,AI的代码助手已经在实际的应用场景应用,帮助他在研发流程中间起到了很好的提效的过程,生产这个领域,我们在智慧工厂,智慧质检已经应用了实际的AI和大模型的能力帮助工厂在质检的效率和质量上有很好的提升,同时在服务上,智能客服的能力通过大模型的方式,对用户的交互和理解上,更自然地理解,更精准地满足用户服务的需求上有了更大的提高。在销售领域,这也是我们当前比较重要的场景,如何帮助销售更高效地售卖车,帮助销售更好地理解客户的需求,做相应的推荐和配置,这些能力都有相应的应用。除此之外,我们把线上线下结合,把这样的技术提供像数字人这种直播带货能力,帮助大家可以更好地做线上拓宽触达用户的流量和空间。

座舱领域,也是大家比较关心的,就是在大模型如何上车的方向,这里面我们强调,一方面大家比较多提到的智能语音的交互,自然的交互度,多模态的交互以外,更多的也会要增强我们在效率提升、娱乐提升方面,如何让真正的服务去触达,而不是通过云交互之后帮他做聊天,我们更多的是做操作,做服务的触达,可以让用户在驾车的过程中间,通过简单的语音和上下文的辅助,可以帮助他更好地完成这样的交互的过程。同时在智能操控领域之外,我们希望他更多的是用户发起,我们结合传感器和座舱的能力,更好地帮助用户主动完成一些面对环境的变化时的操作,我们知道这个地方需要去提升空气悬挂时,不再需要用户发起这样的指令,而是主动完成这样的动作,再通过语音或者是智能座舱互动的方式,让用户感知到,更多的帮用户想到,而不是让他发起这样的操作指令。

在这个领域的应用也是新的开始,大家都面临着很多挑战,特别是大模型的训练并不是每一次都会很好,或者是很成功,这里的成本和代价都非常高,腾讯希望和行业合作伙伴一起在这里共建,帮大家构建自身的迭代能力,我们觉得如果在这样的应用场景,大家首先要考虑,如何在一些非常明确和具体的领域快速地做一些实施,让大家看到效果,有了更好的效果,才能有更好的利用的场景。有了效果,一定要构建我们的平台,应用到各个方面,有了这样的平台,才有可能帮我们在未来发展里边做这样的加速。第三阶段,基于这样的平台,以及跟场景更好地结合过程中间去创造新的应用场景和服务。

这是我想跟大家汇报的内容,在这里也希望跟汽车行业的合作伙伴一起去共建行业的大模型,共同探索新的应用场景,以及新的机遇,谢谢大家!

所转载稿件如有侵权,请与我方联系删除;邮箱:daogecaijing@126.com

评论

暂无评论
已全部加载