王田苗：人形机器人目前在消费领域效能没想象中好，70%的工作不一定要用“人形|财圈社

王田苗：人形机器人目前在消费领域效能没想象中好，70%的工作不一定要用“人形

更新于 2025-03-30 22:33

1854896

3月28日-30日，以“夯实电动化推进智能化实现高质量发展”为主题的中国电动汽车百人会论坛（2025）在京隆重召开！本届论坛汇聚20+政府有关部门领导、30+院士专家、100+汽车及相关领域的企业代表，共议汽车产业变革新路径。在30日召开的聚合型论坛上，北京航空航天大学机器人研究所名誉所长、中关村智友研究院院长王田苗发表精彩演讲。以下内容为现场发言实录：

北京航空航天大学机器人研究所名誉所长、中关村智友研究院院长王田苗

很高兴应组委会邀请，我把最近这一个多月关于具身智能作为推动聚合智能产业进化的新范式的思考跟大家分享一下，过来也是想向靳司长、程老师，特别是泽湘老师学习和交流。

这十年我自己一直认为科技的创新从移动互联网以后将是另外一个很大的浪，所以为此首先得到了中关村管委会的认可，我们成立了具身智能一个生态孵化平台——中关村智友研究院，主要是从事一些行业研究、举办成长营，还有一些行业交流合作等。与此同时，也得到了北京市科创母基金、中关村科学城，以及一些投资机构的支持，就是专门做硬科技早期的投资，名字叫雅瑞资本。所以，从孵化到投资我们采用的是双轮驱动模式。

我有幸参与了双轮驱动的创新探索，我们以人工智能和机器人为主线，以优秀的创变者，包括“小天才”和“高管创业者”作为我们服务的核心，在智能制造、智能服务、医疗科技三个领域做了一些布局，孵化、投资了九号、埃夫特、天智航、智行者、银河通用、深之蓝，还有中发天信、清程极智等企业。

我今天想跟大家分享具身智能作为聚合智能产业中的一员，它在里面的位置是怎样的。我主要谈两点：

第一点想说具身智能在未来产业里形态是什么？会不会像汽车一样，有相对统一的技术体系，因为机器人已发展了70年，理论体系早都有了，感知、决策、控制，可是技术体系一直没有形成，所以我们认为从手机到汽车再到具身智能，会不会由于人工智能的出现让具身智能有爆发性成长，并且能够借鉴和发展汽车的体系结构，让它有更好的成长，服务于各个方面。

所以在这样的一个背景下，我们不能不回顾这70年机器人发展的历程，这个历程告诉我们两件事：第一，机器人的发展始终和社会产业结构发展紧密相关，比如说早先的汽车铸造，建筑行业，推动了重型工业机器人。随后进入到电子产业，Scara机器人就出现了，随后又出现了我们所说的后工业时代的食品工业机器人，随后又出现了在软件层面能不能互用，且同时能够保证人机交互安全的需求，协作机器人就出现了，其实这条路是非常清晰的。这条路告诉我们一个机器人最后进入我们所说的应用，与产业需求紧密相关。第二条线，人们认为机器人的产业太小了，能不能突破仅以仿生的方式创新探索，所以最早就是像索尼的“狗”、ASIMO的人形，一直往前推，推一次展示一下，推一次学会弹琴，推一次学会到地下去换管道，推一次学会跟人握手、献花，但是一直没有被推到大范围应用的拐点。

就在2021年和2022年，大模型来了，它“模拟”人类的大脑，能够把任务分解，能够让机器人执行，如果通过反复的训练，免编程占比百分之六七十是可能的，所以这个事情就推动了机器人发展。

在这样的背景下，人们就井喷式地想象。我们都知道早先封闭的场景，我们是埋头苦干地，进入到半开放的场景，通过局部的感知、视觉、力觉、触觉进行控制。2022年人们就开始想把机器人适用于通用的场景，泛化全自主。首先是人形机器人，大家把它定义成机器人的另外一种新品类，当然在这个问题上一直有争论，争论主要是来自于人形是不是新品类？它能否替代过去臂、轮、四足以及其他的形态，这个是有争论的，特别是时间周期把它拉到未来十年，人形在整个具身智能机器人的比例是多少？有各种各样的说法，但是不管怎么说，当有泛化和迁移，当大脑、小脑以及核心部件、芯片带来革命性变化的时候，人们认为AI机器人to消费、to工业、to特种是必然的趋势，我们认为叫进化。

这个想象打开了以后，人们就认为机器人的第二条曲线以软件进化和硬件进化为代表，将在2025年实现更广泛的应用。我们都知道简单的应用从固定轮式开始，始终就在百亿规模，包括我们相关企业的市值。随后进入到商业，我们知道基本上就是千亿市值，如果进入到家庭呢？这就是万亿市值。所以在这个背景下，人们就来探索它的时间点。我们把10年、20年将会发生的事情，能不能分成不同的阶段看待？如果分阶段来看，我们不能不去考虑从基础创新到关键技术研发、到应用，它的关键要素分别是什么？在多学科交叉中，材料、数学和生物，一直被认为是所有机器人技术最底座的学科，其次就是软件、系统、工程和人文，这些学科的交叉形成了很多的论文、专利，甚至也有很多创新公司。但是在这方面我学习了泽湘老师关于新工科很多的思考，其实印象很深的，也就是说在产教融合这个环节，如果不去有明确的指导，特别是针对工科院校，我们会出现一个现象：

现象1：90%多的专利是没有用的。不要看现在的专利比MIT或者是斯坦福、伯克利高。

现象2：90%多的工科教师没有体验过创业，没有到过企业。你仔细想，他怎么去指导工科教育？

现象3：90%的创业者，无论是“小天才”，还是科学家，不知道怎么创业，也不知道为谁创业，好像只是为自己的“满腔热血”而创业。其实创业是“技术+工程+商务”的总和，其中工程、商务和技术的结合点，是以客户和市场为导向的。

所以由此我们能知道，在具身智能里面从算法、数据合成、芯片和机电模组，到评测，最后到应用、展示和示范，这个事情是一个闭环。在这样的闭环下，可能才派生出具身智能很有意义的东西。

我们把时间再划，向未来划成十年。我自己学习后的理解，也得到了中关村智友研究院和雅瑞资本的智力支持。我们判断2024年、2025年DeepSeek其实把具身智能大大地推前了一步，其中第一个，2025年、2026年将是Agent应用的时间，就是我们所说的数字代理，数字代理有两类，一类是智能家居，一类是可穿戴式产品，比如眼镜、手表、手环以及还有耳机等等。智能家居的马桶、电视以及床等等。随后，我们判断“具身智能”就会进入到商业和工业场景，为什么呢？是因为具身智能爆发性成长是依赖于软件大模型的，大模型在2017年、2019年的时候训练自己成为“文科生”，文科生就是问问题、语言回答，2022年到2023年、到2024年是训练自己成为“理科生”，理科生就是学计算、学分析、学推理，可是具身智能和物理世界交互的，接下来大模型想要训练自己成为“工科生”，但工科生不仅要有知识，还要有操作，不仅会运动，而且要和人协作。所以由此我想说的，2027年、2028年这个点一定会出现具身端侧应用，随后2030年和2035年我们认为人形（机器人），包括飞行汽车，包括养老，可能才会引领。

在这样的进化趋势划分下，按我们的逻辑，比如说小终端，它就是智能家居和可穿戴式的产品。大终端有各种各样的设备，中间就出现了一个智能体（Agent），这个智能体就是“工科知识”，我们刚刚说的文科知识是人文的回答，理科知识是公式的计算，工科知识实际上在智能体这个层级解决，需要从加工工艺、焊接以及我们所说的快慢系统等多维角度解决。在这个问题上，人们现在理解相对单一，想象着直接由大模型到终端，这是不可行的。

可现实由于个人的隐私在这次智能迭代中根本没有人在意，也就是我们只能寄希望于相信政府会保护我们的隐私，可是企业的隐私呢？企业的服务对象、企业的产品尺寸、企业的生产工艺、企业在各个环节上的各种数据，它是不愿意的被开源的，而DeepSeek在这个问题上让企业大踏步地在保护企业隐私的基础上进行应用，推动了具身智能的发展。

由此，我们理解AI机器人的三层范式重构，这个重构目前在英伟达、伯克利、特斯拉，包括还有其他的高校、创业机构等都在迭代，有的是端到端、有的是端到云，但我们觉得直接To C的技术可以端到端，但是如果你是To B的工业类的技术，中间就需要有一个边侧，其实这个边侧就是工厂或操作空间的推理工艺和专业数据，而这个是属地化的。快系统的运动神经我们认为它的时延要控制在3毫秒以内，而边侧大概在200-500毫秒，云端大概在1秒，就是云端。所以这就是我们的体系，由这个体系我们认为具身智能真要形成体系突破性发展的时候，任务交互与理解的“思维链”、空间智能与推理的“路径脸”和安全稳定灵巧运动的“动作链”之间，就要形成体系，这个形成体系了以后，我们认为将会大大推动具身智能在各个行业的应用。

汽车，如果看汽车的历史，我们都知道有六轮的，也有三轮的，但是汽车通过近百年的迭代，最后确定了标准的形态是四轮，也就是95%以上的汽车都是四轮的。机器人会吗？一批有梦想、有信念的人就把自己的追求和自己的攻关全部放在了人形机器人，因为我们知道人形机器人一旦通用，要对供应链全部洗牌，因为它的形态相对统一，但是这个方面一直有争论。

我作为一个学者，我认为通用的是在大模型人机交互层面。第二个，到工厂和商业环境能作业的是若干垂类模型。其次就是端侧的通用芯片，因为端侧的通用芯片可以把感知和推理的成本以每年1/10的速度降下来。

这里面就有一个定义或者是我自己的判断，对于具身智能本体是多样化的，也就是说人形统一不了，由此我们就说，在很多的工厂，轮式、足式、臂式、复合型、仿生型和各种各样的形态是五花八门的，这个基点就是在未来劳动力市场的“721黄金法则”，我自己是坚定的认为，未来70%的任务是通过高效、封闭的自动化装备+AI技术就能解决的，不需要支付额外的成本，安全成本、效率成本、经济成本。在这样的一个背景下，将来聚合产业的交错，我们突然感觉这个是多元的，但是标准化的核心部件，端侧芯片、若干垂类小模型和大模型是可以统一的，这个事情一旦统一了，我自己觉得反而就可以让我们更多地去学习汽车产业链整个的发展进程。

在这样的国际大环境下，这场科技的竞争和产业的竞争中国能赢吗？我想回答今天的第二个问题，中国过去都是follow，从底层的逻辑我们都是技术研究论文、关键技术示范，然后科学家将自己的成果卖给企业，或者是上市公司给名校项目，然后把可以成果传化出来。还有一部分就像泽湘老师和我们一直做的一级市场，随后二级市场并购、收购这几个环节。

可是在2025年初，中国科技的崛起影响了世界科技的方向和股价的波动，这就出现了一个逻辑，就是中国在推动具身智能产业发展的时候，它不仅仅是一个市场逻辑，还有一个国家逻辑。其实这两个逻辑缺一不可，推动这个逻辑的可持续发展就是生态、人才和需求。国家让你创业、国家允许你转化、国家允许给耐心资本更多的让利，能够实行拨转股……这些都是国家逻辑所赋予的。人才是教育体系派生出来的，人才需要雄心壮志，需要改变世界，需要有商业思维、需要有团队精神。此外，推动具身智能发展还有需求。

所以基于这个，我们认为中国出现了“双因子模型”，也就是中美市场逻辑和国家逻辑，加上新型研发机构、孵化器推动技术成果和企业的直接合作转化和创业转化，这些探索推动了行业繁荣创新。我只是想强调，生态和土壤真的能决定一个人的成长，也决定企业的形态，也决定创新项目能跑多远。

关于人才，这个问题上我们的分析也非常有趣，我先说科学家，我们知道很多科学家在创业，我们也知道很多国家重点实验室也在国家的推动下创业，但是我得到的结果是，科学家无论是院士还是杰青，只要不全职，不All in创业，拥有再多的资源都是在做孵化器，这个孵化器要剥离出来，因为它的底座不是企业，这种平台类机构可以成果转化。但是，如果走到一级市场创业呢？我们认为“小天才”适合做0-1，适合做消费类的，因为他自身的感觉；大厂高管有全球思维，还是复合型人才，适合做1-10的创业。

这个地方又提到需求，人性的需求、企业的需求、国家的需求。由于有生态、人才，特别是工程师创新的红利，还有市场产业的红利，未来十年，中国真的有望诞生出世界型的领先公司。光是有机器人本科专业的高校，现在都接近400所院校，供应链更不用说。

想法总结：

第一，具身智能的技术体系、应用体系都在分散发展，但是在迭代的过程中如果出现了菱形结构，上面是模型、中间是芯片、多元垂直模型、下面是核心部件的话，我个人觉得这个体系有望学习汽车产业聚合而推动爆发性成长。

第二，我们相信具身智能是一个软硬结合的逻辑，并且能充分发挥中国先进制造再升级的有利优势，所以中国依然会创造下一个奇迹，像手机一样，像汽车一样、像高铁一样、像工程机械一样。

谢谢！