王田苗:具身智能驱动产业进化新范式 | 百人会论坛(2025)
2025-05-06





3月28日,中国电动汽车百人会聚合智能产业论坛在北京召开。北京航空航天大学机器人研究所名誉所长、中关村智友研究院院长王田苗出席论坛并在主题演讲中指出,具身智能技术体系尚待成型,但随着大模型发展,机器人应用场景有望不断拓展。具身智能未来将分阶段发展,不同阶段有不同应用重点。中国推动具身智能产业发展兼具市场与国家逻辑,形成了“双因子模型”。若具身智能发展出特定菱形结构,有望借鉴汽车产业模式实现爆发增长,充分发挥中国制造业优势,创造新的发展奇迹。





图片


在过去这十年间,我始终坚信,自移动互联网之后,科技领域将迎来又一波巨大浪潮。基于这一判断,我们的想法首先获得了中关村管委会的高度认可,顺势成立了具身智能生态孵化平台——中关村智友研究院。该研究院主要聚焦于多个重要领域开展工作,包括深入的行业研究、精心举办成长营,以及积极推动各类行业交流合作等。与此同时,我们也获得了北京市科创母基金、中关村科学城,以及众多社会资本的支持。在此基础上,专门设立了专注于硬科技早期投资的雅瑞资本。通过上述布局,我们构建了一套独特的发展模式——从孵化到投资的双轮驱动模式。


我有幸参与了双轮驱动的创新探索。在这一过程中,我们以人工智能和机器人为主线展开工作,以优秀的创变者,包括“小天才”和“高管创业者”作为我们服务的核心,在智能制造、智能服务、医疗科技三个领域进行战略布局,成功孵化并投资了一系列优秀企业,其中包括九号、埃夫特、天智航、智行者、银河通用、深之蓝、中发天信、清程极智等。


今天,我特别希望能与大家一同探讨一个话题,那就是具身智能在聚合智能产业中所处的位置。围绕这个主题,我主要想从两个方面展开交流:


第一点,我想探讨的是具身智能在未来产业中的形态问题。不妨以汽车为例,汽车发展至今,已经形成了相对统一的技术体系。然而,机器人领域的发展情况却有所不同。机器人技术历经70年的发展,虽然早已构建起了诸如感知、决策、控制等方面的理论体系,但技术体系却始终未能成型。如今,人工智能技术蓬勃发展。我们不禁思考,从手机到汽车,再到具身智能,在人工智能这一强大驱动力的影响下,具身智能是否会迎来爆发式增长?同时,具身智能能否借鉴汽车已有的体系结构,并在此基础上进一步发展完善?倘若能够实现,具身智能将有望更好地服务于各个领域,实现全方位的成长与突破。


在这样的时代背景之下,我们有必要回顾机器人这70 年的发展历程。这段历程清晰地向我们传达了两件关键的事情:


其一,机器人的发展始终与社会产业结构的演变紧密相连。回溯过往,早期汽车铸造以及建筑行业的蓬勃发展,对重型工业机器人产生了强烈的需求,从而有力地推动了这类机器人的诞生与发展。随着产业结构的逐步升级,电子产业兴起,Scara 机器人应运而生,以满足电子产业特定的生产需求。此后,进入后工业时代,食品工业的发展催生了食品工业机器人。再后来,随着产业发展对软件层面提出新要求,即在保证人机交互安全的前提下实现软件的互用性,协作机器人便顺应这一需求登上了历史舞台。可以说,整个发展脉络一目了然,充分表明机器人最终能否成功进入实际应用领域,与产业需求息息相关。


其二,在机器人发展过程中,人们一直思考能否突破仅基于仿生方式的创新探索路径。毕竟,在很长一段时间里,人们普遍认为机器人产业规模相对较小。早期,像索尼推出的机器“狗”,以及 ASIMO 这类人形机器人,便是探索的尝试。它们不断推陈出新,每次展示都带来新的技能,包括学会弹琴、能够进入地下更换管道,学会与人握手、献花等。然而,尽管这些机器人不断取得新进展,但始终未能跨越关键的拐点,实现大规模的商业化应用。


在2021年与2022年期间,大模型横空出世。它具备强大的能力,能够高度“模拟”人类大脑的运作方式,不仅可以将复杂的任务进行精准分解,还能指挥机器人去执行相应指令。更为关键的是,如果对其进行反复训练,实现免编程操作的占比有望达到百分之六七十。这一重大突破,有力地推动了机器人领域向前迈进。


在此背景下,人们对于机器人发展的想象如井喷般涌现。从早期主要聚焦于封闭场景、埋头苦干,逐步进入到半开放场景阶段,通过局部的感知技术,如视觉、力觉、触觉等实现对机器人的控制。到了2022年,人们的目光开始投向更为广阔的领域,期望让机器人适用于通用场景,实现泛化全自主运行。


在这一探索过程中,人形机器人成为备受瞩目的焦点,被许多人定义为机器人的一种全新品类。然而,围绕人形机器人这一概念,业界一直存在诸多争论。争论的核心主要集中在两个方面:其一,人形机器人究竟算不算得上是一个新品类;其二,它能否取代过去常见的臂式、轮式、四足式以及其他形态的机器人。特别是当我们将时间跨度拉长至未来十年,关于人形机器人在整个具身智能机器人领域中所占的比例,更是众说纷纭,莫衷一是。不过,无论争论结果如何,当机器人技术在泛化和迁移能力上取得进展,当机器人的“大脑”、“小脑”以及核心部件、芯片等方面带来革命性变化时,人们普遍认为,AI 机器人向消费、工业、特种等多个领域进军是不可阻挡的必然趋势。我们将这种发展态势称之为机器人的“进化”。


这个想象打开以后,人们普遍认为,机器人的第二条发展曲线以软件进化与硬件进化为代表,将于2025年实现更广泛的应用。我们都知道,简单的应用从固定轮式机器人开始,始终维持在百亿规模,包括相关企业的市值。随后应用场景向商业服务领域延伸,催生出千亿级市场价值,如果进入到家庭服务或将开启万亿级消费市场。在探索这一技术演进的时间维度时,需要将未来10至20年的发展历程进行阶段性划分。若分阶段来看,我们必须深入思考,从基础创新到关键技术研发,再到实际应用阶段,各个阶段的关键要素分别是什么。在多学科交叉融合中,材料学、数学以及生物学,长期以来都被视作支撑所有机器人技术的最为基础的学科,其次是软件、系统、工程以及人文领域,这些学科交叉形成了很多的论文、专利以及创新公司。在这方面,我学习了李泽湘教授关于新工科的很多思考,印象很深,也就是说在产教融合这个环节,如果缺乏明确的指导,尤其是针对工科院校,将会出现几种现象:


现象一:超过90%专利是无用的。虽然目前专利数量看似比麻省理工学院(MIT)、斯坦福大学或者加州大学伯克利分校都要高。


现象二:超过90% 的工科教师既没有创业经历,也未曾深入企业一线。仔细思量,在这种情况下,他们又如何能有效指导工科教育呢?


现象三:超过90% 的人对创业缺乏清晰认知。无论是“小天才”还是科学家,既不了解创业的具体路径,也不清楚创业的目标受众是谁,仿佛只是凭借“满腔热血”就投身创业。实际上,创业是“技术 + 工程 + 商务”的有机结合,而工程、商务与技术的结合点,应当以客户需求和市场导向为核心。


由此可见,在具身智能领域,从算法、数据合成、芯片和机电模组,到评测,最后到应用、展示和示范,这一系列流程构成了一个闭环。只有在这样的闭环体系下,才有可能衍生出具身智能极具价值与意义的成果。


接下来,让我们将时间的指针拨向未来十年。基于我个人深入学习后的理解,同时也得益于中关村智友研究院和雅瑞资本在智力层面给予的大力支持,我们做出了如下判断:


在2024年至2025年期间,DeepSeek在具身智能领域取得了重大突破,极大地推动了该领域的发展进程。其中,2025年至2026年将成为Agent应用的关键时期。这里所说的 Agent,也就是我们常提及的数字代理,主要涵盖两类产品:一类是智能家居产品,例如智能马桶、智能电视以及智能床等;另一类则是可穿戴式设备,像智能眼镜、智能手表、智能手环以及耳机等。


此后,我们预计具身智能将逐步渗透至商业和工业场景。这背后的原因在于,具身智能的爆发式增长高度依赖于软件大模型。回顾大模型的发展历程,在2017年至2019年期间,大模型主要致力于训练自身成为“文科生”,即具备回答各类问题、进行语言交流的能力;到了2022年至2024年,大模型开始向“理科生”转变,着重学习计算、分析以及推理等技能。然而,具身智能需要与物理世界进行交互,这就要求大模型接下来要努力成为“工科生”。作为“工科生”,不仅要掌握丰富的知识,更要具备实际操作能力,不仅要能够自如运动,还需学会与人协作。


基于上述分析,我们认为在2027年至2028年这个时间节点,具身端侧应用必将崭露头角。而到了2030年至2035年,我们预计人形机器人、飞行汽车以及养老相关领域,有望成为引领行业发展的重要力量。


在这样的进化趋势划分体系下,按照我们的逻辑来分析,以终端设备为例,小终端主要涵盖智能家居产品以及可穿戴式设备。而大终端则包含各种各样的设备。在大小终端之间,出现了一个关键的角色——智能体(Agent)。


这个智能体(Agent)承载着“工科知识”。我们之前提到,文科知识侧重于人文层面的回答,理科知识聚焦于公式的计算,而工科知识的落实实际上要在智能体这个层级来完成。它需要从多个维度进行考量和处理,比如工艺方面,涉及到精细的工艺操作、精准的焊接技术,还有我们所说的快慢系统等。然而在当前,人们对于这一过程的理解相对单一,很多人简单地想象可以直接从大模型过渡到终端,这是不可行的。


但在现实中,由于个人的隐私在这次智能迭代中并未得到足够重视,也就是我们当下只能寄希望政府能够保护我们的隐私,然而企业的隐私呢?比如,企业的服务对象、产品尺寸、生产工艺,以及各个环节产生的各类数据等,企业是不愿意被开源的,而DeepSeek在这一问题上发挥了积极作用,在充分保障企业隐私的基础上,推动企业积极开展相关应用,有力地促进了具身智能的发展。


基于上述情况,我们来理解AI机器人的三层范式重构。目前英伟达、伯克利、特斯拉,以及其他高校、创业机构等都在持续进行技术迭代,有的采用端到端、有的则是端到云。我们认为,对于直接面向消费者(To C)的技术而言,端到端模式是可行的。然而,若是面向企业(To B)的工业类技术,在端与云之间则需要设置一个边侧环节。这里所说的边侧,包含工厂或操作空间的推理工艺以及专业数据,这些内容具有属地化特征。在时间延迟控制方面,我们对不同环节有着明确要求。对于快系统的运动神经,我们认为其延迟应严格控制在3毫秒以内;边侧环节的延迟大概控制在200-500毫秒;而云端的延迟大约在1秒。这便是我们所构建的体系架构。当具身智能真正要实现体系性的突破性发展时,任务交互与理解的“思维链”、空间智能与推理的“路径链”以及安全稳定灵巧运动的“动作链”之间,需要形成一套有机协同的体系。一旦这一体系得以构建完善,将极大地推动具身智能在各个行业的广泛应用。


回顾汽车的发展历史,我们不难发现,早期汽车的轮数并不统一,有六轮的,也有三轮的。然而,经过近百年的不断迭代与演进,汽车最终确定了标准形态——四轮。如今,市面上95%以上的汽车都是四轮配置。


那么,机器人的发展是否也会遵循类似的轨迹呢?当下,有一批怀揣梦想与坚定信念的人,将全部精力投入到人形机器人的研究与攻关之中。这是因为一旦人形机器人实现通用化,整个供应链都将面临全面洗牌。毕竟人形机器人的形态相对统一,不过,在这一领域,相关争论从未停止。


作为一名学者,我认为在大模型人机交互层面实现通用化是可行的。其次,在工厂和商业环境中能够高效作业的,将是若干垂类模型。此外,端侧通用芯片也至关重要。随着技术的不断进步,端侧通用芯片能够以每年降低至十分之一的速度,有效削减感知和推理成本,从而推动机器人技术在各个领域的广泛应用。


在此,我想阐述一下关于具身智能的一个定义或我个人的判断。具身智能本体具有多样化的特征,也就是说,人形机器人难以实现对整个具身智能领域的统一。我们可以看到,在众多工厂环境中,机器人的形态丰富多样,轮式、足式、臂式、复合型、仿生型等各种形态层出不穷。这一现象背后的依据是未来劳动力市场的“721黄金法则”。我坚信,在未来,70% 的任务借助高效、封闭的自动化装备与 AI 技术便可完成,无需额外支付安全成本、效率成本以及经济成本。


在这样的产业发展背景下,当我们审视未来聚合产业相互交错的局面时,会发现产业形态虽然呈现多元化,但其中标准化的核心部件,如端侧芯片、若干垂类小模型以及大模型,是能够实现统一的。一旦这些关键部分达成统一,我认为这将有助于我们深入借鉴汽车产业链的整体发展历程,从中汲取经验,推动具身智能产业迈向新的发展阶段。


在目前的国际大环境下,中国能赢下这场科技竞争与产业竞争吗?我想回答今天的第二个问题,中国过去都是以技术跟随为主,通过技术研究论文、关键技术示范,由科学家将成果转移至产业端,或者是上市公司与名校进行项目合作,然后推动技术转化。还有一部分就如同李泽湘教授与我们团队开展的一级市场工作,以及随后在二级市场进行的并购、收购等环节。


在2025年初,中国科技的蓬勃崛起对世界科技发展方向产生了深远影响。在这一背景下,一个清晰的逻辑浮现出来:中国在推动具身智能产业发展进程中,所涉及的不仅仅是单纯的市场逻辑,还包含着至关重要的国家逻辑。实际上,这两种逻辑相辅相成,缺一不可。而要推动这一逻辑实现可持续发展,生态、人才与需求是三个关键要素。从国家逻辑层面来看,国家积极鼓励创业,为科研成果转化提供政策支持,并且允许给予耐心资本更多的让利优惠,甚至推行拨转股等举措。这些政策措施充分彰显了国家逻辑在具身智能产业发展中的有力支撑作用。人才,作为推动产业发展的核心力量,源自完善的教育体系。优秀的人才不仅要有雄心壮志,怀揣改变世界的理想抱负,还应具备敏锐的商业思维和强大的团队协作精神。除此之外,需求同样是推动具身智能发展不可或缺的因素。


基于上述种种情况,我们认为中国形成了“双因子模型”。该模型融合了中美市场逻辑与国家逻辑,加上新型研发机构、孵化器推动技术成果与企业间的直接合作转化和创业转化,这些探索极大地促进了行业的繁荣与创新。在此,我想特别强调的是,生态环境与发展土壤对于个人成长、企业形态塑造,以及创新项目的发展前景都起着决定性作用。


在人才这一关键问题上,我们的分析也非常有趣。就科学家群体而言,当下许多科学家在创业,不少国家重点实验室也在国家政策推动下开展创业活动,但是我得到的结果是,科学家无论是院士还是杰出青年,只要不是全职,不All in创业,即便拥有再多资源实际上也只是在做孵化器。这种项目需要从创业体系中剥离出来看待,因为它的底座不是企业属性,更多是在推动科研成果转化。那么,如果进入一级市场创业呢?我们认为“小天才”适合做0-1,尤其适合投身消费类领域创业,因为他们凭借自身独特的感知和敏锐的市场洞察力,能够在新兴的消费市场中捕捉到机会;而大厂高管由于具备全球视野,且是复合型人才,更适合引领创业项目从1发展到10。


在此,我们又不得不提及需求这一关键要素,它涵盖了人性的需求、企业的需求以及国家的需求。当前,中国拥有良好的生态、丰富的人才储备,特别是工程师创新所带来的红利以及市场产业蓬勃发展释放的的红利。未来十年,中国极有可能诞生出世界型的领先公司。以机器人专业为例,目前开设机器人本科专业的高校已接近400 所,而与之紧密相连的供应链体系,更是在产业发展过程中不断完善、日益强大。


整体总结来看,一是目前具身智能的技术体系、应用体系均在分散发展,但是在迭代过程中若出现了菱形结构——上层是模型,中间是芯片与多元垂直模型,下层是核心部件,那么我认为,该体系有望借鉴汽车产业的聚合发展模式,进而实现爆发性增长;二是我们坚信,具身智能遵循软硬结合的发展逻辑,并且能充分发挥中国先进制造页再升级的有利优势,有望在该领域创造下一个奇迹,就如同在手机、汽车、高铁以及工程机械等领域所取得的成就一样。

Copyright © 2020 Chinaev100 All Rights Reserved

中国电动汽车百人会 版权所有 ICP备案号:京ICP备19027029号-1