一、产业界定

具身智能是指智能体(如机器人、无人机、智能汽车等)通过物理实体与环境实时交互,实现感知、认知、决策和行动一体化。通俗来说,就是将人工智能算法与机器人实体深度融合,从而使智能体拥有“大脑”和“身体”,具备一定的物理交互和逻辑推理能力,更好地服务我们生产生活的各种场景。具身智能具备四大模块:

感知模块:具身智能的“信息采集和处理器”,建立对外部环境的感知和理解,为可靠的决策和成功完成行动提供支持。感知模块主要任务包括对象识别、位置定位、场景理解、环境重建和状态监测等。

决策模块:具身智能的“指挥中心”,接收环境感知信息后,完成高级任务规划和推理分析,并生成逐步决策指令来控制行动。决策模块的主要任务包括任务规划和推理分析等。

执行模块:具身智能的“执行单元”,负责接收决策模块指令,并执行具体动作。行动模块的主要任务包括导航、物体操作和物体交互。

反馈模块:反馈模块是具身智能的“调节器”,通过多层交互不断接收来自环境的反馈经验并进行调整和优化,以提高对环境的适应性和智能化水平。

二、产业发展

2.1 市场规模

近年来,得益于人工智能大模型的出现与不断迭代,具身智能取得了飞速进步,成为新一波人工智能浪潮的重点方向。根据中商产业研究院数据显示,2024年中国具身智能行业市场规模为8634亿元,其增长率达到15.32%,预测2025年将升至9731亿元。在人工智能技术的浪潮下,中国具身智能应用市场正迎来快速发展的黄金时期。

2.2 产业周期

具身智能产业的发展经历了概念萌芽阶段(1950-1980年)、理论发展与早期探索阶段(1981-2000年)、跨学科融合和技术突破阶段(2001-2010年)、深度学习推动与快速发展阶段(2011-2020年)、产业应用拓展与持续发展阶段(2021年至今)。通过技术迭代与场景扩展的双向驱动,具身智能已逐步构建起从理论探索到规模化落地的完整链条,为未来实现通用化、高适应性的人机协作奠定了坚实基础。

目前,具身智能产业正处于产业应用拓展与持续发展阶段(2021年至今)。技术核心聚焦于多模态感知-决策协同(如视觉-语言-动作融合)、边缘计算驱动的实时响应优化以及仿生关节与柔性硬件设计,不断推动智能体在工业协作、家庭服务等场景的规模化落地。现阶段仍需突破硬件可靠性、复杂长尾场景的泛化能力,并建立伦理与安全规范框架以平衡自主决策边界。

三、产业链分析

3.1 产业链图谱

从产业链构成环节来看,具身智能产业链上游为软硬件供应,主要包括传感器、芯片、减速器、伺服驱动、电池系统等核心元器件及算法等;中游为具身智能产品制造,主要包括人形机器人、非人形机器人等系统集成及服务与运维支撑、云平台与数据等服务支持;下游为应用场景,包括家庭服务、医疗保健、教育培训、智慧政务、智慧养老等(如图3所示)。

根据艾思产研平台数据统计,截至2025年4月,中国具身智能产业现约有38万家企业(未统计港澳台地区)。其中,广东约6.5万家、江苏约4.8万家、浙江约3.3万家、上海约2.3万家、山东约2.3万家,这些省份的企业数量位列全国前五。

3.2 上市企业

表1列举了具身智能领域具有代表性的上市公司,这些企业大多分布在广东、江苏等经济发达的沿海地区,涉及AI模型矩阵、3D视觉技术、力觉传感器、伺服系统、谐波减速器、微型传动系统等关键技术领域,且多数拥有国家高新技术企业、瞪羚企业和专精特新等资质。

表1 具身智能产业链上游环节相关上市公司