• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 高通
  • urope-Asia Automobile Innovation Forum
  • 2025第七届金辑奖评选
  • 各国产业概览
  • 2025第八届智能辅助驾驶大会
  • 2025汽车智能玻璃创新技术及应用大会
当前位置:首页 > 晓莺说 > 晓莺说:供应链同源加速智车与具身智能产业融合(下)
发送
晓莺说:供应链同源加速智车与具身智能产业融合(下)
盖世汽车 周晓莺苑晶铭 2025-06-26 07:00:00

硬件共生进化

在全球科技竞争白热化、产业融合加速的当下,智能科技产业寻求降本增效与技术突破多重新路径几乎成为跨行业共识。

在此趋势下,智能电动汽车(Smart EV)与具身智能机器人作为前沿赛道,看似分属不同领域,实则在技术架构与产业生态等多维度存在深度耦合。盖世汽车研究发现,整体来看,二者在包括芯片、传感器和动力系统的硬件技术方面,在包括自动驾驶算法、智能互联的软件技术方面,和在供应链需求、制造供应链环节的能力都具备复用潜力,不仅能加速各自领域的创新迭代,更将为智能科技产业开辟协同发展的新蓝海。

此外,在市场应用方面,人形机器人还可以提升汽车制造效率,拓展至生活服务等场景,形成“出行+服务”的生态闭环,实现商业模式的多样化探索。

特斯拉开发的人形机器人——擎天柱(Optimus)就是较为典型的例证。特斯拉把汽车的一些技术运用到了人形机器人擎天柱上,例如电池组、冷却系统等,还使用与汽车测试类似的技术来进行擎天柱的运动和对外部碰撞模拟。此外,特斯拉的全自动驾驶系统FSD直接被应用在擎天柱身上,机器人采用了与汽车一样的视觉感知,使用摄像头输入数据,以神经网络进行计算。

去年4月,特斯拉已在工厂部署两个Optimus机器人。特斯拉将在今年开始“限量生产”擎天柱机器人,未来可能会有数千个擎天柱机器人在特斯拉工作。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:特斯拉

·硬件传感器领域

在智能汽车领域,摄像头、雷达等传感器早已成为车辆的“眼睛”和“耳朵”,它们能够实时监测车辆周围环境,为自动驾驶提供关键数据支持。具身智能机器人同样需要对外部环境进行感知,以实现自主行动。智能汽车中广泛应用的多传感器融合技术,如将摄像头的视觉信息与毫米波雷达、激光雷达的距离探测信息相结合,能够精准识别障碍物和目标物体,这种技术完全可以迁移至具身智能机器人。

例如,在复杂的室内外环境中,机器人通过复用此类传感器技术,能够实时感知周围环境的动态变化,实现对障碍物的规避和对目标物体的抓取,从而在物流搬运、家庭服务等场景中发挥重要作用。小米汽车在其人形机器人产品CyberOne的传感器中,搭载了小米自研的Mi-Sense深度视觉模组,可以对人脸、肢体动作等外界环境进行感知,该款机器人计划2025年量产发售。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:小米

·硬件芯片领域

智能汽车的计算芯片在处理能力和功耗管理方面具有显著优势。为了满足自动驾驶对海量数据实时处理的需求,智能汽车芯片不断提升计算能力,同时优化功耗,以保证车辆长时间运行。这些芯片具备强大的并行计算能力,能够快速处理传感器采集的大量数据,并进行复杂的算法运算,为自动驾驶决策提供支持。

在具身智能机器人中,同样面临着数据处理和决策控制的挑战,将智能汽车的计算芯片适配到机器人中,能够为机器人提供强大的运算支持,使其快速处理视觉、触觉等多源信息,做出准确的决策,从而实现更灵活、智能的动作控制。此外,芯片的低功耗特性还能延长机器人的工作时间,降低能源消耗。

小鹏汽车就将车端AI鹰眼视觉系统、自研图灵芯片、端到端大模型以及强化学习算法移植至IRON人形机器人上,当前,IRON已在小鹏广州工厂投入使用,计划2026年实现量产。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:小鹏汽车

·动力系统领域

智能汽车的电池技术和电机驱动技术也为具身智能机器人的动力供应和运动执行带来了新的可能。长续航电池能够为机器人提供更持久的工作时间,使其无需频繁充电,提高工作效率。同时,高效电机驱动技术能够实现机器人更精准的动作控制,使机器人在抓取物体、攀爬等动作中更加灵活、稳定。智能汽车电机的高精度控制算法,经过优化后应用于机器人电机,能够实现对机器人关节的精确控制,提升机器人的运动性能。

比如,广汽人形机器人GoMate,搭载全固态电池,续航达到6小时,并采用轴向磁通电机,最大输出力矩达到1000N·m,该款机器人将会率先进入广汽传祺、埃安等生产线和园区率先示范应用,计划2025年实现自研零部件批量生产,2026年整机小批量生产。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:广汽集团官网

智驾软技跨域赋能

·软件技术复用

在自动驾驶算法方面,智能汽车的自动驾驶算法,如路径规划算法、目标识别与跟踪算法等,经过多年的研发和实践,已经相对成熟。在具身智能机器人的自主导航和操作任务中,这些算法经过优化后能够发挥重要作用。

比如特斯拉的人形机器人产品Optimus Gen2,安装无人驾驶系统FSD,接入和特斯拉汽车同样的神经网络,可以全面识别周边环境,并通过AI算法识别和学习人类动作。Optimus Gen2目前已实现小批量生产,计划2025年生产数千台,2026年目标提升至5-10万台。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:特斯拉

此外,奇瑞汽车Mornine,与AI公司Aimoga共同研发,配备大型语言模型 (LLM),该款机器人将在优先在在汽车销售中心担任服务人员,逐步向家庭服务场景拓展。

·智能互联技术

智能汽车的车联网技术能够实现车辆与云端、其他车辆以及基础设施之间的数据交互和远程控制。这种技术在具身智能机器人中同样具有广阔的应用前景。通过复用车联网技术,机器人可以与云端服务器进行实时数据交互,上传自身的工作状态和环境信息,同时下载最新的任务指令和算法更新。此外,机器人还能与其他设备进行互联互通,实现协同工作。例如,在智慧城市的建设中,多个清洁机器人可以通过智能互联技术进行信息共享和任务分配,提高清洁效率,拓展机器人的应用场景和功能。

供应链的共生密码

·供应链需求的高度复用

在零部件采购方面,智能汽车和具身智能机器人存在着大量的重叠部分。传感器、芯片、电机等零部件是两者不可或缺的关键组件,这使得它们在供应商选择上具有较高的重合度。通过共享零部件供应商,两者可以形成规模效应,降低采购成本。例如,大量采购同类型的传感器和芯片,能够增强企业与供应商的议价能力,获得更优惠的价格。

·智能制造产线及能力复用

智能汽车的整车制造流程和生产线布局在自动化生产、组装工艺等方面具有诸多优势,这些经验可以借鉴到具身智能机器人的制造过程中。智能汽车生产线采用的自动化装配技术,如机器人焊接、自动化喷涂等,能够提高生产效率和产品质量的一致性。在具身智能机器人的制造中,引入类似的自动化生产设备和工艺,可以减少人工操作的误差,提高机器人的生产效率,降低生产成本。

同时,智能汽车制造过程中成熟的质量控制体系和供应链管理模式,也能够为具身智能机器人的制造提供有益的参考,帮助企业建立完善的质量管理和供应链协同机制,确保机器人产品的质量和交付周期。

破界全场景生态

在人工智能技术飞速发展的当下,具身智能作为融合机器人实体与智能算法的前沿领域,正以前所未有的态势重塑人类生产生活格局。从工业车间的精密装配,到家庭空间的智能服务;从物流仓库的高效搬运,到医疗养老的贴心守护,具身智能凭借其独特的物理交互能力,在多领域开辟出全新应用场景,开启了智能生态网络构建的新纪元。

在人形机器人众多应用场景中,工业制造场景率先落地,具身智能机器人正成为提升生产效率与质量的关键力量。

优必选推出的工业人形机器人Walker S系列,凭借高度灵活的机械臂与精准的动作控制能力,成功进驻比亚迪、吉利汽车、富士康等许多大型车厂进行实训。目前,优必选已与东风柳汽、吉利汽车、一汽红旗等多家知名汽车企业建立了合作关系,并在富士康、顺丰等领军企业的支持下,成功构建了多场景的人形机器人应用生态。值得一提的是,优必选是全球唯一一家能与多家车企宣布合作的人形机器人公司,其Walker S系列机器人也因此在全球车厂实训中脱颖而出。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:优必选

另外,在工业领域,宇树科技机器人也已经在工厂巡检、物流搬运等场景中得到应用,帮助企业提高生产效率,降低人力成本;在教育领域,宇树科技的机器人凭借其高性价比和开放的SDK,吸引了众多教育机构和学校的关注,成为培养学生科技兴趣和创新能力的重要工具。

宇树科技机器人的跨场景服务也正在说明,具身智能产业链下游应用场景的拓展,正呈现出从工业制造的刚性需求向服务业柔性创新延伸的显著趋势。

在工业制造领域,具身智能机器人的应用最初是为了满足企业对生产效率提升、人力成本降低等刚性需求,解决重复性、高强度的体力劳动与高精度操作难题。随着技术的不断成熟与发展,具身智能逐渐将应用范围拓展至多元化服务业领域。

比如,追觅科技推出X50 Ultra扫地机;九号公司推出Navimow X3割草机器人;新加坡企业Primech AI推出Hytron卫生间清洁机器人;美国企业OpenDroids 推出R2D3家庭助理机器人;银河通用推出的商业服务Galbot机器人;法国企业Capsix Robotics推出IYU按摩机器人。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:追觅科技官网

值得注意的是,尽管具身智能应用前景广阔,但因场景及技术成熟度不同,其商业化落地进程存在显著差异。

在工业制造领域,由于生产流程相对标准化,对机器人的功能需求明确,且企业具备较强的资金与技术实力,能够承担具身智能机器人的研发、采购与部署成本,因此商业化落地速度相对较快,部分头部企业已实现规模化应用。

然而,在家庭服务、医疗养老等场景,商业化落地面临诸多挑战。家庭服务场景需求分散且个性化强,用户对机器人的功能、价格、外观等方面要求多样,同时家庭环境复杂多变,对机器人的环境感知、自主决策能力提出了更高要求,目前技术尚未完全成熟,导致产品难以满足用户多样化需求,市场推广难度较大。

尤其在医疗养老领域,涉及严格的法规监管、专业的医疗知识与伦理问题,对具身智能机器人的安全性、可靠性、精准性要求极高,技术研发与验证周期长,使得商业化落地进程相对缓慢。

换言之,具身智能正以多元化的应用场景为基石,构建起庞大的智能生态网络,从工业制造的刚性需求到服务业的柔性创新,其发展趋势不可阻挡。尽管商业化落地受场景与技术因素制约存在差异,但随着技术的持续突破与应用模式的不断创新,具身智能必将在更多领域实现深度渗透,为人类社会带来更高效、便捷、智能的生活与生产方式。

产业融合抢滩战

在科技飞速发展的当下,智能汽车与具身智能产业的融合已成为行业发展的重要趋势。这种融合不仅源于技术层面的共通性,更受到企业战略需求和商业前景的驱动,正从企业布局和技术创新两个维度,重塑着未来出行与智能机器人领域的格局。

企业层面:战略布局抢占融合高地

在智能汽车与具身智能产业融合的赛道上,车企正以积极的姿态加速布局。为了在这场竞争中占得先机,众多车企纷纷成立专门的研发团队,将具身智能技术的研究与产品开发提上日程。

其中,特斯拉持续加大AI人才投入。在2025年第一季度全员大会上,马斯克宣布将于年内完成首批5000台Optimus人形机器人的生产目标。这一战略部署伴随着大规模人才储备计划,特斯拉官方招聘页面显示,Optimus项目团队正在美国四大生产基地展开人才招募,涉及机械设计、软件开发、系统集成、生产制造等关键领域的80个新增岗位。岗位分布数据显示,研发类职位占比达65%,制造工程类占30%,验证测试类占5%,形成金字塔型人才结构。

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:特斯拉招聘网站

公开信息显示,小鹏汽车从2020年起开始布局人形机器人产业。其研发团队已深耕该领域5年,并于2024年11月推出首款AI人形机器人IRON。基于L3级自动驾驶技术积累,小鹏汽车计划2026年量产面向工业场景的L3级人形机器人,实现手、脚、眼、脑全向协同能力。

何小鹏表示:“小鹏汽车已在人形机器人产业深耕5年,未来可能还要做20年,再花500亿,甚至投入上千亿。”

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:小鹏汽车微博

此外,经济观察报援引业内消息称,国内某头部新能源车企已启动人形机器人项目,内部代号为“尧舜禹”;蔚来汽车也已组建约20人的团队,专注于机器狗项目的调研。理想汽车创始人李想表示,公司100%将涉足人形机器人领域。

不只是车企,多家辅助驾驶厂商也在积极布局具身智能业务。

2024年1月,芯片公司地平线宣布将分拆AIoT团队,成立全资控股子公司——地瓜机器人。2024年9月,地瓜机器人推出面向“机器人+”时代的软硬件产品全家桶,包括专为新一代通用机器人而生的旭日5智能计算芯片、易用全能开发首选RDK X5机器人开发者套件、具身智能全场景算力核心RDK S100等。

另外,速腾聚创将自己定位为智能机器人增量零部件及解决方案供应商,立足整机开发通用的机器人移动及操作解决方案,并推出适用于各类场景的智能机器人增量零部件。面向智能机器人市场,速腾聚创推出全球首款机器人全固态数字化激光雷达E1R和192线半球形数字化激光雷达Airy。

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:速腾聚创官网

VLA破界融合

技术层面:端到端技术引领融合趋势

在技术层面,智能汽车与具身智能的融合也取得了显著进展。

盖世汽车研究院报告显示,多数企业正加速自动驾驶端到端技术的量产上车。无论是自动驾驶还是机器人领域,使用的模型从技术类别上,由小模型→大模型→端到端大模型发展。这种演变不仅提升了模型的处理能力和智能水平,还实现了从感知到决策的一体化,大大提高了系统的响应速度和准确性。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:盖世汽车研究院报告

VLA(Vision-Language-Action)模型被认为可能是“端到端+VLM”技术框架的终局形态。VLA是融合了视觉、语言和动作的多模态大模型范式,VLA模型通过结合视觉和语言处理,可以解释复杂的指令并在物理世界中执行动作,可进行视觉理解与空间推理、综合感知与预测。 比如谷歌DeepMind推出的RT-2,由MIT等机构的研究人员开发的开源视觉-语言-动作(Vision-Language-Action, VLA)模型Open VLA等等。

在智能汽车领域,VLA模型可以帮助车辆更好地理解复杂的交通场景,做出更合理的驾驶决策;在具身智能机器人领域,它则能让机器人更准确地理解人类指令,并完成相应任务。这种技术上的共通性,为智能汽车与具身智能产业的深度融合奠定了坚实基础。

理想VLA(Vision-Language-Action Model,视觉语言行动模型)是理想研发的司机AI大模型。

2024年10月,理想汽车推送的端到端+VLM功能,真正意义上实现了One Model一体化端到端模型的大规模实践应用,并首次将大模型部署至车端量产芯片。这一突破性进展不仅体现了理想在AI算法上的深厚积累,更展示了其在车规级硬件与大模型融合方面的独特优势。

2025年3月,理想汽车正式发布下一代自动驾驶架构VLA。也就是说,理想汽车的智能驾驶技术经历了从规则算法、到无图NOA、再到端到端+VLM,最终迈向VLA司机大模型的“三段”进化。

李想认为,人工智能走向生产力的关键在于Agent能力的释放,即AI不再只是辅助人类思考和判断,而是能够独立完成专业工作,承担“替代性”的角色。理想汽车当前的VLA战略,正是对这一目标的路径设计。VLA是李想眼中“类人智能”的起点,在他看来,VLA能够解决全自动驾驶,将成为现阶段能力最强的架构,甚至有机会超越人类开车的能力。

当前,智能汽车与具身智能产业的融合已进入快速发展阶段,企业的积极布局和技术的持续创新,正推动着这一融合向更深层次、更广领域拓展。未来,随着技术的不断成熟和应用场景的进一步丰富,智能汽车与具身智能产业的融合必将带来更多惊喜,重塑人们的出行方式和生活体验。

四大趋势领航

在人工智能的浪潮中,具身智能正以惊人的速度重塑人机交互的边界。具身智能的每一次进步都引发行业对其未来的深度思考,结合当前技术演进与产业动态,盖世汽车研究院认为,四大趋势正成为具身智能迈向新阶段的关键路标。

一、世界模型:具身智能的认知革命

世界模型(World Model)的崛起,标志着具身智能从“感知 - 执行”的简单模式向“理解 - 预测”的高阶形态跨越。传统机器人依赖预设程序或即时传感器数据完成任务,而引入世界模型的具身智能体,能够基于过往经验构建虚拟环境,通过模拟推演制定最优行动策略。

随着谷歌Deepmind - Genie 2、英伟达Cosmos等模型发布,大模型开始展现出对世界常识的潜在理解能力。

其中,谷歌Deepmind - Genie能够通过单张图片或文字描述生成720p清晰度的交互式3D场景,并支持长达一分钟的沉浸式探索,生成可交互、可玩的3D环境,可用于具身智能体训练。

英伟达Cosmos通过多模态生成与物理规律建模、高保真仿真环境构建、高效合成数据生成与训练优化、多版本适配与低延迟响应,解决了真实数据稀缺与训练成本高昂的行业痛点。该模型通过模拟真实交通场景(如多智能体协作、极端天气应对),优化自动驾驶系统的路径规划和动态决策能力,并支持复杂环境导航,结合物理规律模拟提升动作协调性,实现机器人智能升级。

二、数据采集:从单一到多元的范式转换

数据作为具身智能的“燃料”,其采集方式正经历前所未有的变革。传统依赖真实场景采集数据的模式,逐渐向人工示教(遥操、动捕)、仿真合成数据、自主探索等多元化数据采集方式演进。其中,真实世界人工采集、虚拟环境仿真与合成都是当前主流的数据采集方式。

比如,上海人工智能实验室在研究工作EmbodiedScan中提出更大、更真实的数据集、更多样的场景和更详尽的标注可以显著提升具身智能的3D感知能力;北京大学构建了涵盖132万条的灵巧机械手抓取数据集DexGraspNet,在规模、稳定性和多样性上明显优于现有数据集,已有算法训练后能提升抓取成功率,最高可达10%;谷歌联合全球机构汇集了22种不同机器人类型的数据,构建了最全面的具身智能数据集Open X-Embodiment,并用于训练通用具身智能大模型RTX,RTX可以在无需任何训练数据或极少训练的情况下,泛化到特定任务上。

三、合成数据:破解高质量数据的供给困局

尽管数据采集方式日益多元,但高质量数据的稀缺性仍是行业发展的瓶颈。据业内预测,到2026年大模型将消耗尽所有高质量数据,低质量数据将在2030~2050年消耗殆尽。

盖世汽车研究院认为,合成数据通过算法或模型生成人工数据,模拟真实数据的统计特性和分布规律,将成为具身智能训练的重要数据来源。

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:盖世汽车研究院报告

现如今,以英伟达为代表的科技企业加快合成数据技术的迭代与应用,为具身智能带来了丰富、可控且经济的训练与学习材料。据了解,英伟达与德克萨斯大学奥斯汀分校于2023年联合提出了MimicGen合成数据生成系统,通过对人类演示进行处理,自动生成不同场景下的大规模合成数据集,用于机器人的模仿学习。在Square等18个任务中,只用175个人类示例就生成超过5万个训练数据集,并在Square任务中将成功率从人类示例数据集的11.3%提升至90.7%。

在2025年CES,英伟达推出构建三种类型机器人的平台,旨在推动人工智能和机器人领域的革新。这三类机器人分别是:

知识型机器人(Knowledge Robots):也被称为代理型人工智能(Agentic AI),主要用于知识处理和数字化任务。例如,可作为虚拟助手处理复杂信息,为用户提供智能化服务。

通才型机器人(Generalist Robots):即人形机器人(Humanoid Robots),设计用于多功能场景下的任务执行,模仿人类的行为和交互方式,适应家庭、服务和制造业等多元场景。

运输型机器人(Transportation Robots):即自动驾驶汽车,通过结合AI模型和物理AI技术,能够自主完成运输任务,推动物流、出行和交通领域的智能化发展。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:英伟达

四、具身智能将在2030年迎来规模化拐点

具身智能的商业化进程正遵循“技术突破 - 成本下降 - 规模扩张” 的经典路径。 

晓莺说:供应链同源加速智车与具身智能产业融合(下)

图源:盖世汽车研究院报告

当前,具身智能产业成本问题限制了其大规模应用,以人形机器人为例。

人形机器人的成本因多种因素存在较大差异,目前市场上大部分人形机器人的成本在数十万元左右 。盖世汽车研究院认为,随着Tesla、宇树等企业公布人形机器人量产计划,叠加DeepSeek技术突破,将推动行业进入“硬件规模化+软件开源化”双轮驱动阶段。随着技术的进步、供应链的成熟以及量产规模的扩大,人形机器人的成本正在逐渐下降,比如宇树科技的第二代人形机器人 G1 起售价为 9.9 万元,众擎机器人的人形机器人 PM01 售价为 8.8 万元。 随着价格持续下探,具身智能产业的大规模应用指日可待。

具身智能的未来,既是技术创新的前沿战场,也是产业变革的战略高地。世界模型的认知突破、多元化的数据采集、合成数据的技术赋能,以及即将到来的规模化拐点,共同勾勒出一幅人机协同的新图景。随着这些趋势的加速演进,具身智能有望从实验室走向日常生活,成为重塑人类生产生活方式的核心力量。

精彩推荐