▶ 本报记者 孙立彬
近日,深圳留形科技有限公司(以下简称“留形科技”)宣布完成金额为数千万元的Pre-A轮融资,投资方包括弘毅投资等著名投资机构。此前,该企业曾获得真格基金种子轮投资,以及君盛投资的天使轮投资。
据了解,留形科技成立于2022年,该企业研发的智能三维感知和重建算法可以赋予机器人等具身智能设备空间感知、智能记忆及主动交互能力。这成为空间感知领域企业的最新举措。
机器人三维空间感知的重要性
空间感知,是机器人在非结构化环境中实现自主决策的关键能力,决定了机器人除“只会看”外,是否还能“看得懂、记得住、认得清”。具体地说,人形机器人若要模仿人在空间执行任务,就必须感知、理解和记忆真实世界中的复杂环境,而空间感知能力解决的是“认知”和“执行”的连接问题。
留形科技首席技术官(CTO)徐威表示,很多机器人能做动作但做不到“自主判断”。例如,机器人取外卖需要识别门的位置、判断电梯在哪里、是否有人、如何走最短的路,下了楼还能识别出哪个柜子是“目标”,这些都需要实时构建空间模型并作出判断。如果没有空间感知,机器人就只能“看得见但看不懂,走得动但走不对”。
赛迪智库产业政策研究所助理研究员李陈表示,传统机器人依赖预设地图或固定路径,难以应对突发状况。而三维感知技术通过实时生成厘米级精度的三维点云地图,结合IMU(惯性测量单元)实现时空同步,使得机器人能够动态识别障碍物、狭窄通道和可通行区域。此外,传统机器人依赖“传感器+控制器”的分离式架构,而三维感知技术通过多传感器深度融合和边缘计算能力实现了“感知-计算-执行”的一体化。综合地看,通过将环境信息转化为可计算的结构化数据,空间感知技术不仅赋予机器人物理世界的“认知地图”,更是通过多模态数据融合构建起深度理解能力,从而使人形机器人从“程序化执行”迈向“类人交互”。
“通过精准感知和识别所处环境的三维结构、动态变化及物体状态,机器人能够在坡面、不平整地面、楼梯等复杂地形中实现稳定自主运动与路径规划,同时准确识别任务对象的位置与形态变化,助力完成抓取、搬运等操作任务。这一能力不仅提升了机器人在复杂环境中的导航稳定性与交互准确性,还显著降低了其对陌生环境的适应难度和重复学习成本,为实现智能泛化提供了坚实支撑。”IDC中国研究经理李君兰说。
这一能力的获得将给机器人行业带来巨大改变。
徐威表示,从行业角度看,空间感知是实现“机器人从实验室走向真实场景”的关键一步,尤其是在建筑测绘、工业巡检、机器人导航与数字孪生等领域。如果机器人不具备一定的空间感知和记忆能力,就只能依赖提前设定的路径规划或人为控制,无法适应动态、真实的场景。
李君兰认为,当前,人工智能(AI)大模型正加速推动机器人迈向具身智能,但机器人在智能泛化方面亟待突破。作为“感知—学习—决策—执行”闭环中的核心环节,空间感知技术正在成为实现环境理解、任务泛化与人机协同的关键突破口。该技术能为机器人赋能路径规划、目标识别等核心能力,推动其从结构化环境走向复杂、多变的开放场景,并进一步加快具身智能的演进与应用落地。
三维空间感知能力如何实现
此前,机器人空间感知能力主要依赖导航定位、视觉与激光雷达等方案,有着明显的不足:GPS信号无法在室内环境中稳定接收;UWB(超宽带)、蓝牙等室内定位技术需提前布设基础设施,部署过程复杂且成本高昂;视觉与激光雷达方案泛化性弱,难以应对多变复杂环境,导致机器人在导航过程中频繁出现感知误差、定位失准甚至作业停滞。
智能三维感知和重建则通过激光雷达、深度相机、IMU等多传感器融合的方式,赋予机器人实时构建环境三维模型、精准定位及动态避障的能力。
徐威介绍说,这项技术的难点主要在于多传感器融合。如果把机器人比作人类,大脑能自然整合来自眼睛、耳朵和身体的各种感知信息,但机器人却要靠摄像头、深度传感器、IMU等“器官”,再通过算法统一到“脑中地图”里。这些传感器采样频率不同、数据维度也不一样,想让机器人“看得懂、走得对”,就必须解决时间同步、空间配准、数据融合和实时建图等一整套复杂问题。
李陈表示,该技术的难点在于多模态数据的融合问题,需解决传感器时空同步、异构数据对齐及决策冲突问题。不同传感器的数据存在时空错位与噪声干扰,相机、IMU、激光雷达等多传感器数据因采样频率差异会导致融合失真。同时,复杂场景泛化不足,当前大部分训练数据集中于工厂等标准化场景,而家庭、灾害现场等非结构化环境任务成功率较低,动态光照、强磁干扰等仍挑战3D重建准确性。
除了技术难题,该项技术还面临其他挑战:成本控制(如高性能传感器高成本)、材料与供应链不稳定、缺乏统一标准、用户隐私顾虑以及生态配套不完善等难题。
李陈表示,与国际领先技术相比,我国在中低端市场已实现国产化替代,且在结构光、双目视觉等特定领域技术领先,本土企业已在工业检测、支付系统等场景实现规模化应用,但基础算法创新与高端传感器、感光芯片等硬件研发仍需突破。高精度三维重建需强大算力支持,人形机器人、自动驾驶等领域所使用的高端ToF传感器单价超千元,制约消费级应用。