本报讯 (记者 张伟) 11月20日,2025智源具身智能开放日活动在北京举办,40余家科研机构与企业代表,围绕具身模型研发进展、硬件迭代与产业落地等话题展开深入交流,共同探讨行业发展趋势与技术路径。
与会嘉宾认为,近年来,具身智能发展迅速,现已进入“深水区”,行业亟需开放、协同、标准化的生态环境加速技术演进与落地。
北京智源研究院院长王仲远表示,当前人工智能正处在一个新的“拐点”,推动机器人技术从1.0专用机器人时代迈向2.0通用具身智能时代。他说,当下的具身大模型依然面临“不好用、不通用、不易用”的核心痛点。
他介绍说,为此,北京智源研究院已构建出以具身大脑为核心、自底向上全栈具身智能技术体系,包括能够跨异构本体数据采集以及标准化一站式平台,具身大小脑以及视觉—语言—动作(VLA)等具身基座模型,还有具身智能评测等,为具身技术生态提供一套可复现、可对齐的公共基础设施,降低从研究到产业化落地的门槛。
在此次活动中,该研究院系统地公布了其在具身智能领域的最新科研布局及进展。比如,推出原生全双工语音模型RoboBrain-Audio;开放“面向异构本体、规范操作流程、提高研发效率”的具身数据软件框架CoRobot;开源高质量双臂机器人真机数据集RoboCOIN。
王仲远表示,在具身智能的科研布局上,该研究院希望构建面向通用机器人(可跨本体、高泛化性)具身大模型系统,以开源开放夯实具身智能公共底座。目前,该研究院在具身领域的合作伙伴已超过30家,希望能够与行业里更多从事具身智能机器人和具身智能模型以及具身智能场景落地企业机构及其专家学者进行合作,共同推进整个具身智能行业健康快速发展。
在开放日活动中,与会嘉宾探讨了VLA、分层式大模型、世界模型等不同技术路线的优劣。他们认为,短期内,将任务规划、感知与控制解耦的“分层系统”在工程落地和稳定性上更具优势;中长期看,行业需要向“可迁移、可复用”的通用基座模型演进。
针对“硬件是否仍在拖累模型”的问题,与会者认为,二者已进入“共同定义”的新阶段。优秀的具身系统需要在模型层面做好规划,也需要在硬件层面通过力控等技术保障执行的可靠性。对于备受关注的人形机器人形态,嘉宾们高度务实地认为,其是当前供应链和应用场景下的主流探索方向,但任务需求和成本结构将最终决定商业化形态。
来自能源、制造等领域的场景方代表明确了具身智能落地应用的核心指标:系统的鲁棒性、部署与维护成本、清晰的安全边界,以及与现有IT/OT系统的集成效率。现场达成的一个共识是,具身智能的商业化应从“可度量的单点任务”切入,以确保投资回报率(ROI)的闭环,避免因追求场景广度而牺牲落地深度。
北京智源研究院相关负责人表示,未来将持续迭代并同步公布在开源项目、数据集与评测平台上的进展,同时与产业伙伴推进联合试点,加速具身智能从实验室走向生产线。作为长期主义的开源践行者,该研究院将以可复现、可对齐、可验证的公共基础设施服务社区,与生态伙伴共建共享,让具身智能的技术红利转化为面向产业与社会的普惠价值。

