▶ 本报记者 罗晓燕
在6月12日举行的2026北京智源大会大模型产业论坛上,与会嘉宾围绕“跨越技术成熟曲线:如何定义大模型时代的长期价值”议题展开圆桌讨论,多位专家一致认为,大模型及具身智能的演进远未触及“天花板”,中国有望在具身智能赛道率先迎来“AlphaGo时刻”。
规模化法则远未失效
“大模型整体性能迭代还未到达‘瓶颈’,评测榜单并不完全可信。”北京智源研究院院长王仲远坦言,当前各类大模型评测榜单让人“眼花缭乱”,很多结果无法完全验证,但敢于展示真机、敢于现场演示、敢于进入实际场景的公司,才是真正有底气。
针对市场上“开源与闭源模型差距仅3-6个月”“AI(人工智能)大模型终将沦为卖水卖电”等观点,与会嘉宾均表示不认同。
北京面壁智能科技有限责任公司首席执行官李大海以美国人工智能公司Anthropic为例,指出大模型必须是“T形人才”——大模型不能只有“通用”这一横线,更需在特定能力上形成纵向长板。“Anthropic正是凭借独步天下的编程能力获得高估值和商业成功。”他表示,大模型必须与场景深度协同,做极致优化。
王仲远进一步指出,Scaling Law(规模化法则)的曲线仍在延续,甚至呈现指数倾向。去年关于Scaling Law失效的讨论,源于大语言模型所用互联网数据“用完了”,但通过后训练、推理优化、Agent(智能体)递归式自我进化等新路径,AI系统能力仍在持续提升。他说,北京智源研究院在多模态领域的探索也证明了这一点:其多模态模型“悟界Emu3”仅用了不到1%的数据、百亿参数,就已展现出明显的性能提升。下一步,北京智源研究院将向世界模型方向探索,寻找物理世界的Scaling(规模化)范式。
世界模型不是具身智能的前提
针对业内关于“世界模型是否必须先做到完美全场景仿真,才能发展出具身智能”的争论,北京银河通用机器人股份有限公司创始人兼首席技术官王鹤给出了明确的否定答案。“人类也没办法精准模拟、预判世间万物的物理变化,可人们依然能自如地与万事万物互动。完美仿真并非打造具身智能的必要前提。”
据王鹤介绍,银河通用于2025年3月发表全球首篇WAM(World Action Model,世界动作模型)论文,该范式不需要动作标签,可以通过人类视频学习行为的大致动态,从而极大拓展数据来源。
“具身智能正迎来非常光明的Scaling up(模型扩容)时间点。”王鹤认为,未来两年具身智能将全面到达GPT-3.5向ChatGPT转变的关键的预练里程碑。但这需要千万小时高质量数据和百亿以上投入的“入场券”。
当被追问“这是否意味着外界说的世界模型都不靠谱”时,王鹤回应称,WAM本身属于世界模型范畴,但当前不少世界模型核心能力是作为仿真器训练机器人完成强化学习任务。“人们确实在利用世界模型搭建可交互的可微分物理仿真器,但先让世界模型做到完美仿真再训练具身智能,这条路很难走通。”
在端侧模型方面,李大海透露,端侧模型已从去年的1B(10亿参数)规模升级到4B(40亿参数)规模,明年大概率达到几十B。“具身智能的‘大脑’本质上也是端侧模型,端侧设备资源受限,但模型能力还有极大挖掘空间,真正的‘瓶颈’在于硬件物理条件。”
具身智能或是中国AI的“AlphaGo时刻”
关于中国与欧美AI发展路径的差异,与会嘉宾一致认为具身智能是中国AI有望领先的领域。
王仲远表示,中国的供应链、制造业和场景优势巨大,叠加本土市场容量,足以孵化和催化技术落地。“具身智能、世界模型很有可能成为中国具有独特性甚至领先的领域。”
“我坚信具身智能是中国的机会,具身智能的AlphaGo和ChatGPT时刻会在中国实现。”王鹤认为,如果具身智能“从0-1”在中国完成,那么“从1-100”必定在中国成熟。
李大海将根本优势归结为人才。“中国拥有最聪明的青年才俊,且数量全球最多,这是中国具身智能有望领先的最底层最重要的因素。”他说。
在AI安全与责任划分上,李大海直言,人类社会一直遵循“吃一堑、长一智”的信条。“AI时代,人们发现和修补安全漏洞的效率大幅提升,代价有望降低,但安全风险往往从意想不到的维度浮现,用教训推动规则完善,这是需要正视的现实。”
王鹤补充说,在工业场景中,具身智能机器人首先要做到和人类一样出色地完成工作,并能够承担相应责任,更长远的人机权责划分将在行业探索中逐步建立。

