A14

“软硬协同”成为AI产业破局关键

2025年07月28日 

  ▶   孙庆阳

  “软硬协同”不再是技术名词,而是人工智能(AI)从实验室走向生产力的必答题。在2025年人工智能软硬件协同创新高级别研讨会上,多位与会专家直指问题核心:AI的下一站,拼的不是单一硬件的算力,而是软硬件协同的系统战斗力。

  从“单点突破”

  到“全栈联动”

  “单靠芯片应用提升无法满足大模型需求,而极致的软硬件协同优化是支撑大模型快速迭代的关键。”中国信息通信研究院院长余晓晖的这句话,道破了当前技术发展的核心问题。

  过去,人工智能产业的进步常依赖“单点突破”,要么是芯片算力的提升,要么是算法模型的优化。而如今,当马斯克的Grok4训练计算量接近10的27次方Flops,当千亿参数模型需要“万卡集群”支撑,单一环节的精进已如“独轮车爬坡”。中国信息通信研究院副院长魏亮在报告中点明:“算力算法、芯片、框架等单一环节的改进已不能满足大模型训练需求,而需要软硬件并行研发、协同设计。”

  这种协同体现在两个维度:纵向要实现“芯片—框架—模型”的深度适配,让模型在硬件上“跑起来”;横向要突破集群扩展的瓶颈,让模型能“长大变强”。上海AILab系统平台中心王辉对此深有体会,他指出,国内软硬件生态存在“倒三角”困境——一个模型要适配多种国产芯片,而每种芯片又有独立的软件适配体系,导致30-50人的算子团队常年围着不同企业“打转”。为此,他们研发的DeepLink2.0体系通过标准化算子和跨域通信协议,实现了5种芯片在万卡级别下24天持续训练,即便每天遇到卡故障和网络抖动也能稳定运行。这正是“全栈联动”的生动实践,正如魏亮所言:“横向扩展能力越强,模型训练的高度就越高。”

  协同机制

  突围“算力孤岛”

  国内人工智能产业有个“烦恼”:40多种芯片、40多个基础软件栈,彼此架构不同、指令集各异,形成了无数“算力孤岛”。魏亮形象地将其比喻为“MXN重复适配”——一个模型要适配N种芯片,N种芯片又要适配M种框架,复杂度远超国外“英伟达+CUDA+PyTorch”的单一体系。

  破解这一困局,需要“生态共建”智慧。魏亮提出“三层路径”颇具启发意义:通过开源算子库补全功能短板,用中间件屏蔽硬件差异,靠国产框架推动原生开发。中国移动研究院的“芯合”软件栈就是典型案例,它像“翻译器”一样,让基于CUDA开发的应用能一键迁移到华为、寒武纪等国产芯片上,部分算子效率甚至提升40%。

  更关键的是“协同机制”的建立。此次发布的“人工智能软硬件测试验证中心联合实验室方阵”,正是生态共建的缩影:中兴通讯与该中心共建“智算系统创新互联实验室”,专攻网络互联技术;中国电信研究院与该中心联合成立“智算适配优化测试验证实验室”,建立国产化产品评测机制。

  从实验室数据

  到系统战斗力

  “矿山场景里,服务器的可靠性直接决定工人对大模型的接受度。”煤炭科学研究总院矿山人工智能研究院大模型所副所长骆意的这句话,道出了行业落地的核心诉求:软硬协同不能只停留在实验室,必须解决实际问题。

  在矿山井下,多模态数据的实时处理依赖“端—边—云”协同的硬件架构,确保设备故障预警不延迟。可见,人工智能的价值,最终要靠软硬件协同在行业场景中落地才能释放。

  从技术协同的必然,到生态共建的必要,再到行业落地的必需,“软硬协同”已成为人工智能产业高质量发展的主线。正如北京经济技术开发区管委会主任王磊在会议致辞中强调的那样:“推动国内软硬件的协同发展,构建自主创新的产业生态。”当更多芯片厂商开放接口,更多软件框架兼容适配,更多行业场景深度参与,中国人工智能产业必将在软硬件协同中,走出一条破局之路。

本期报纸需要付费才能阅读,请您去网站购买