2022年02月14日
第A3版:聚焦冬奥会

“冬奥手语播报数字人”值岗

  ▶本报记者  张伟

  2022年北京冬奥会已正式开启,这不仅是一场全世界奥运健儿的顶级竞技,也是一场科技赋能的“智慧”盛会。为使更多人群感受到北京冬奥会的魅力,2月5日起,在北京卫视《北京您早》节目中,冬奥手语播报数字人全新“上岗”,为听障人群带来亲切自然的冬奥手语播报服务。

  “‘冬奥手语播报数字人’由北京市科委、中关村管委会支持,智谱AI、凌云光和北京广播电视台联合打造,清华大学贾珈教授团队、中科院计算所陈益强研究员团队参与了关键技术的研究和开发,还得到了北京市残疾人联合会和市残联聋人协会的支持。”2月9日,在由北京市委宣传部、北京市科委、中关村管委会等单位组织的“科技冬奥企业行”大型主题系列采访活动中,智谱AI合伙人及高级副总裁左家平向记者介绍说。

  让科技更有温度

  根据全国第二次残疾人抽样调查数据,中国有超过2700万名残疾性听力障碍人士。北京冬奥会是中国历史上首次举办冬季奥运会,听障人群也期待着深入了解比赛资讯,全面感受冬奥盛会。如何解决电视节目不能完全覆盖听障人群以及手语翻译人员不足的问题?

  据悉,《国家通用手语常用词表》和《国家通用盲文方案》于2018年作为语言文字规范正式发布。为了推广和普及国家通用手语,“冬奥手语播报数字人”系统完成了《国家通用手语词典》收录的8214条通用手语的采集和录制,并且语法都以听障群体习惯打法为准,以确保手语播报成果的准确性和专业度,更好地服务听障人群。

  左家平介绍说,由于当前国内缺少较完善的手语语料数据,研发人员在北京市残疾人联合会和市残联聋人协会的支持下,邀请超过40余位聋人老师及手语专家进行手语文本转写和技术指导,并进行大范围听障群体评测,最终构建了符合国家通用手语规范的国内最大规模多模态手语语料库,词汇及语句总规模超10万。

  为构建能够理解、翻译语音和手语的智能数字大脑,“冬奥手语播报数字人”系统以超大规模预训练模型为核心技术,通过语义蒸馏及手语翻译快编模型,实现新闻播报语音蒸馏成语义高度接近的手语文字,并翻译成符合手语习惯的语序。最终,手语数字脑可以通过计算机模仿听障人士的大脑,进行手语播报驱动。

  为实现高精度、高自然度的人物形象和手语动作姿态,研发团队还自主搭建了多模态肢体动作、表情、手指同步采集系统。通过采集多模态动作捕捉数据,运用跨模态拟人生成算法对超写实数字人进行自然、流畅的驱动和渲染,实现对文本内容的手语播报。其中,通过肌肉绑定技术驱动实现面部采集,结合业内领先的语音识别及高清视频合成等技术,呈现给听障人群亲切自然的冬奥手语播报服务。

  应用前景广阔

  手语播报数字人的应用场景广泛,一方面可以为新闻媒体提供全流程智能化的数字人手语生成服务,方便听障人士快速了解新闻简讯;另一方面可将声音广播内容转化为手语,为听障人士播报冬奥会赛事赛情、赛场成绩,便于获取即时信息。

  据北京广播电视台新闻频道中心副主任王毅介绍,“冬奥手语播报数字人”已于冬奥开幕后每日持续在北京卫视《北京您早》节目中,对“冬奥赛事集锦”和“一起看冬奥”进行手语播报,不仅能为听障人士提供手语信息播报服务,降低冬奥运营成本,还便捷了听障人士收看赛事专题报道,提升他们的社会参与度和幸福感。

  “‘冬奥手语播报数字人’技术,展现了强大的科技应用能力,既有公益推广价值,也有商业应用价值,综合社会价值十分大,希望能得到广泛推广使用。”王毅说。

  凌云光技术股份有限公司副总裁杨艺同样表示,“冬奥手语播报数字人”系统将向全国做公益性推广,用于造福广大听障人士,可首先应用于各电视台、网络平台和大屏等多媒体渠道进行推广。

  “‘冬奥手语播报数字人’的应用,展现了公司‘让机器像人一样思考’的愿景。”智谱AI CTO张鹏表示,“这不仅使听障人士能快捷获取冬奥赛事资讯,还将无障碍环境理念传递到数亿人群。作为国家高新技术企业、北京专精特新企业,未来,智谱AI将持续深化数据和知识双轮驱动的战略,打造强大而通用的人工智能系统,通过创新助力我国人工智能生态建设,让技术创造更多价值。”

2022-02-14 6 6 高新科技导报 content_126020.html 1 “冬奥手语播报数字人”值岗 /enpproperty-->