6月26日,中国科学院举办学部第九届学术年会,中国科学院外籍院士盖博·施德潘作学术报告。他一边用英语讲,同传系统一边将他的报告内容实时翻译为中文,呈现在大屏幕上。该同传系统所采用的技术正来自于不久前获得2023年度国家科学技术进步奖一等奖的“多语种智能语音关键技术及产业化”项目。
2014年,科大讯飞等单位开始研究包括中国部分民族语言在内的小语种智能语音技术。他们从维语和藏语等民族语言切入,与北京外国语大学、上海外国语大学等密切合作,研发团队设计出全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建。
“大模型+语音”的发展模式,被认为将给智能语音技术和产业带来新一轮革命性突破。“比如,大模型可以实现语音技术的超拟人合成,让机器说话不再有浓厚的朗读腔,能够像真人一样自然对话。而全双工交互则可以同时、瞬时进行信号的双向传输,让人机对话可以随时打断和继续等。”科大讯飞研究院常务副院长高建清介绍说。
《科技日报》 2024.7.2 都芃