全球信号处理挑战赛获奖情况

1月20日,由IEEE ICASSP主办的全球信号处理挑战赛(L3DAS22, Learning 3D Audio Sources of 2022)公布比赛结果。本实验室学生王卉在语音增强赛道获得第10名。

ICASSP(International Conference on Acoustics, Speech and Signal Processing,国际声学、语音与信号处理会议)是全球规模最大,也是最全面的信号处理及其应用方面的顶级会议。来自国内外著名AI公司和高校的有着多年语音技术积累的语音实验室参加了今年的会议挑战赛。比赛竞争激烈,最终获得前10名的机构成绩十分接近。

语音增强赛道的任务是利用机器学习技术和深度学习技术对带有混响干扰的、办公环境下的语音信号进行信号增强,目标是从含有各种背景噪声的三维音频信号中提取单通道语音信号。该任务的评估指标是短时客观可懂度(STOI, short-time objective intelligibility)和词错误率(WER,word error rate)的组合。

王卉同学自2021年10月进入HLT实验室,仅用不到半年时间,快速掌握了端到端的语音合成、语音增强、语音识别等多项语音技术。在天津本轮疫情期间,王卉克服各种困难,在完成本科毕业设计先导课程的同时,高质量完成了团队安排的参赛任务。在HLT实验室师生的支持帮助下,王卉在比赛中独立完成了基线系统的搭建、数据增强方案的实现、损失函数的设计以及模型的改进,最终模型的词错误率相对降低12%,短时客观可懂度绝对提升0.05,显著提升了基线系统的性能。