PDF下载
基于TDNN-FSMN的蒙古语语音识别技术研究

王勇 和飞龙 高光来

内蒙古大学计算机学院

摘要: 为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈型序列记忆网络"记忆"模块中历史信息和未来信息长度对模型的影响;最后分析了融合的网络结构中隐藏层个数及隐藏层节点数对声学模型性能的影响。实验结果表明,时延神经网络融合前馈型序列记忆网络相比深度神经网络、时延神经网络和前馈型序列记忆网络具有更好的性能,单词错误率与基线深度神经网络模型相比降低22.2%。
关键词: 蒙古语;语音识别;时延神经网络;前馈型序列记忆网络
DOI:
基金资助:
文章地址: