检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
文章
基于解码多候选结果的半监督数据挑选的语音识别
DOI
:
,
PDF
下载:
79
浏览: 438
作者
:
王兮楼
;
郭武
;
解传栋
;
;
;
作者单位
:
中国科学技术大学语音及语言信息处理国家工程实验室
;
关键词
:
置信度
;
半监督学习
;
多候选
;
低资源
;
摘要:
基于资源稀少情况下的语音识别,提出针对大量无标注数据的半监督学习的挑选策略,应用到声学模型和语言模型建模.采用少量数据训练种子模型后,解码无标注数据.首先在解码的最佳候选结果中采用置信度与困惑度结合的方法挑选高可信的语句训练声学模型及语言模型.进一步对解码得到的格进行转化,得到多候选文本,用于语言模型训练.在日语识别任务上,相比基于置信度挑选数据的方法,文中方法在识别率上具有较大提升.
投稿
相关文章
大数据技术在金融风控中的应用研究
程序化护理干预模式在脑出血患者中的应用及对认知水平的影响研究
一种用于小孔径攻丝的工装设计
一种便携式自动控制气动短路接地装置研制
关于建筑电气安装工程施工质量控制研究
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2