文章标题
作者姓名
关键词
单位名称
检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
文章
基于解码多候选结果的半监督数据挑选的语音识别
DOI
:
,
PDF
下载:
79
浏览: 468
作者
:
王兮楼
;
郭武
;
解传栋
;
;
;
作者单位
:
中国科学技术大学语音及语言信息处理国家工程实验室
;
关键词
:
置信度
;
半监督学习
;
多候选
;
低资源
;
摘要:
基于资源稀少情况下的语音识别,提出针对大量无标注数据的半监督学习的挑选策略,应用到声学模型和语言模型建模.采用少量数据训练种子模型后,解码无标注数据.首先在解码的最佳候选结果中采用置信度与困惑度结合的方法挑选高可信的语句训练声学模型及语言模型.进一步对解码得到的格进行转化,得到多候选文本,用于语言模型训练.在日语识别任务上,相比基于置信度挑选数据的方法,文中方法在识别率上具有较大提升.
投稿
相关文章
应用免疫检查点抑制剂慢性阻塞性肺病治疗的探索
体育课与课余体育活动整合研究
品管圈在提高跌倒高危病人复评率的效果观察及应用
摄食训练食物温度的精准分级对脑卒中吞咽障碍患者的影响研究
论存在函数不能用二次迭代函数表示
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2