请选择 目标期刊

基于稀疏DBN和双向LSTM的视觉语音识别算法 下载:63 浏览:431

王一鸣 陈恳 《数据与科学》 2019年7期

摘要:
唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,Bi LSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的l1/2范数和l1范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入Bi LSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。

基于解析字典的人群异常行为检测 下载:62 浏览:353

禹青 陈恳 李斐 李萌 《数据与科学》 2018年9期

摘要:
针对目前视频监控技术在保障公共安全方面的作用越来越重要这一现状,提出一种新的视频异常检测方法。首先在对视频的特征提取上,创新性地提出一种基于区域最值的稠密光流直方图描述符(Densely Sampled Maximum and Minimal Histogram of Optical Flow,Dense MHOF),该方法的主要思想是通过选取一定区域范围内多个光流直方图各个方向的最大与最小光流幅值来表征该区域的运动特征,从而实现对人群运动信息的有效表征。在字典构建上,有别于被其他文献广泛使用的综合字典学习方法,采用更具灵活性的解析字典学习,通过对正常事件的学习获得稀疏字典,随后计算测试样本在该字典下的重构误差来判断测试样本的正常与否。在标准异常行为库进行的实验表明,与目前几种经典方法相比,该文提出的方法取得了较好的性能。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享