基于改进模板匹配与深度稀疏编码网络的文档编号自动识别
段磊1 刘涛1 李伟鹏1 张宁1 咸日常2 邹国锋2
1.国网山东省电力公司淄博供电公司;2.山东理工大学电气与电子工程学院
摘要: 电力部门涉密文档编号组合方式复杂、书写形式多样,针对现有文档编号自动识别技术无法实现高精度识别的问题,综合分析电力部门涉密文档编号的构成要素,并提出融合改进特征匹配和深度学习的文档编号自动识别方法。通过图像采集装置扫描文档编号,针对机打文档编号,采用特征匹配算法实现识别;若编号为手写形式,则采用深度学习网络实现编号自动识别。实验数据表明,所提出的方法能够较好地适用于电力部门涉密文档编号的自动识别,有效改善编号识别准确度。
关键词:
文档编号识别;欧拉数;模板匹配;深度稀疏自动编码器;智能化信息采集;
文档编号识别;欧拉数;模板匹配;深度稀疏自动编码器;智能化信息采集