PDF下载
基于缝隙裁剪的满文单词分割和提取方法研究

张晶1 许爽1 贺建军1 李敏2 郑蕊蕊1

1.大连民族大学信息与通信工程学院;2.中央民族大学理学院

摘要: 从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。
关键词: 满文文档图像;缝隙裁剪;文本列分割;投影轮廓匹配;区域约束
DOI:
基金资助:
文章地址: