PDF下载
基于相似性摘要算法的应用与研究

肖锦琦

四川大学计算机学院

摘要: 算法可以将任意大小的数据转换成一段极短的摘要信息,并通过摘要信息计算两组数据的相似程度,在电子犯罪取证调查、恶意软件检测、垃圾邮件过滤等安全领域极具应用价值。将相似性摘要算法分为基于内容分割的分片哈希算法、特征提取算法以及局部敏感哈希算法等三个类别,分别讨论其特点和适用范围,以及在恶意软件以及文本文件等应用场景中测试相似性检测效果,同时指出现有算法的不足以及研究方向。
关键词: 相似性摘要;局部敏感哈希;同源性检测;数据指纹
DOI:
基金资助:
文章地址: