基于相似性摘要算法的应用与研究
摘要: 算法可以将任意大小的数据转换成一段极短的摘要信息,并通过摘要信息计算两组数据的相似程度,在电子犯罪取证调查、恶意软件检测、垃圾邮件过滤等安全领域极具应用价值。将相似性摘要算法分为基于内容分割的分片哈希算法、特征提取算法以及局部敏感哈希算法等三个类别,分别讨论其特点和适用范围,以及在恶意软件以及文本文件等应用场景中测试相似性检测效果,同时指出现有算法的不足以及研究方向。
关键词:
相似性摘要;局部敏感哈希;同源性检测;数据指纹;
相似性摘要;局部敏感哈希;同源性检测;数据指纹