一、引言
CPC是联合专利分类体系(Cooperative Patent Classification,CPC)的简称,随着互联网行业的兴起,大数据时代的到来,数据备份与恢复技术也在不断发展,专利逐年申请量增加。数据备份与恢复是属于技术交叉领域,涉及技术知识较多;随着技术的发展,需要更新的技术知识也比较多。关键词检索存在扩展不全面,用词不准确等问题,导致检索噪声大,检索效率低下。数据备份与恢复技术的CPC分类在不断完善,本文通过实际案例来分析数据备份与恢复技术领域CPC分类规则及其应用。
二、案例分析
2.1数据备份与恢复领域的CPC分类分析
数据备份与恢复主要分在G06F11/00-G06F11/14这一段分类号下面。在IPC分类体系中,这一段分类号,包括大组G06F11/00、一点组G06F11/07、二点组G06F11/08、G06F11/14、三点组G06F11/10。但是在CPC分类体系中,则对上述小组进一步细分了,包括了99个细分项,其中G06F11/07,G06F11/08和G06F11/14下的细分项比较多。通过进一步细分,每一个分类号下的文献量都变少了,使得检索过程中文献浏览量减少,检索快而准。
2.2 实际案例
(1) CPC分类案例一
发明名称:一种基于日志的NTFS删除文件恢复方法和装置
案情简介:本发明属于信息安全技术领域,具体涉及一种基于日志的NTFS删除文件恢复方法和装置。该方法通过分析MFT相关的日志信息并结合MFT自身信息,能够重组被覆盖的文件记录,从而更好的恢复出相应的删除文件。该方法解决现有技术方案在文件记录被覆盖情况下无法恢复的问题,使得NTFS删除文件的恢复技术得到进一步的完善。
本申请涉及文件系统数据恢复,其IPC主分类号是G06F11/14,副分类号是G06F17/30(信息检索及数据库结构)。查找对应IPC下的CPC分类号,本申请属于文件系统的恢复方法,根据其具体技术领域可以分到G06F11/1435(使用文件系统或者存储系统元数据),由于NTFS删除文件属于持久性数据,因此,也可以被分到G06F11/1471(包括恢复持久性数据记录)。
接着我们继续查看其IPC副分类号G06F17/30,NTFS删除文件通过MFT的日志信息恢复数据,因此其可以被分到G06F17/30191(日志文件系统)。
(2) CPC检索案例一
发明名称:一种容灾备份方法和系统
背景技术:数据安全对任何一个公司、部门、组织或者是个人都是至关重要要。据相关统计得出,凡是数据丢失过的公司95%在3年之内破产,可见数据安全对于数据拥有者的重要性,数据即公司的生命。近些年来,越来越多的公司 在数据中心的新建或者扩建中考虑数据的容灾和备份,比如两地三中心等典型的容灾备份方案。但是,容灾备份方案和技术不仅仅是提供冗余的存储系统、服务器系统和交换设备等基本设施,还需要租用高昂的链路带宽。链路租用费用十分昂贵,一般中小型企业都难以承受。所以降低带宽需求,在低成本条件下实现数据的容灾备份显得尤其重要。
权利要求1: 一种容灾备份方法,其特征在于,所述方法包括:当上层应用的输入输出IO数据量达到或超过预定的阈值时,将容灾数据缓存到本地数据缓存空间;当所述IO数据量低于所述预定的阈值时,将所述本地数据缓存空间中存储的所述容灾数据传输至远程备份数据端。
首先理解案情,确定分类号。从发明点来看,本发明的应用领域是容灾备份系统中的数据备份因此其可以被分到G06F11/1458备份或还原处理的管理;其涉及到备份数据的时机选择,可被分到下点组G06F11/1461备份调度策略。
利用CPC分类号进行检索,检索过程如下:
编号 所属数据库 命中记录数 检索式
1 SIPOABS 32345 (G06F11/1458 or G06F11/1461 or G06F11/1464)/cpc
2 SIPOABS 180448 bandwidth or (input 2D output) or (Data w transmit+ w speed) or (Data w transmit+ w rate)
3 SIPOABS 4251208 peak+ or idle+ or free or leisur+ or spar+ or remain+ or occup+
4 SIPOABS 9483 2 s 3
5 SIPOABS 8938266 threshold or condit+ or policy or proport+ or range or predetermin+
6 SIPOABS 17900 2 s 6
7 SIPOABS 11 1 and 4
8 SIPOABS 32 1 and 6
在检索式7和8中都没有收获。在阅读检索式7和8的背景技术文献过程中,发现一些背景技术文献的CPC分类号是G06F17/30578:….异步复制和数据一致的细节。异步复制的定义是响应于主存储设备和备用存储设备之间数据复制状态满足第一预定条件,至少根据主存储设备中进行同步复制的多个逻辑单元的优先级信息,从多个逻辑单元中选择至少一个备选逻辑单元;将至少一个备选逻辑单元的数据复制模式从同步复制修改为异步复制。第一预定条件可以是,数据复制的总数据传输速率大于第一速率阈值。在异步复制的情况下,每当主存储设备从本地连接的主机接收到写数据的指令,它就根据指令在本地磁盘系统中写入数据,并立即向主机返回写入完成报告。在这之后的一定时间间隔之后,主存储设备将这段时间间隔中更新的数据转发到备用存储设备。在备用存储设备完成更新数据的写入之后,向主存储设备返回一个写入完成的通知。因此,异步复制的定义与本申请的发明构思相似,继续查找G06F17/30578附近分类号,看是否有更准确的分类号,发现G06F17/30575(在数据库间或在分布式数据库内的数据复制、分配或同步;其分布式数据系统结构),G06F17/30578(异步复制和数据一致的细节)和G06F17/30581(同步复制的细节)。采用新的CPC分类号检索,如下:
编号 所属数据库 命中记录数 检索式
1 SIPOABS 3172 G06F17/30578/cpc or G06F17/30575/cpc or G06F17/30581/CPC
2 SIPOABS 180448 bandwidth or (input 2D output) or (Data w transmit+ w speed) or (Data w transmit+ w rate)
3 SIPOABS 4251208 peak+ or idle+ or free or leisur+ or spar+ or remain+ or occup+
4 SIPOABS 9483 2 s 3
5 SIPOABS 5 1 and 4
6 SIPOABS 8938266 threshold or condit+ or policy or proport+ or range or predetermin+
7 SIPOABS 17900 2 s 6
8 SIPOABS 12 1 and 7
在检索式8中检索到对比文件US2014324774,且检索式8只有12篇文献量。
三、结论
由于数据备份与恢复涉及的技术知识较多,当其涉及到数据库备份方式的改进,还有可能分在G06F17/30下面,当其涉及到备份数据传输方式,可能分到H04L12/00下面,记载方法是采用程序执行的,可能分到G06F9/44下面。因此,我们在检索数据备份与恢复领域的文献时,要结合具体案情,不能局限于G06F11/00-G06F11/14,还要合理调整分类号。
作者简介
许莎莎,硕士,湖南长沙,国家知识产权局专利局专利审查协作湖北中心,数据备份与恢复;盛磊,博士,湖北武汉,国家知识产权局专利局专利审查协作湖北中心,图像处理,等同第一作者。