一、大数据概述
(一)大数据的概念
在维克托 ·迈尔 ·舍恩伯格博士看来,认识大数据之前,世界原本就是一个 数据时代;认识大数据之后,世界却不可避免地分为大数据时代、小数据时代。 我们常说的大数据其实是在 2000 年后,因为信息交换、信息存储、信息处理三 个方面能力的大幅增长而产生的数据。
第一,信息交换。据估算,从 1986 年到 2007 年这二十年间,地球上每天可 以通过既有信息通道交换的信息数量增长了约217 倍,这些信息的数字化程度, 则从 1986 年的约 20%增长到 2007 年的约 99.9%。在数字化信息爆炸式增长的过 程里,每个参与信息交换的节点都可以在短时间内接收并存储大量数据。第二, 信息存储。全球信息存储能力大约三年翻一番。从 1986 年到 2007 年这 20 年间, 全球信息存储能力增加了约 120 倍,所存储信息的数字化程度也从 1986 年的约 1%增长到 2007 年的约 94% 。1986 年时,即便用上我们所有的信息载体、存储 手段,我们也不过能存储全世界所交换信息的大约 1%,而 2007 年这个数字已经 增长到大约 16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象 空间。第三,信息处理。有了海量的信息获取能力和信息存储能力,我们也必须 有对这些信息进行整理、加工和分析的能力。谷歌、Facebook 等公司在数据量 逐渐增大的同时,也相应建立了灵活、强大的分布式数据处理集群。
大数据具有数据规模大、数据类别复杂、数据处理速度快、数据真实性高、 数据蕴藏价值的特点,对于大数据的处理和挖掘很大程度上需要依赖于云计算平台的分布式处理、分布式数据库、云存储和虚拟化技术。
(二)数据分类
依数据牵涉的不同主体,数据可分为个人数据、企业数据、政府数据、其他 组织数据。以数据保护的不同角度,数据可分为一般数据、重要数据、隐私数据、 敏感数据、经过匿名化处理的脱敏数据,商业秘密数据,还有国家安全数据。还 可从数据的利用进程来分类,直接产生记录的是原始数据(也称底层数据、源数 据) ,经过数据清理、数据可视化的技术加工处理的是衍生数据(也称次生数据、 派生数据、成品数据) ,衍生数据一般是匿名化了的脱敏数据,但匿名化还是可 以逆向操作显名化。
值得注意的是,个人数据、企业数据、政府数据,这种数据分类依据的是产 生数据时所牵涉的主体,并不是指数据由哪类主体所掌控。个人数据,1995 年 欧盟出台的《数据保护指令》中定义为所有能够识别身份的与个人信息相关的数 据,包括能够直接识别个人身份的明确信息,以及将多项信息综合后进而能够间 接识别个人身份的信息(如经济文化水平、身体状况、社会角色等) 。王渊等人总结到,个人数据是指能够识别公民个人身份的数据及公民在使用相关服务中所产生的数据。①企业数据指能体现出企业所有相关信息的数据,政府数据是指政府
在各种行政活动过程中产生的数据如交通数据。
二、确定数据权利归属的意义
(一)大数据发展需要大数据确权
数据是新的石油,是本世纪最为珍贵的财产。作为信息化发展的新阶段,大 数据对经济发展、社会秩序、国家治理、人民生活都将产生重大影响。“谁掌握 了数据,谁就掌握了主动权”。现在,世界各国都把推进经济数字化作为实现创 新发展的重要动能,在技术研发、数据共享、安全保护等方面进行前瞻性布局。
大数据价值日益凸显,数据行为日益频繁,大数据发展需要数据确权。大数 据作用十分广泛,大数据可以发现和分析相关需求,可以通过自动化算法支持或 替代人为决策,可以创新以数据分析数据共享等为基础的模式和产品服务。应用 到政府中,大数据可以提升政府的行政效率、决策能力和公共服务水平;应用到 医疗领域,通过分析采集病人的数据,从各项体征因素中辅助诊断是否存在潜在 危险性疾病,从而确保尽早做好应对措施;应用到企业领域,最常见的就是可以 精准定位营销,利用大数据研判市场形势,部署战略经营;在其他领域,有学者 系统的提出了“第四范式”的科学研究方法,甚至在奥巴马竞选和 2014 年德国 “世界杯”夺冠,大数据也都成为了他们的秘密武器。
2014 年 2 月以来,我国已设立了中关村数海大数据交易平台、贵阳大数据交易所等多家大数据交易中心。然而,在数据黑市上的数据交易尤为猖獗,国内数据交易所的数据交易业务却曾一度极为困难,根本原因就是大数据权属不明确。②
(二)大数据引发法治问题需要大数据确权
无处不在的数据收集,各行业数据的不断整合,无阻碍的传播与共享,数据 跨境流动等各种数据行为,牵涉众多的利益主体,也正因为大数据的特征,数据 管理异常艰难极易产生数据失控,大数据产生了诸多的法治问题。
首先就是个人隐私保护的问题,可以说大数据时代我们是透明的,大数据致 力于身份识别,大数据能逐渐还原和预测个人生活的轨迹和全貌,而数据收集、 保管稍有不当就会加剧个人信息泄露的风险。举世瞩目的“棱镜门”事件惊醒了 各国的国家数据安全意识,国防建设数据、外交数据等国家机密数据一旦泄密将 严重威胁国家主权和国家安全,对于数据的跨境流动,发达国家凭借高新科技,形成数据优势,可能会间接的隐性的对中国的经济、政治、文化产生不利影响。③
三、完善数据权利法律归属的认定及保护
(一)数据权利的主体划分
权利人即能享受该项权利法益的人,当权利人认识到自己的权益受到侵害时, 会主动寻求救济。在民事领域下,权利人寻求救济的途径首要来自于私权力,私 力救济是从古至今一直存在的权利主体处理纠纷的方式,是每个权利主体在法律 所允许的范围内进行自我保护的途径。是在公力救济还不健全之前,权利主体会 通过自身力量维护权益解决纠纷。在民事纠纷中,经常有出现主体不适格的情形, 那么数据纠纷作为一种新型权利纠纷,同样也需要对数据权利主体进行清楚的识 别,也是明确适格的诉讼主体,减少诉累。
1. 个人数据权利归属于个人数据主体
通常的权利人包括个人数据用户,这类主体拥有和掌握着属于自身的个人数据,通过他们的数据行为产出大量数据,因此也被称为数据产出者。在我国现行 法律中,以《民法典》第一百一十一条和第四编中关于隐私权和个人信息保护为 立法基础,该规定在除认可了个人信息具有人格权属性外,也应证了个人信息的 归属主体为个人。
个人数据用户之所以能作为数据主体,是因为他们在使用数据产品时,通过用自身数据换取产品使用权限后,因为数据所具有的人格权属性,以及对于个人 的可识别性,这些因素就要求我们在维护个人隐私的同时,将个人数据由个人控 制,让个人数据用户享有个人数据权利,成为个人数据主体。在数据兼具的二元 属性下,个人主体身上未直接将数据财产属性表现出来,但是我们通过合理的认 识,能够理解在个人主体希望通过网络运营商获取服务时,以个人数据作为一般 等价物与网络运营商进行交换的行为,就是体现数据财产属性的一个 方面。
2. 企业数据权利归属于网络运营商
企业数据通常是相对于个人数据而言的非个人数据。尽管在采集之初,诚然 企业数据有一部分来自于个人数据,但在后续企业对数据的加工处理过程中,再 去识别性后,个人数据所具有的人格权属性不复存在时。企业通过以技术手段, 耗费了大量的人力、财力、物力,莫过于就是希望通过此种方式,使原始的个人 数据自始在企业加工处理后,将数据转化为一种具有财产权属性的仅属于本企业 的资产。该类数据也就在这些技术手段背后,在数据权利属性的转移中,主体也 悄无声息的就随之发生了变化。
第一种是反映企业基本状况的数据,是指与企业内部活动相关的数据(财务、 运营以及人力方面的数据) ,这 种形式一般也认定为企业可作为数据的产出者;第二种是企业以通过继受取得, 在数据用户合法授权的情况下,直接或间接、置换取得的数据,再进行加工处理作为二次加工数据的数据生成者。④
由于数据建立二元属性的可行性,对网络运营商在对数据进行二次加工上, 以二次加工者的身份在数据权利主体的认定上也就有所不同,属于企业自身产出 可直接将企业看成是数据产生者享有数据权利;属于企业用劳动和智力成果产生 的,企业就 变成了数据生产者也同样视为数据主体,只是两者在权益上存在差异。
(二) 保护数据权利主体的方式
1. 明确数据权利的法定原则
与物权法定原则类似,数据权利也应当有相应的法律原则对其加以约束。树 立基本原则,将宽泛的行为准则植根于大众心中,也就能将数据权利的核心价值 加以明确。在数据权属的立法之初,应当有与物权法定基本原则 相似的原则被 确立。其次,物权法定原则主要包括四个方面,分别是种类、 内容、 效力、公 示方式方面进行规定。从而设想数据权利是否能以同样的方式进行有效的归类, 最终为数据主体享有的数据权益提供保障。
2. 优化数据权利主体的知情同意原则
从数据主体的场景化界定角度来看,数据采集阶段主张知情同意原则还不够, 应当在场景化界定下的数据生命周期中,使每一个阶段都与知情同意原则相联系, 这就对该原则提出了新要求。该原则本身在个人信息领域适用就是出于对数据权 利人的尊重,是抑制纠纷产生的重要方法。在信息技术领域内,知情同意原则确 实发挥着巨大的作用,保障了主体的权益,但是在数字经济时代下,追求的是低 成本高效率,照搬知情同意原则,任何数据的交易都需要主体的同意或者授权, 根本无法实现,反而会阻碍数字经济时代的发展。
为了方便数据的交易流通,知情同意原则的优化主要体现在个人数据主体上, 即网络运营商对非隐私和非敏感数据可 以获取主体第一次同意后,后续的再流 通行为则可以不再获得同意;对于隐私且 敏感的数据,则需要在每一次流转中 获得初始主体同意。
结语
短短几年的时间里,数据纠纷源源不断爆出,已经使数据权属饱受诟病。此 时,值得我们思考的是恰逢数据发展的鼎盛时期,数据的出现是时代进化的产物, 建构健全的数据权利法律保障体系尤为重要。数据权利的法律归属更能将数字文 明引向新的秩序之中,指引科技在法治的轨道上造福人类。确立数据权利归属, 不是单一的解决数据带来的纠纷,更多的是为了维护数据安全。
参考文献
著作类
1、郭瑜:《个人数据保护法研究》,北京大学出版社 2012 年版。
2 、吴汉东:《无形财产权基本问题研究》,中国人民大学出版社 2013 年版。
3 、冯晓青:《知识产权法》,中国政法大学出版社 2010 年版。
4 、张文显:《知识经济与法律制度创新》,北京大学出版社 2012 年版。
5 、周汉华:《个人信息保护前沿问题研究》,法律出版社 2006 年版。
6 、王秀哲:《隐私权的宪法保护》,社会科学文献出版社 2007 年版。
7 、【美】沃德 ·法恩斯沃思:《高手:解决法律难题的 31 种思维技巧》,丁芝华译,法律 出版社 2016 年版。
8 、【英】维克托迈尔 ·舍恩伯格,肯尼思 ·库克耶:《大数据时代》,盛杨燕等译,浙江 人民出版社 2013 年版。
期刊类
1、肖冬梅,文禹衡:《数据权谱系论纲》,《湘潭大学学报(哲学社会科学版)》2015 年第 6 期。
2 、陈林林:《反思中国法治进程中的权利泛化》,《法学研究》2014 年第 1 期。
3 、齐爱民,盘佳:《数据权、数据主权的确立与大数据保护的基本原则》,《苏州大学学 报(哲 学社会科学版)》2015 年第 1 期。
4 、张凌寒,杜婧:《基于隐私权的个人信息保护路径研究—— 以美国为研究视角》,《网 络法律评论》2016 年第 1 期。
5 、王利明:《论个人信息权在人格权法中的地位》,《苏州大学学报》2012 年第 6 期。
6 、刘德良:《个人信息的财产权保护》,《法学研究》2007 年第 3 期。
学位论文
1 、王基岩:《国家数据主权制度研究》,重庆大学 2016 年硕士学位论文。
2 、栾海燕:《网络环境下的隐私权保护》,南京师范大学 2017 年硕士学位论文。
3 、孙旖旎:《论数据库的知识产权保护》,青岛大学 2017 年硕士学位论文。
①王渊, 黄道丽,杨松儒:《数据权的权利性质及其归属研究》 ,《科学管理研究》2017 年第 5 期。
②杜冉乐:《定价暂难市场化,大数据平台交易欠活跃》 ,资料来源:中国经济网,
http://www.ce.cn/culture/gd/201508/21/t20150821_6283636.shtml。
③齐爱民,盘佳:《数据权 、数据主权的确立与大数据保护的基本原则》 ,《苏州大学学报(哲学社会科学
④石丹:《大数据时代数据权属及其保护路径研究》[J].西安交通大学学报 (社会科学版) ,2018 年第 3 期,