1 研究背景
1.1 研究的提出
大数据的概念最早由麦肯锡咨询公司提出,顾名思义即数量规模庞大的数据,体现数据的规模性、多样性、高速性和价值性四大特点。大数据是信息处理与计算技术的延伸,也是社会进步和发展的必然趋势。
在信息和网络技术飞速发展的情况下,社会生活中越来越多的活动实现了数字化。随着数据生成的自动化、数据生成速度的快速化,数据量随之迅猛增长。存储设备、内存、处理器等电脑元件成本的不断下降,使之前昂贵的大数据存储和大数据处理更加便宜,为数据量飞速增长提供了有效的保证,从而使得大数据的存在成为可能。信息技术的飞速发展,为数据的生产、存储提供有力的基础,并且允许数据形式的多样化,从而促进了大数据时代的产生和发展。随时随地通过各种方式和手段,上传和下载、发布或共享文字、图片、音频和视频等各种形式的数据,越来越多各种形式的数据提供给人们使用。数字化已经成为经济社会发展的必然趋势。与生产过程必须依赖硬件设备和人力资本一样,企业的业务活动、创新、成长也越来越离不开大量数据的支持。也就是说,社会生活中的任何一项业务活动都与大量的数据紧密相联,每一个人都是数据的产生者,同时又是数据的使用者。数据量与日俱增,数据结构繁杂多变,数据产生速度越来越快,数据带给我们的价值远远超过以前,我们已经进入了大数据的时代。
在大数据时代,有计算机技术的支持可以分析处理更多的数据,甚至可以处理某个特定范围的所有数据。随着数据数量的不断增加,使我们的思维有所改变不再只关注数据的准确性,不再关注数据的之间的因果关系。大数据为工作、生活和思维带来了改变,所以需要对数据和信息的重新界定。
1.2 研究目的与意义
在大数据时代的环境下,社交网络已经渐渐的成为了目前为止最具有发展潜力与前景的互联网应用之一。社交网络的迅猛发展导致了互联网生活与现实生活的关系变得越来越紧密与微妙。追求时尚的年轻人通常会在社交网络上传达自己对于一些事物的看法与意见,同时与网友进行一些社会交流活动,移动社交网络具有着高度的互动性、开放性、及时性与共享性。在现如今的网络环境中,社交网络的普及度已经是越来越高,国外的社交网络如facebook,twitter等,而在现如今的中国,社交网络如同一个具有无限潜力的市场,一个又一个新奇而有趣的社交软件如同洪水猛兽一般向我们袭来,早先年的qq、人人网、校内网以及开心网等等,到如今的微信、陌陌、新浪微博等都在短时间内飞速成长为移动社交软件的龙头企业。就中国现如今的形势来看,青少年甚至于中青年的人群都更倾向于在绝大部分的时间用微信这样的社交软件来取代传统的电话,手机交流。
看似一片大好的市场前景下,同样也隐藏着巨大的隐患。那就是移动社交网络的隐私安全问题。根据eMarketer预测一直到2017年中国手机社交网络用户增长率都将保持两位数字,到2019年中国手机社交网络用户将达到4.804亿。你可以将其理解为中国移动社交网络市场巨大的发展潜力,但你同时也可以理解为中国移动社交网络面临的巨大风险与危机。伴随着越来越多的用户通过移动社交网络来进行信息的交流与传播,移动社交网络的隐私安全可在不断地暴露在大众的视线之中。我们经常能够从媒体与朋友之间得知关于人肉搜索导致一场场悲剧的发生,更有甚者,经常会有通过移动社交网络非法盗取与利用个人隐私信息的案件。因此,移动社交网络中的隐私安全成为了现如今想要更好发展互联网社交网络市场一个急需解决的问题,我们作为即将踏入社会的大学生,也有必要和义务来对当前的社交网络隐私安全进行一波研究与探讨。
本篇论文将通过几个方面针对大学生移动社交网络的隐私安全需求与改善进行探讨与分析。以现如今在大学生群体中较为流行的微信朋友圈,新浪微博和人人网为例,对其中所包含的移动社交网络隐私安全问题进行详细的讨论,并给予我所提出的相应的解决方案,最后对本文进行总结并提出进一步的研究方向和研究方案。
本文以现如今在大学生群体中较为流行的微信朋友圈,新浪微博和人人网为例,通过相关文献阅读以及问卷调查,收集并核对关于当代大学生对于移动社交网络的隐私安全的若干问题的相关数据,再经由SPSS进行回归分析,得出大学生关于移动社交网络的一些特点,移动社交网络隐私安全的来源,并提出相应的解决方案。
在确定了研究问题以及研究目的、意义之后,首先通过搜索大量国内外的相关文献,定义本文中的大数据时代、移动社交网络等概念并研究相关的文献;其次,结合阅览后的文献资料,提出假设,并据此确定数据收集方法与分析过程;第三,设计问卷,关于大学生对于社交移动网络及其隐私问题的看法与意见;第四,收集问卷,整理结果,仔细校对所收集数据,并修正相关问题;第五,通过SPSS软件对数据进行逻辑回归分析从而得出结论;最后,根据分析结果及相关文献,解释所得结论,并且为大学生移动社交网络隐私安全问题提出意见和建议。研究框架如图1-1所示:
图1-1 研究框架
2 文献综述
2.1社交网络用户隐私的种类
尽管社交网络的根本目的是提供给用户一个线上互动和交流的平台。但大部分网站的定位、目标和实现方式都存在很大的不同,如Linkedin主要是面向商业用户的社交网络,人人网则主要是基于校园关系的实名制社交网络。不同的社交网络有着不同的特点,因此弃信息泄漏的内容、信息泄漏的方式也都变得多种多样。社交网络中的用户的隐私信息类型主要包括四个方面,分别是用户的个人信息、用户分享的信息、用户的人际关系信息以及通过数据挖掘所获取的信息。
2.1.1用户个人信息
社交网络正是在人们日益增长的交友需求中发展起来的,用户在注册之初,就被鼓励提供更多的个人基本信息。以人人网为例,作为国内最大的社交网络之一,人人网拥有真实注册用户超过1亿。在社交网络的个人档案中,包括用户的身份证号、出生日期、电话、即时通讯工具、电子邮件等诸多真实的个人信息,这些信息有可能被网络诈骗者利用,并以用户的名义获取服务或者访问个人网上银行账户等。
随着国内网络实名制的发展,越来越多的社交网络要求注册者提供真实的个人信息,除了政策原因以外,社交网络本身的特点也需要用户提供更多的个人信息。例如,要想在社交网络上找到更多的朋友,用户就必须提供更详细的真实资料,如教育背景信息、地理位置信息、个人爱好等信息。通过对这些真实资料进行分析和整理,系统才能更同你,社交网络才能帮助我们找到更多朋友,才能让我们获得更多感兴趣的信息。在这种情况下,用户往往陷入梁娜的境地,如果全部填写真实信息,用户的个隐私往往暴露在网络之中。但是,如果填写虚假信息,又往往会失去玩社交网站的真实感,无法将社交网络与现实生活结合起来。其实,不管用户愿不愿意,社交网站的服务商们总希望用户能提供最详尽的真实资料,从而为用户建立更加紧密的关系网络,让系统显得更加智能。
2.1.2 用户分享信息
用户每天在维护社交网络的过程中可能透露出大量的个人信息。例如,很多人乐于随时随地的使用地理位置分享服务(又称LBS),通过随身鞋带的手机,将自己的地理坐标分享给社交网络和微博上的好友。这样就将自己的活动轨迹暴露于人前。据调查,在国内大中型城市的15~30岁的网民中,有95%以上会注册一个或几个社交网络。用户在频繁的使用各种信息分享服务时,其所能保留的隐私已经便得越来越少了。
除去文字信息外,用户还在网上发布大量的图片信息和视频信息,通过用户分享在社交网站上的信息碎片和视频信息,工作情况等商业公司不但可以手机用户的手机号等不同信息,还可以推测出用户的消费倾向、婚姻情况、工作情况等涉及个人隐私的信息。黑客也可能利用用户分享的一些信息碎片,盗取用户的银行卡、股票和基金等账户。其实,即使不懂黑客技术,只要将某个人在各个社交网站和微博上的碎片信息进行简单拼接,任何人都可以轻松获得其隐私信息,但是国内社交网站的用户并没有意识到分享信息导致的隐私泄漏所带来的危害。
2.1.3 人际关系信息
通过社交网络,我们可以找到现实生活中的朋友,同时系统通过对已有信息的分析,还会为我们引荐一些可能认识的好友,可能回味我们找到许久未联系的好友,这正是社交网络的魅力之一。但同时,社交网络也将我们的人际关系暴露人前。通过用户在社交网络上的互动以及社交网站通过算法所做的好友推荐等功能,可以很容易地了解用户的人际关系网络。2012年3月,Facebook好友推荐功能就曾令一名美国男的重婚行为败露,这从另一侧面也反映了社会网络泄漏人际关系信息的风险。有人说过,腾讯在掌握大量用户的同时,也掌握了绝大部分中国人的关系网,2012年3月测试上线的qq圈子更是深刻地体现了这一点。QQ圈子是基于QQ好友关系、分组名、备注名,通过聚合分类数学算法进行人脉推荐,QQ用户可以实现按照真实生活中的关系自动分圈,并向同一交际圈但仍属陌生人的对象发起对话,拓展人脉,但是,未经用户的允许就获取用户的分组信息和备注名信息是对用户隐私的泄露,用户在拓展人脉的同时也将不断接受陌生人的骚扰,因为借助圈子功能每用户的个人信息在一定程度上已经处于公开状态,很多并不是好友的用户也在你QQ圈子分类里。
2.1.4数据挖掘信息
社交网络的快速发展产生了超大量的基于互联网的社交网络数据,这些数据的内容包罗万象,形式丰富多样,既包括各种文字信息,也包括应用软件、图片、音频和视频等信息。社交网络中的海量数据隐藏着丰富的知识和巨大的商业价值,为了充分利用这些数据,越来越多机构和个人开发了各种社交网络分析方法和工具,对社交网站上的各种数据进行挖掘和分析。但是,我们也应该看到,通过社交网络分析方法对社交网络数据进行公开研究会对用户隐私和信息安全构成威胁。例如,通过采取数据挖掘等技术手段从大量注册信息,将用户分散与个走出的零碎信息,甚至能够了解用户的生活轨迹、生活习惯、个人爱好等、一旦这类数据公开或不当使用,将给用户带来难以估量的损失。
2.2 社交网络信息泄漏的途径
社交网络应用的广泛性和多样性使得用户隐私信息的方式也变得多种多样。除了用户自己泄漏的信息之外,社交网站以及第三方应用都可能造成用户隐私的泄漏。
2.2.1 用户泄露
随着社交网站、微博和地址分享服务的先后兴起,互联网分享信息的方式变得多样化。人们 在互联网上活的越来越真实,尽管个人隐私在社交网站中存在着各种各样的风险,但仍然有越来越多的人乐于在网上分享自己生活中的点点滴滴。这当中存在很多推动信息泄漏的因素,例如对社交网站用户来说选择性地向陌生人发布一些死人信息所带来的手艺可能会大于潜在的信息风险:朋辈压力的集群效应:对个人隐私保护缺乏重视;对社交网络和人群的盲目信任;对潜在风险的短时评估等。有时网站本身的问题也会造成用户忽略或无视其用户隐私设定。以新浪微博为例,用户可以对自己的个人资料进行设置,例如可以将自己的基本信息、教育信息、职业信息等设置为仅自己可见、我关注的人可见或者所有人可见,同时用户还可以对评论、私信以及@提到我以及地理位置信息等根据需要进行设置,还能设置黑名单和进行屏蔽,但是新浪微博的用户基数巨大,其中很多人并不知道这些功能,有些用户可能知道但是不会操作,还有些用户根本没有意思hi到会有隐私泄漏的问题。国内目前虽然确实相关的数据统计,但是这些问题都是可以明显预见的。国外的社交网站用户也存在类似的问题,根据意象研究表明,大约有1300w的Facebook用户表示他们从来不设置、或者根本就不知道Facebook有隐私工具。28%的用户与所有用户分享他们的大部分或者是全部内容,而不仅仅是朋友们。
用户除了泄漏自身的隐私之外,很多时候还会通过社交网络泄漏他人的隐私。有时一些用户在未经他人允许的情况下发表的只言片语或上传的某张图片,都可能在有意或无意间泄漏他人的重要隐私,给他人造成困扰甚至是损失。
在传统媒体环境下,用户仅仅是信息的接受者,而在社交网络中,每个人都是一个小型的信息接受和传播中心,社交媒体的开放性以及信息传播的自主性,让信息的传播变得更加难以控制,私人领域与公共领域的界限变得愈加模糊。社交网络的自媒体特性,导致有失手本来属于私人领域的言论,通过社交网络的传播,可能形成公共领域的话题。例如郭美美炫富、局长开房等事件因触动大众神经而迅速成为了公众热议的话题,目前层出不穷的类似事件表明用户隐私泄漏已经比较严重。
2.2.1 社交网站泄漏
随着社交网站的迅速发展,社交网站掌握了大量用户的信息,而社交网站本身的安全性对用户的隐私安全具有重要意义。网站泄漏用户隐私猪哟呵分为两种状况,一种是社交网站出于某种利益因素故意泄露用户的隐私,例如在违背用户本意的情况下使用用户上传的信息,MySpace就曾被爆出将网站信息出售给第三方的事件,包括学术研究者、市场挑檐机构甚至是营销人员。另外一种情况则是社交网络可能由于某种技术原因而造成用户隐私泄漏,例如社交网站存在安全漏洞,从而遭受到黑客的攻击,导致用户的信息泄漏。2011年12月,中国的CSDN网站用户数据库被黑客攻击,导致600多玩邮箱帐号和与之对应的明文密码泄漏,之后又有人人、新浪微博、开心网、天涯等众多知名社交网站的用户称其密码遭到泄漏。由此可见,为了寻求个人数据,黑客加大了针对社交网喽的攻击力度。
2.2.3 第三方泄漏
为增强社交网络的吸引力,提高用户黏度,很多社交网站都开放平台,为用户一共各种第三方应用程序,同时社交网站作为信息共享的平台,与第三方网站的合作也变得日益密切。例如优酷网的用户可以在该网站上与微博的用户进行互动。在CNN上观看视频的同时还可与其他Facebook用户聊天。
随着第三方应用程序的引入,社交网站的内容变得越来越丰富,其娱乐性也变得越来越强,但是用户在社交网络中使用第三方应用程序或者第三方的网站是,用户可能会面临着严重的隐私安全问题。因为此时,用户往往被要求授权提供个人信息、好友关系等,授权之后用户的隐私往往难以收到保护。有时即便用户在社交网站上设定信息只能被某个群体看见,但是如果另一个用户正在使用社交网站的应用程序,则此人可以将该用户的数据在不知情的情况下,传送给第三方,造成该用户隐私泄漏。Facebook就曾发生过多款应用将Facebook用户的ID数据贩卖给第三方营销公司或数据机构的情况。这给Facebook及其用户均带来了眼中的不良影响。
2.3 社交网络隐私保护的途径
目前很多研究者从技术的角度寻找社交网络的用户隐私保护途径。解决隐私保护的传统技术方法包括处理后在进行分析挖掘,给予密码学的隐私保护技术等。Narendula等认为,在线社交网络将大量的用户个人信息集中在单一管理域内,可能会导致眼中的隐私安全问题发生,他们提出系统利用社交网路的新人管理来分散地存储社交网络的配置文件和内容,并利用对等据算(Peer-to-Peer,P2P)技术来实现对社交网络个人数据的存取。当前有越来越多的额人意识到社交网络的隐私控制问题是一个涉及多学科的综合问题。例如Debatin等就是从用户心理和行为的角度对社交网络的隐私安全问题提供建议。
解决隐私问题,需要从技术、法律政策、用户意识等多方面入手。针对社交网络隐私泄漏的几个途径,我们主要从一下几个角度探讨社交网络的隐私保护途径。
2.3.1 加强用户的信息安全意识
目前,社交网络的隐私安全问题已经引起很多人的注意,但是,仍有很多大部分用户在社交网络享受、风险乐趣的同时,往往忽视了对个人隐私安全的控制。很多社交网站在用户填写信息或发布信息时,都可以对这些信息进行权限设置,但很多信息默认对所有人可见,有些用户由于缺乏信息安全意识,无意间透露了很多个人隐私。根据一份对2277为美国成年人在社交网络当中,隐私管理的调查报告显示,有58%的受访者将主资料页面车只为半公开,,只有好友和好友的好友可以看到,但是仍然有20%的用户个人资料完全公开。社交网络中选择将资料完全公开的用户,有些是误以为只有自己的朋友能看见。例如局长开房事件,双方当事人就将微博当成即时通讯工具,在微博上大谈私密话题,根本没有意识到隐私泄漏所带来的危害。
用户在使用社交网站时,必须深刻意识到,社交网络上的一举一动都是可见可分析的,因此,用户在发布信息之前应该斟酌考虑是否泄露了自己及他人的个人隐私等。同时,用户需提高信息安全意识,如不要将生日、身份证等常用信息作为密码,定期更换密码和检查个人设置,不要随意加陌生人为好友等。
2.3.2 社交网站加强对用户隐私的保护
为保护用户的个人隐私,各大社交网站都设置相应额隐私保护政策。加拿大的几位学着通过对美国六大SNS网站(Facebook,Linkedin,MySpace,Orkut,Twitter和YouTube)
隐私时间和隐私政策的调查研究,将隐私政策从目的、可见性、粒度和缓存信息四个层面进行分析。通过调查发现,六大SNS网站大多着力于从目的和信息可见度对用户隐私进行保护,而缺乏对于粒度和服务器缓存信息的保护。对于很多社交网站来说,即使是非注册用户也可以轻易获取其信息,如通过google搜索可检索到Facebook、MySpace以及Twitter等内容;国内也可以通过百度获取新浪微博的内容,由此可见,社交网站中的用户信息极易获得,对用户信息的保护依旧任重而道远。
对于社交网络来说,一方面,社交网络应加强自身的安全性,网站采取合理有效的控制措施保护用户隐私,提升技术门槛,加快技术革新,不要等到信息泄漏时才想着修补技术漏洞。另外一方面,网站应肩负起一定的责任,积极引导用户,使用户更了解如何保护个人隐私。虽然许多社交网站采用了集中的隐私控制手段来获取公众的信任,但是这些控制手段要么太复杂,要么用户不完全了解每一次鼠标点击带来的严重后果,因为大部分用户不了解他们的个人信息泄漏的程度,也不了解这种泄漏能带来多么严重的后果。因此,需要社交网站在保护用户隐私的过程中发挥更大的作用。
2.3.3 加强对第三方的监管
社交网站与第三方的合作是用户隐私泄漏的另一个重要途径,也是进行用户隐私保护、降低隐私泄漏风险需要重点关注的问题。在目前的网络环境下,第三方网站或第三方程序一般均会要求用户应用授权,即同意该网站或程序获得用户信息等,用户为了使用第三方网站或程序往往都会同意授权,这样第三方便获取了该用户的个人资料、好友关系、评论等信息。当前大量的第三方程序都是在自己服务器上运行,没有任何监控,极易造成信息的外泄,形成眼中的安全隐患。因此,我们需要在保证第三方程序实现其功能的前提下,对信息流进行严格的监控。例如在授权时应提供更加明确、更加详细的隐私选项,从而协助用户进行判断。同时,社交网站也要加强对第三方应用的审核,及时挑剔那些存在安全隐患的应用,为用户提供安全保障。针对第三方应用,KapilSingh、Sumeer Bholad等研究院提出了一个可以控制隐私的平台,他通过客户端和服务器端的限制机制,基于用户定义的标签强化信息流监控、匿名化数据,最终实现隐私保护的目的。但是,如何将这个系统与社交网络进行整合,如何将这个系统应用到所有的第三方应用程序中去,则还缺乏相应的现实案例,目前仍处于不断地探索中。
2.3.4 加强法律监管
当前,网络犯罪呈不断上升的趋势,与用户隐私相关的网络犯罪形式也多种多样,但是相关的法律却并不完善,有关个人信息保护的相关法律也迟迟未出台。目前,世界上已经有50多个国家制订了个人信息法体系,例如美国有电子通信隐私法,互联网保护个人隐私的政策,日本有5个人信息保护法,欧盟有关于保护自动化处理过程中个人数据的条例。我国虽有众多的法律涉及个人信息保护,但是缺乏专门的理发。法律的不完善一方面使盗窃用户隐私的违法行为亦能得到有效的制裁,降低其违法成本;另一方面,因维权成本交大,使网友在面对信息泄露等侵权事件发生时往往选择忍气吞声和退让。因此,应加快相关法律法规的制定。另外,由于网络犯罪往往危害面广,且手段智能化,具有极高的隐蔽性,导致取证困难,破案难度大,因此司法部门应注意提升技术手段,加大对信息泄漏的惩罚力度,给不法分子以有效威慑,法律权威为用户的信息安全保驾护航。
2.4 结语
社交网喽的不断普及和广泛引用,使得人名的个人信息与日常活动在网络上得到越来越多的展现。但是,社交网络为用户提供交流和展示平台的同时,如果不能对涉及用户切身利益的个人隐私信息加以保护和控制,将会给用户带来严重的困扰和损失。提高社交网络的信息安全,需要用户提高信息安全意识,从自身坐骑,保护隐私信息,社交网站则需要坚守保护用户隐私的承诺,加强对自设已近第三方的监控和管理,同时,政府也需要制定相关的法律政策,创造良好的法律环境,为社交网络用户提供有效的法律保障。
3 技术路线
本文以现如今在大学生群体中较为流行的微信朋友圈,新浪微博和人人网为例,通过相关文献阅读以及问卷调查,收集并核对关于当代大学生对于移动社交网络的隐私安全的若干问题的相关数据,再经由SPSS进行回归分析,得出大学生关于移动社交网络的一些特点,移动社交网络隐私安全的来源,并提出相应的解决方案,并且希望以此为中国社交网络运营商提供一些启示。
在确定了研究问题以及研究目的、意义之后,首先通过搜索大量国内外的相关文献,定义本文中的大数据时代、移动社交网络等概念并研究相关的文献;其次,结合阅览后的文献资料,提出假设,并据此确定数据收集方法与分析过程;第三,制作问卷,问卷内容关于当代大学生对于移动社交网络及其隐私安全问题的看法等若干问题。第四,采用随机原则,收集问卷并整理数据数据;第五,仔细校对所收集数据,并修正相关问题;第六,通过SPSS软件对数据进行二项逻辑回归分析从而得出结论;最后,根据分析结果及相关文献,解释所得结论,并且为大学生移动社交网络隐私安全问题提出意见和建议。
在研究方法的选择上,笔者着重采用实证研究方法,经历四个步骤:第一步是提出研究问题;第二步是进行文献回顾;第三步是找到理论,提出假设;第四步是设计并执行实证研究。在数据处理方面,笔者采用了SPSS(Statistical Product and Service Solutions)19.0软件中的多重共线性诊断和Binary Logistic(二项逻辑)回归模型进行统计分析,研究自变量与因变量之间是否具有相关性,回归系数是否显著,从而对所提出的假设进行检验。一项研究只有具备理论指导和数据支持,才能经得起推敲。
在实证研究过程中务必要选择合适恰当的研究样本,这才能更好地完成研究工作。本文的研究目的主要是为了提出研究和解决大学生移动社交网络隐私安全问题,并检验它们之间可能存在的假设关系,同时呈现何种相关性。
根据样本企业选择的标准,笔者确定了问卷调查法。本研究中的样本初步选取了上海多家大学2013级,2014级以及2015级的200位在校大学生。本研究依据每位在读大学生对于移动数据网络及其隐私安全问题的看法进行统计分析。