欢迎访问电竞竞猜平台系统升级中,如果喜欢请加入收藏 | 设为首页 |

韩国女明星图片_数据隐私、用户规模与企业存亡:来自三十万款应用的证据

隐私 时间:2019-06-23 浏览:
朱悦 对外经济贸易大学数字经济与法律创新研究中心研究员 数据隐私无疑是近来热点。然而, 至少在“真金白银”这一层面,保障个体数据隐私的意义,尚未得到充分理解 :问用户他们在不在意隐私,答案是山呼海啸般的“在意”;然而,当场景变得稍微切实,用


韩国女明星图片_数据隐私、用户规模与企业存亡:来自三十万款应用的证据

  朱悦

  对外经济贸易大学数字经济与法律创新研究中心研究员

  数据隐私无疑是近来热点。然而,至少在“真金白银”这一层面,保障个体数据隐私的意义,尚未得到充分理解:问用户他们在不在意隐私,答案是山呼海啸般的“在意”;然而,当场景变得稍微切实,用户回复便开始变得“莫衷一是”。在实验室里,他们对隐私的估值“忽高忽低”;在现实选择中,他们的反应多不一致,“漠然”反而是更常见的表现。

  如此现状不能让人满意。不夸张地说:对数据隐私领域的监管与合规而言,“现实中个体是否在意隐私”,是亟需回答的基础问题之一。深深关切,抑或不以为意,各自指向两条泾渭分明的路径。幸运的是,在即将刊于顶级期刊Management Science的研究中,借助对三十万款应用的定量分析,Kummer和Schulte给出了一个斩钉截铁的回答:他们在意

  具言之,文章做了这么一些事:首先,2012年4至10月间,两位作者爬取了安卓应用商店中几乎所有应用的信息,涉及约三十万款应用。2014年,他们再次爬取前述信息。爬取的信息包括且不限于:下载量、类别、索取权限、评级、大小、版本、开发者信息、应用描述,等等;其次,作者定量分析了“敏感数据”收集状况对应用下载量及存续的影响

  如何界定“敏感数据”?原文如此操作:既纳入Sarma等学者已经广泛接受的“敏感数据”定义又涵盖同类别应用中收集频率低于平均值的数据。采取后者的原因如下:若同类别应用较少收集特定数据,此数据与应用功能多无必要关联。同时,文章还收集了以下两种指标:谷歌对“有害权限”的定义;及400名随机抽取参与者对“敏感数据”的定义[1]。

  作者首先作了一些直观的统计,结论有两类:其一,相比收费应用,免费应用中收集敏感数据的现象更为频繁;或者说,“收集隐私的多寡”,确已成为另一个维度上的价格。实际中,只有7%的收费应用会收集同类别应用不常收集的数据;在免费应用中,这一数字是25%。收费应用平均索取1.33个涉及敏感数据的权限;对免费应用,这一数字高至3.06

  下列事实印证了上述发现。具体而言,在全样本中,作者找出496对满足以下条件的应用:功能层面完全相同,但又区分“收费”及“免费”两个版本。接着,比较配对应用内、“收费”与“免费”版本索取权限的差异,有以下结果:在约40%的配对样本中,“免费”版本索取更多与隐私数据相关的权限;几乎没有“收费”版本索取更多权限的例子[2]


韩国女明星图片_数据隐私、用户规模与企业存亡:来自三十万款应用的证据

  图1 将应用下载量对收集数据类型回归得到的结果。纵轴:数据类型;横轴,收集特定类型数据对下载量的影响,小方格是估得系数,横线是置信区间。方格愈近右侧,则收集此类信息对下载量的影响愈大

  将应用下载量对收集数据类型回归,即得另一结论:其二,“是否收集特定类别敏感信息”这一点,与应用下载数量间存在显著的负相关。如上图所示,无论是借通讯网络数据获取粗略的位置,还是由GPS获取精确位置,抑或采集通讯录信息,再到读取短信、电话等数据,以上都与应用下载量间存在负相关。其中,后两类行为造成的负面影响尤其大。

  后续,借助严格的计量分析,文章“坐实”了上述两类结论。一方面,与上文呼应,分析控制了类别、评级、大小、版本、开发者信息、应用描述等诸多变量。另一方面,为解决遗漏变量、价格与隐私数据内生决定等问题,文章进一步采取以下三类估计方法:其一,采用多个工具变量;其二,采用带应用固定效应的模型设定;其三,用配对样本估计

  估计所得与直观统计一致:敏感数据,堪比真金白银。对开发者而言,隐私与金钱的权衡存在:相比不收集任何敏感信息的应用,至少收集一项敏感信息的应用,免费概率要高3.5%-14.7%。这一权衡在用户层面同样存在:每多收集一项敏感数据,应用的下载量都将因此下降约10%。无论是否用配对样本估计,还是采取何种敏感数据指标,结论均稳健。

  以下结论同样值得关切:是否收集敏感数据,影响到应用在2012-2014年的发展状况。简言之,控制各因素后,相比那些不收集敏感数据的应用,收集敏感数据的应用仍然存续的概率要低4-8%只考虑那些仍然存活的应用,后者的用户增速也显著慢于前者。原文还发现:应用的用户基数[2]大,则隐私影响相对较小;用户规模小,则相应影响尤其突出

  总之,凭倚恢宏的数据规模及扎实的分析方法,本文印证了以下结论:当今社会,隐私就是“真金白银”;拿走隐私,需要付出代价应用开发者考虑这一点,在收集隐私与应用定价间权衡;用户考虑这一点,离弃那些侵犯敏感数据的应用;对隐私的关切程度,甚或决定一款应用的成长与兴衰。监管、用户和企业,或许都可从这篇文章读出相应的裨益。

  [1] 参与者抽取及相应调查均在MTurk平台上进行。

  [2] 相应数据来自Alexa。

  文献来源:Kummer, Michael,and Patrick Schulte. "When private information settles the bill: Money andprivacy in Google’s market for smartphone applications." Forthcoming,Management Science.