大数据时代,我们应该享有“被遗忘的权利”

2014-06-03 赵斌 博客园

30多年前,著名未来学家阿尔文·托夫勒(Alvin Toffler)出版了一本划时代的巨著《第三次浪潮》(The Third Wave)。这本书将人类社会划分为三个阶段:第一次浪潮为农业阶段,约1万年前开始;第二阶段为工业阶段,17世纪末开始;第三阶段为信息化(或者服务业)阶段,从20世纪50年代后期开始,并将大数据称为“第三次浪潮的华彩乐章”。不过,“大数据”真正成为互联网信息技术行业的流行

30多年前,著名未来学家阿尔文·托夫勒(Alvin Toffler)出版了一本划时代的巨著《第三次浪潮》(The Third Wave)。这本书将人类社会划分为三个阶段:第一次浪潮为农业阶段,约1万年前开始;第二阶段为工业阶段,17世纪末开始;第三阶段为信息化(或者服务业)阶段,从20世纪50年代后期开始,并将大数据称为“第三次浪潮的华彩乐章”。不过,“大数据”真正成为互联网信息技术行业的流行词汇,是从2009年才开始的。也就是从这个概念受到重视开始,有关“大数据挖掘”与“个人隐私保护”矛盾的话题就不绝于耳。

前两年,维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的《大数据时代》卖得很火,其中部分章节也涉及到个人隐私保护的问题。不过,许多人可能没有注意到,维克托几乎同时还出版了一本姊妹篇《删除》:目前90%以上的信息为数字形式,让整个人类丢失了遗忘的天性,世界被设置成记忆模式,互联网记得你的一切,也就是说:记忆成了常态,而遗忘却变成了例外,个人隐私被侵犯的可能性也变大。这种数字记忆带来了两大威胁:信息控制权和永久过去创造的时空幽灵。在这个时代,任何东西一旦放上网络后,就永远有迹可寻不可能彻底被删除。《删除》的中译本中将副标题“The Virtue of Forgetting in the Digital Age”翻译为“大数据的取舍之道”,个人认为欠妥,并没有表达作者原本的含义,不如直译为“在数字时代遗忘的美德”。其实,读完本书就会发现,作者对于信息隐私的问题是持悲观态度的,因此并非谈取舍,而是强调删除和遗忘。从作者最后用三章的笔墨来提醒人们如何恢复遗忘功能中略见一斑,比如:来一场“互联网遗忘”运动,给信息一个存储期限,让遗忘回归常态。

我们可以坐在办公室,拍拍脑瓜,随便想到一个聪明且颇具战略眼光的观点:保护隐私不能因噎废食。但是,这并不能解决任何问题,因为人们潜意识中就一直会担心:如果个人无法真正地获得控制信息隐私的权利,一旦信息被共享,便意味着我们失去了对信息的控制能力。

上周出版的Science周刊中,以“大数据,大问题”(Big Data, Big Questions)为题发表了一篇新闻评论。文章主要是针对科研人员碰到的大数据悖论问题,所以文章开篇提出:研究人员是否可以利用“大数据”而不牺牲个人的隐私?隐藏在大规模数据集下的一些模式,例如通过智能手机应用、在线零售网站或临床试验所收集的数据,能对科学问题产生重要的见解,但共享这些数据很容易让侵犯隐私,导致住房、卫生保健和就业等领域的歧视。由白宫顾问John Podesta所主持的一个报告,要求采取大量的措施,加强对消费者、学生、病人以及其他人的隐私保护。对大数据技术维度的补充报告,主要在由总统科学技术顾问委员会(PCAST)完成,他们得出结论:技术措施本身并不足以保护隐私,建议所采取的政策应该更关注如何使用大数据,而不是如何收集和分析。提出这些问题,并不是一个对自己的技术或方法进行控诉,我们的目标是让大数据的优势得到最充分发挥,同时尽量减少隐私和其他方面的风险。

在过去4年,美国研发支出总体上持续下降了240亿美元。但2012年白宫开始了一项跨越六个联邦部门和机构的2亿美元“大数据发展计划”。去年11月,美国白宫发起“从数据到知识再到行动”(Data to Knowledge to Action),将分别针对医疗研究、地理信息、经济和语言学等多个领域进行研究(http://news.rfidworld.com.cn/2013_11/1766891ff5ce0150.html)。美国总统2015年财政年度预算也将为几个相关的项目提供资金,包括美国国家卫生研究院的“大数据向知识转化”计划(BD2K)和美国能源部的先进科学计算研究项目。BD2K项目将发展多种标准、工具、软件和其他方法来利用由健康和医疗研究领域所生成的大量数据。其中许多问题就是在大数据挖掘与个人隐私保护之间进行博弈。

“我们生活在一个美好的新世界,数据是一种商品,访问数据是一种预期”基因泰克(Genentech)集团医疗主管Ariella Kelman在一个有关科学重现性的论坛会议中如是说。在临床试验中积累巨大数据集的制药公司,其信息访问历来被限制在公司研究人员、合作者和像FDA的监管机构中,但是现在他们在重新考虑数据共享方式。去年,美国药品研究与制造商和欧洲制药行业与协会等两个行业贸易组织,联合会发布了共同准则,旨在推动与患者、研究人员和公众更广泛地共享数据。

一直以来推动利用大数据进行科学研究的医疗卫生行业,也是受争议的最多的。个人DNA信息,是个人隐私还是公众信息或者是科研素材?虽然警方利用DNA信息在寻找杀人凶手的案件中屡建战功,但是,警方采集和利用DNA数据却可能伤害无辜大众的自由和隐私。今年4月14日,为了寻找性侵一名16岁少女的罪犯,法国检察官决定对全校527名男学生和员工进行DNA检验,如果拒绝接受检验者将被视为可能嫌犯。此举引发了侵犯人权的疑虑,美国Times认为这种做法在美国是不被允许的(http://news.163.com/14/0415/09/9PS608UF00014JB6.html)。

谷歌一直为默默无闻记得大家许多事儿而引以为豪,但是最近发生的一件事儿,让谷歌搜索引擎及网络出版商颇为失望:一名西班牙人在谷歌搜索中,发现自己房屋被银行收回拍卖的信息,他认为这样的搜索结果侵犯了他的隐私,要求谷歌删除相关搜索结果。欧洲法庭在5月初对此做出了裁决,判定西班牙人胜诉,这意味着欧盟居民今后在互联网隐私方面,有了相关的法律判例依据。于是,谷歌5月30日放出一个在线表格,让人们提交申请删除个人用户在互联网上的全部搜索信息,短短一天时间收到了欧洲居民12000多个请求,要求还给他们“被遗忘的权利”(从网络上删除与自己相关的电子信息的权利),当然目前该权利仅对欧洲居民开放。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1987100, encodeId=d9e5198e10061, content=<a href='/topic/show?id=597943e318d' target=_blank style='color:#2F92EE;'>#大数据时代#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=41, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=43731, encryptionId=597943e318d, topicName=大数据时代)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=734374, createdName=gjsgj, createdTime=Wed Jan 07 17:33:00 CST 2015, time=2015-01-07, status=1, ipAttribution=)]

相关资讯

科学家解读流感病毒:或可用大数据预测暴发

今冬,H7N9禽流感“卷土重来”。最近几日,各地又陆续出现了不少确诊病例。为何流感病毒总对人类“死缠烂打”?人类是否能够战胜拥有庞大亚型且变异迅速的流感病毒?昨晚做客第174期新民科学咖啡馆的两位科学家表示,在人类和流感病毒之间的这场永不停歇的“军备竞赛”中,科学研究跟踪病毒的脚步近年来已快了许多。 今冬H7N9“大流行”? 流感病毒的个头实在是太小(100纳米),只有头发丝直径的千分之一

李兰娟:云计算与大数据将成为医疗改革利器

“第六届中国云计算大会”将于2014年5月20-23日在北京国家会议中心隆重召开。本次大会将历时四天,内容更加精彩,预计参会者将大大超过上一届的12000多人次。每届中国云计算大会,都有两院院士的精彩演讲。本届大会上,李德毅、怀进鹏、倪光南、李伯虎、杨学军、张尧学、李未、梅宏、高文、李兰娟等10位两院院士将集体亮相,与广大参会者共同把脉云计算与大数据的未来技术发展和应用方向。大会召开前夕,CSDN

肿瘤大数据公司Flatiron获google 1.3亿美元投资

Flatiron Health主要业务是开发收集临床记录、缴费记录和基因组等数据的软件。 5月8日消息,谷歌风投(Google Ventures)日前展开了公司历史上最大一笔医疗软件投资,该公司将为大数据肿瘤医疗行业创业公司Flatiron Health提供1.3亿美元融资,并希望今后医生能够根据该公司所收集的数据作出更加精确的临床诊断。早期风险投资公司First Round Capital、

李嘉诚捐300万美元助斯坦福牛津研究医疗大数据

    美国斯坦福大学23日表示,该校医学院又获李嘉诚基金会捐赠300万美元研究“大数据”,将与英国牛津大学合作,利用庞大生物医学数据库改善人类健康,减低医疗成本。    斯坦福大学称,“大数据”被视为生物医学科学的下一轮革命,有助在减低成本的同时,加快开发新药及为病人提供更佳的个人化疗程。    英国生物样

PNAS:改善大数据集分析的准确性

日前,来自哈佛医学院等机构的研究人员发现,整合了交叉验证的一种数据集分析技术可能有能力识别出从生物信息学到语言学等领域的多维数据集的模式。 对大数据集的自动分析可能识别出数据的模式,但是无法评估发现的模式的显著性,这可能导致无意义的结果。 研究人员发展了一种数据分析方法,它包括了一个交叉验证步骤,从而识别出最显著的模式,这种方法称为通过准确性最大化的知识发现(KODAMA)。一个迭代过程评估了

百度开放的大数据引擎将如何改变医疗和交通

还记得百度斥巨资建立的致力于人工智能技术开发的深度学习研究院么?接下来,它将不再只为百度自己所用了。而且,百度的其它大数据技术也将会与它一起走出象牙塔。 昨天,百度正式开放了其名为“大数据引擎”的技术体系。简单来说,“大数据引擎”指的是对大规模的数据进行收集、存储、计算、挖掘和管理的一套系统。通过百度的深度学习技术和数据建模技术,能够让数据分析变得更实时和精准。此前,百度已经将这些技术用在了自