Reed数据科学家想要保护你的隐私

教授们获得了美国国家科学基金会的资助,以寻找保护存储在巨大数据库中的个人信息的方法。

作者:Ian Buckman, 18岁 | 2018年10月18日

一个由威博体育研究人员组成的跨学科团队从美国国家科学基金会(National Science Foundation)获得了34.5万美元的资助,用于开发新的方法来保护越来越容易被无意中暴露的个人数据。

在一个数据为王的世界里,从政府机构到跨国公司再到医院系统,无数组织在他们的数据库中维护着tb级的信息。这些丰富的数据对各个领域的研究人员来说都是一座金矿,有可能回答各种各样的问题,但也有一个障碍。即使数据所有者删除了明显的标记,如您的姓名、地址和社会保险号,人们也经常可以追踪到您的信息。例如,2014年,纽约市出租车和豪华轿车委员会(New York City Taxi and Limousine Commission)应信息自由要求,发布了一个巨大的出租车乘车数据库。该委员会试图将这些数据匿名化,但有魄力的记者们拼凑出了各种线索,找出了名人乘坐的汽车。

而这仅仅是个开始。大多数美国人可以通过三条信息来识别:出生日期、威博体育和邮政编码。由于无意中侵犯隐私的风险如此之高,许多组织已经将他们宝贵的数据锁定在研究人员之外。

Adam Groce教授(计算机科学)、Andrew Bray教授(统计学)和Anna Ritz教授(计算生物学)正在围绕差异隐私的概念,为这个问题提供创造性的解决方案。在差分隐私中,研究人员不能直接威博体育数据库,而是通过一个向输出添加数字“噪声”的系统进行查询,使研究人员能够获得他们需要的值,但不能获得潜在的身份。b谷歌、苹果(Apple)和优步(Uber)等公司已经开始使用这种方法,但社会科学和医学领域的研究人员迄今为止在这方面进展缓慢,因为他们担心噪音会影响他们的结果。

威博体育的教授和他们的学生计划开发一种算法,使研究人员能够使用标准的统计工具来测试特定的假设(居住在邮政编码97202的地区是否与心脏病发作的可能性更高相关?),同时保持不同的隐私。

正如格罗斯教授所说:“我认为,研究是我工作的一部分的主要原因之一。让来自不同领域(计算机科学和统计学)的学生一起工作,以这种协作的方式分享他们的专业知识,这也很棒。”

处理这个项目需要跨学科的方法。“计算机科学非常擅长思考什么构成隐私以及如何保护隐私,”Groce教授说,“而统计学研究如何有效地分析数据,并有很好的工具来理解特定分析的有用性。”

标签:酷项目,学者,机构,奖项和成就