人们想要数据隐私,但并不总是知道他们得到了什么

差异隐私让人们匿名分享数据,但人们需要更多地了解它来做出明智的决策。

By Gabriel Kaptchuk,波士顿大学;埃尔萨达M. Redmiles,Max Planck Institute;和雷切尔卡明,格鲁吉亚理工学院 / October 21, 2020
差异隐私让组织在保护隐私的同时收集人们的数据,但这并不是万无一失。 shutterstock / song_about_summer.

特朗普政府’s move to 禁止热门的视频应用程序tiktok 引起了担心中国政府收集使用该应用程序的人的个人信息。这些恐惧强调了成长 担心美国人对数字隐私 generally.

隐私辩论似乎很简单:有些东西是私有的或它’没有。但是,提供数字隐私的技术是简单的。

我们的数据隐私研究表明人们’部分犹豫不决,部分分享他们的数据茎,部分不知道谁可以访问它以及收集数据的组织如何保持私密。我们’ve还发现,当人们知道数据隐私技术时,他们可能无法得到他们所期望的。

差异隐私解释

虽然有很多方法可以为分享数据的人提供隐私,但 差异隐私 最近被出现为领先的技术,是 快速采用.

想象一下,您当地的旅游委员会希望了解您所在地区最受欢迎的地方。一个简单的解决方案是收集您从移动设备访问的所有位置的列表,将其与您所在地区其他人的相似列表组合,并计算每个位置的频率。虽然有效,收集人’以这种方式的敏感数据可以具有可怕的后果。即使数据被剥离了名称,也可能 数据分析师或黑客仍然可以识别和秸秆.

差异隐私可用于保护每个人’S个人数据,同时收集它的有用信息。差异隐私伪装个人’信息通过随机更改他们访问过的地方列表,可能是通过删除某些位置并添加其他位置。这些引入的错误使得几乎不可能比较人们’S信息并使用消除过程来确定某人’S身份。重要的是,这些随机变化足够小,以确保摘要统计数据–在这种情况下,最受欢迎的地方– are accurate.

 

 

美国人口普查局正在使用差异隐私来保护您的数据在2020年人口普查中。

 

 

在实践中,差异隐私ISN’完美。必须仔细校准随机化过程。太多的随机性将使摘要统计数据不准确。太少会让人们容易被识别。此外,如果随机化在每个人之后发生’已经收集了未改变的数据,在某些版本的差异隐私中是常见的, 黑客可能仍然可以获得原始数据.

当差异隐私是 于2006年开发,它主要被视为理论上有趣的工具。在2014年,谷歌成为第一家公司,以便在公开使用差异隐私 数据采集.

从那时起,Microsoft,Google和美国普查局正在部署使用差异隐私的新系统。 Apple使用它 电机学习算法 无需查看您的数据,Uber转向它以确保其内部数据分析师 能够’t abuse their power。差异隐私通常是 作为在线广告业的解决方案’s privacy issues 通过允许广告商学习人们在没有跟踪个人的情况下如何回应他们的广告。

合理的期望?

但它’并不清楚称重是否分享数据的人有明确的期望或理解差异隐私。

在7月,我们作为研究人员 波士顿大学, 这 格鲁吉亚理工学院微软研究和Max Planck Institute,调查了675名美国人评估人们是否愿意以其数据信任差别的私人系统。

我们根据公司,媒体网点和学者使用的那些,创建了差异隐私的描述。这些定义范围从重大的描述中,专注于差异隐私可以允许公司做些什么或保护它保护的风险,这些描述专注于现在使用它和描述的许多公司的信任,以简单地说明差别隐私“数据隐私保护中的新金标准,”由于人口普查局描述了它。

我们被调查的美国人的报告可能是两倍的可能报告,如果他们使用这些定义之一被告知他们的数据,他们愿意分享他们的数据,因为他们的数据将受到差别隐私的保护。然而,描述了差异隐私的具体方式并没有影响人们’倾向于分享。仅仅是隐私的保障似乎足以改变人’对谁可以访问他们的数据以及在黑客发生时是否安全的期望。反过来,这些期望驱使人们’愿意分享信息。

困难,人们’对于如何保护其数据的期望将具有差异隐私并不总是正确的。例如,许多差异隐私系统无需保护用户数据免受合法的执法搜索,但20%的受访者预期这种保护。

这一混乱可能是由于公司,媒体网点甚至学术界描述了差异隐私的方式。大多数解释侧重于差异隐私所做的或它可以用于什么,但很少能突出差异隐私可以和可以’t防止。这让人们在差异隐私提供的保护方面得出自己的结论。

建立信任

为了帮助人们对他们的数据进行明智的选择,他们需要准确地设定他们对隐私期望的信息。它’不足以告诉人们一个系统遇到一个“gold standard”某些类型的隐私,无需告诉他们这意味着什么。用户应该’T需要数学学位,以做出明智的选择。

[深度知识,每天。 注册谈话’s newsletter。]

确定清楚解释差异隐私提供的保护的最佳方法将需要进一步的研究,以确定哪些期望对正在考虑分享其数据的人。一种可能性是使用像这样的技术 隐私营养标签.

帮助人们对现实的期望将其期望还需要使用差异隐私的公司作为他们的数据收集活动的一部分,以完全和准确地解释什么是和尚未解释的’保持私密,从谁身上。

加布里埃尔kaptchuk.,计算机科学研究员助理教授, 波士顿大学; Elissa M. Redmiles.,教师&研究团体领袖, 最大普朗克研究所, 和 雷切尔卡明,工业与系统工程助理教授, 格鲁吉亚理工学院

本文已重新发布 谈话 在创造性的公共许可证下。阅读 来源文章.


永远不会错过每日Govtech今天的故事时事通讯。

订阅


E.Republic平台& Programs