我想要你的(匿名)社交媒体数据

通过详细的见解平衡个人隐私。

由华盛顿大学安东尼桑福德 / June 6, 2018
Shutterstock

 

社交媒体网站’ responses to the Facebook-Cambridge Analytica Scandal新的欧洲隐私法规 给了用户 更加控制 谁可以访问他们的数据和 目的是什么 。对我来说,作为社交媒体用户,这些都是积极的发展:它’对思考这些平台可以与我提供的数据的贸易组成的人进行恐慌。但 作为研究人员 ,增加对数据分享的限制担心我。

我是依赖社交媒体数据的许多学者中,以获得人们的洞察力’行动。急于保护个人’隐私,我担心意外的伤亡可能是关于人性的知识。例如,我最近的工作, 分析人们在推特上表达的感情 解释为什么股票市场在一天的过程中波动得如此多。融资超出了申请。其他学者已经研究过 群众过境骑手满意度, 紧急警报系统’自然灾害期间的功能 以及在线交互方式 影响人们’渴望引领健康的生活方式.

这造成了困境–不仅仅是对我而个人,而且整个社会。大多数人都不’除非特别是,否则希望社交媒体平台分享或销售他们的个人信息 由个人用户授权。但作为集体社会的成员,它 ’对于影响日常生活和长期趋势的工作中的社会力量有用。在最近的危机之前,Facebook和其他公司已经努力努力 合法的研究人员使用他们的数据 ,包括由 使它更加困难和更昂贵 下载和访问分析数据。 regewed的隐私压力意味着它’甚至可能会变得更加强硬。

在研究中使用社交媒体数据

It’肯定令人震惊的是考虑人们或公司可能会分析我的数据并找到影响我做出决定的方法,以免–或者甚至与我自己的最佳利益相反。我只需要思考我的次数’在体育赛事期间看到披萨的电视广告,并订购了披萨。

那’营销点,当然–但社交媒体不同,因为这些信息是关于我的专门。并使用该信息可以 影响不仅仅是我买的食物,如我投票的那样。然而,作为财务的研究人员,我也认识到,相同的数据可以用来帮助我们理解否则无法解释的集体行为。

例如,我的一些研究探讨了股价的短期趋势。金融专家发现,一家长期来看,一家公司’S股票价格由公司驱动’未来的价值。然而,在任何一天的过程中,股票价格可能很大。许多金融研究人员和金融分析师将告诉您,这些动作是毫无意义的噪音,看似随机的信息,有关影响投资者的公司的信息’感知和造成股票价格不断变化。

但是通过分析社交媒体数据,我实际上可以了解该噪音是什么,它来自哪里以及它的意思。例如,人们在Twitter上写下关于新iPhone的东西会影响苹果’股票价格,有时在几分钟之内–但即使在几天内。效果的速度取决于发送推文的人的重要性或突出,以及其他人的速度–包括媒体–拿起消息。

我的研究结果可以帮助投资者微调他们进入市场的时间和方式。例如,如果社交媒体用户认为最新的iPhone不会像预期的那样好,那么投资者可能会妨碍他们对Apple股票的投资。这可能会让他们投资于以更好的嗡嗡声投资,希望更高的回报。

匿名数据

It’s true – and concerning –一些可能是一个不道德的人们试图为自己的利益使用社交媒体数据。但数据不是实际问题,切割研究人员’访问数据不是解决方案。这样做也将剥夺社会媒体分析的好处。

幸运的是,有一种方法可以解决这种困境。数据的匿名化可以保留人’S的个人隐私完整,同时给予研究人员可以获得可以产生重要见解的集体数据。

那里’甚至是如何有效地罢工的强大模型:美国人口普查局。几十年来,政府机构从全国各地的家庭收集了极具个性的数据:年龄,就业状况,收入水平,社会安全数量和政治附属机构。出版的结果非常丰富,但也没有追溯任何个人。

它经常在技术上是可能的 撤消数据的匿名保护,使用多个匿名信息来识别他们所有相关的人。人口普查局采取措施防止这一点。

例如,当公众访问人口普查数据的成员时, 人口普查局限制了信息 这可能识别特定个人,例如报告,一个人在一个社区中只有一个特别高或低收入的人。

对于研究人员来说,这个过程有些不同,但在法律和实践中提供了重大的保护。学者必须通过人口普查局’S审查过程以确保它们是合法的,并且必须接受有关他们可以且无法与数据进行的培训。违反规则的处罚不仅包括在未来使用人口普查数据,还包括民事罚款甚至刑事起诉。

即便如此,研究人员没有姓名或社会安全号码。相反,人口普查局使用它所谓的内容“ 受保护的识别键 ,” a 替换数据的随机数 这将允许研究人员识别个人。

每个人’S数据与他或她自己的识别键标记,允许研究人员链接不同类型的信息。例如,一名想要追踪人们完成大学学位需要多长时间的研究人员可以遵循个人’鉴于钥匙,教育水平随着时间的推移。

社交媒体平台可以实现类似的匿名过程,而不是增加障碍– and cost –访问他们的数据。他们可以分配用户识别号码而不是分享他们的真实身份,并同意政府法规定义谁可以获得什么数据,包括违反规则的实际处罚。然后,研究人员可以发现社交媒体使用所提供的见解,就像他们对人口普查数据一样,没有威胁人才’s privacy.

安东尼桑福德 ,博士后的家伙, 华盛顿大学

本文最初发布 谈话 。 阅读 来源文章 .


永远不会错过每日Govtech今天的故事时事通讯。

订阅


E.Republic平台& Programs