大数据的“路灯效果”:我们看起来的看法如何影响我们所看到的

大数据研究通常使用来自Internet的易于使用的用户生成的数据。研究人员假设此数据将窗口纳入现实。它不一定。

作者:俄亥俄州州立大学Mark Moritz / May 17, 2016

大数据为我们提供了世界上一个窗户。但是,大型和轻松的数据集可能不会向我们展示我们所居住的世界。例如,在西非最近埃博拉流行病的流行病学模型使用大数据始终高估了 疾病风险’s spread 并低估了这一点 当地举措 这在控制爆发方面发挥了重要作用。

研究人员对提供巨大的计算机化数据提供的可能性非常兴奋。但是在那里’哈哈待一会儿的理由考虑这个信息的真正提供了什么。当我们收集我们的数据时,像我这样的民族记录人使用跨文化方法,因为家庭,婚姻和家庭在不同的背景下意味着不同的东西。这种方法通知我如何考虑大数据。

We’所有人都听到了关于醉酒的笑话,被问及为什么他正在寻找他在路灯下的丢失钱包,而不是他认为他放弃了它。“因为这里的光更好,” he said.

这个“streetlight effect”研究人员研究易于学习的趋势。我在课程中使用这个故事 研究设计与民族图 解释为什么对教育结果中的差异进行如此多的研究是在教室中完成的,而不是学生’家。儿童在学校学习比在家里更容易,尽管很多 学习 表明了解课堂外面发生的事情很重要。尽管如此,学校将继续成为大多数研究的重点,因为他们产生了大数据和家园’t.

路灯效果是防止大数据研究在现实世界中有用的一个因素 –特别是研究通过Internet轻松分析用户生成的数据。研究人员假设此数据将窗口纳入现实。它没有’t necessarily.

看着怪人

基于数量 推文 例如,在飓风桑迪之后,它似乎可能是暴风雨袭击曼哈顿最难的,而不是新泽西州的岸边。另一个例子:自退休 谷歌流感趋势,2013年在2013年跟踪的在线搜索与流感症状有关以预测医生访问,但估计估计是疾病控制和预防中心的报告的两倍。如果没有检查地面上的事实,研究人员可能会愚弄自己以思考他们的大数据模型准确地代表他们旨在学习的世界。

问题类似于“奇怪的”许多研究研究中的问题。哈佛·赫里希和同事教授已表明了基于美国大学与本科生进行的研究的调查结果–他们描述为谁“地球上的一些最具心理上不寻常的人” –仅适用于该人口,不能用于对其他人口的任何索赔,包括其他美国人。与心理学研究中的典型研究主体不同,他们争辩,世界上大多数人不是来自西方,受过教育,工业化,富裕和民主的社会,即,奇怪。

Twitter用户也与其他人类相比是非典型的,从而产生了我们的博士后研究员 Sarah Laborde. has dubbed the “WEIRDO”数据分析问题:大多数人不是西方,教育,工业化,丰富,民主和在线。

上下文至关重要

了解绝大多数人类之间的差异以及在大数据集中捕获的活动的小型子集对纠正数据分析至关重要。考虑数据的上下文和含义–不仅仅是数据本身–是民族志研究的关键特征,争辩说 迈克尔琼尔,谁写了关于民族教学人员如何理解世界的写作。

是什么让研究民族界化?这不仅仅是方法。它从关于世界的根本假设开始,这是一个最重要的是,其中人们以不同方式看到和体验世界,给他们不同的观点。其次,这些差异由于成长并生活在不同的社会和文化环境中。这就是为什么奇怪的人不喜欢地球上任何其他人。

那么,什洛拉伯特的任务是翻译他们研究他们观众的观点的人们的观点。发现其他观点要求民族记录人员通过多轮数据收集和分析,并将他们学习的人们的概念纳入其理论模型的发展。结果是世界上良好的展示的模型–一些分析的大数据经常挣扎以实现。

这是我自己研究的一个例子 移动牧民。当我试图在喀麦隆的Logove洪泛区制作我的学习区地图时,我认为这个地方有边界,作为分离密歇根州的俄亥俄州。在多次访谈和观察之后,我才能得知洪泛区的地方更好 开放系统像哥伦布和安娜堡一样,没有任何边界。想象一下!

大学教师’给我错了:我认为大数据很棒。在我们的跨学科研究项目中学研究 传染病的生态学耦合人和自然系统的政权转变,我们正在建立自己的大数据集。当然,它们并不像推特或谷歌用户那样大,但足够大 复杂性理论的分析工具 对数据感到有用,因为我们研究的系统不仅仅是其部分的总和。

此外,我们知道数据所代表的是什么,如何收集它以及其限制是什么。了解数据的上下文和含义使我们能够检查我们对我们对世界知识并验证我们的模型的调查结果。例如,我们使用喀麦隆的调查和GPS技术的组合来收集关于牲畜运动的数据来构建 计算机模型 并检查其对口蹄疫的影响。因为我们知道他们移动的牧民和地区,我们可以检测到错误并解释数据中的模式。

对于有用的数据分析,需要是理论或问题驱动,而不是通过容易可用的数据驱动。它应该更像是民族志研究,数据分析师从他们的实验室摆脱,并与他们瞄准的世界搞。谈话

马克莫里茨,人类学副教授, 俄亥俄州州立大学这个article was originally published on 谈话。阅读 来源文章.


永远不会错过每日Govtech今天的故事时事通讯。

订阅


E.Republic平台& Programs