美国人口普查合作利用数据的社会问题解决效用

美国人口普查局与Austin的Data.World合作,以集成和简化其数据在亚马逊Web服务云中,使得州,县和城市更容易使用。

by / May 8, 2017

国家’下断批发人口数量仍然超过两年,但美国人口普查局官员不仅准备在线迁移该进程— they’RE还与私营企业合作,设计了为每年共享美国社区调查(ACS)数据的更好方式’s produced.

自1790年以来每年进行每十年,人口普查是国家调查的居住。但随着官员快速指出,它侧重于人口。那’根据为什么人口普查在2005年与ACS一起生活,较短的考试,以约350万个收件人在一起看着社会经济,住房和人口统计数据。

Gerson Vasquez是美国人口普查局的数据传播专家,称官员打算回应2020年人口普查 在线的 并通过更传统的电话,纸张形式和人员访谈。

但对于过去的一年来说,他们’ve也与奥斯汀公共福利公司合作 data.world.,它正在建立“世界上最有意义,协作和丰富的数据资源”,利用数据的“社会问题解决实用性”。

目标是更好地整合和简化ACS数据的各种组成部分,使得它们更容易被国家,县和城市使用。

ACS数据,Vasquez表示,具有强大的特性层,但最近公平地,其格式—包括PDF,以及CSV和FTP的较大数据文件— weren’T容易被公共机构或居民使用。

数据.World与美国人口普查局之间的合作,于3月份在Southwest(SXSW)收集的年度南部宣布,旨在改变这一点。它开始了当公司通过相互联系的公司与美国人口普查局联系,并申请国家科学基金会拨款,以对人口普查的一个语义模型进行资金。

由学生Jonathan Ortiz工作的工作是如此密集的公司雇用了ortiz全职完成它和几个衍生项目。

ortiz,现在是一个数据科学家和知识工程师,将讨论 他的工作 在5月12日星期五的突破会议期间,今年’s ACS数据用户组会议 在华盛顿,D.C.,在标题的一段“利用链接数据:对ACS数据应用的语义Web技术。”

“我们所做的很多工作是,因为人们正在进行数据工作,找到数据集之间的连接。我们将人口普查数据视为真正的数据集的超级连接器。许多数据分析项目可以使用人口普查数据,这么多可以与[那]相关,” data.world CTO 和联合创始人布莱恩·雅各布告诉 政府技术.

他解释了Ortiz,其他人想要完成策划人口普查数据并在其周围构建本体“以机器可读方式描述人口普查中的过程。 ”

以前版本的人口普查数据已经使用数据字典来提供连续性,因为元数据的来源解释了人口普查数据中的内容,而是单独的。 data.world组合和自动化这些源,创建一个以2014 ACS和适应后续版本启动的进程,为用户提供努力工作。

“它们创建了一种可摄取的方式,而不仅仅是(ACS)的输出,您可以将其视为数据库或行和列,而且还摄取了描述了所有单个单元值的元数据,”美国人口普查局首席营销官Jeff Meisel表示。

他解释说,超级连接器概念意味着数据科学家可以“更快地进入研究研究问题的艺术,并在没有这种大规模的学习曲线的情况下创建数据模型‘what’s in the data?’”

亚马逊,梅内尔告诉 政府技术,了解到研究和自愿举办完整的数据集,现在包括专注于从收入到贫困的一切以及外国诞生健康保险的个人股票。

“数据科学家现在可以转到云端,他们可以旋转自己的[亚马逊]弹性计算云实例,并开始建立副本,以便在云中研究他们的研究。那里’说明书和那里’S的一种方法论如何做到这一点,” he added.

人口普查官员表示,合作是如此之态’T产生了任何用例—虽然他们已经可以看到潜力。

去年,Vasquez表示,新奥尔良消防部门和新奥尔良的履约办公室使用 来自ACS的块组级数据 五年估计分配超过10,000 烟雾报警 到有需要确定的房屋。

“It wasn’t必须由data.world或这种连接驱动—这仍然比较新。但为什么不能’t it be? Why couldn’它以更快的格式在整个国家中复制,因为基础架构就在那里。因为人们越多,我们的数据,我们拥有的伟大故事越大,” Vasquez said.


永远不会错过每日Govtech今天的故事时事通讯。

订阅


Theo Douglas. 贡献作家

Theo Douglas.是Techwire.net的助理管理编辑,之前是一名员工作家 政府技术。他的报告经验包括涵盖市政,县和州政府,业务和突发新闻。他拥有报纸新闻和历史硕士学位的学士学位,既来自加州州立大学,长滩。

E.Republic平台& Programs