巴尔的摩 Builds a Data Dictionary

通过收集和整理不同数据,政府机构正在创建信息存储库,以协助决策。

by / November 25, 2013

在巴尔的摩,CTO Chris Tonjes希望一个地方的所有数据。所有的。他’S看着水使用,运输,疾病控制,紧急服务,雪拆卸数据。

“我们真的希望收集一切,” Tonjes said. He isn’t just hoarding. He’S采取所有信息,按摩普遍无障碍格式,然后在18个城市机构的规划人员中提供。

弗吉尼亚州在整个教育系统中尝试了哪些巴尔的摩。通过创造他们的“data dictionaries,”这些IT团队中的每一个都试图将不同的数据转化为可以在一系列关键利益相关者之间容易地共享的东西。

信息共享

曾完成,巴尔的摩’■新的综合数据库将使用户无法访问市政信息。 Tonjes描述了一种情况:假设警察注意到特定街区的停车票中的浪涌。通过交叉引用运输数据,该警察可以通过对街道上缺少迹象的报告配对最近的票据来节省大量巡逻时间。

在更严重的情况下,公共卫生人员可能会追踪可能表明污染水的水有关投诉的疾病爆发。

这将使这成为可能。“它满足了对我们的压力需求,因为我们有45个在一个非常旧的大型机上运行的遗留应用程序,” Tonjes said. “通过从大型机中拉出数据并将其放入关系数据库中,我们可以做很多有趣的事情。”

他预计将拥有一家基本的仓库,这一财政年度建立了一个全面的分析工具的原型设计,此后很快就能跟进。该部门没有特别的预算:它’既与内部资源做过。

实习生援助

这些资源由约翰霍普金斯大学的计算机科学实习生补充。劳动是’t free —每六个月花费约5,000美元’为三个实习生工作— but Tonjes said it’s worth it.

实习生正在做大量沉重的举重。由于遗产系统不’t sync today, it isn’可以自动制表现有数据库存。相反,实习生在整个城市的IT经理收集信息,一对一。

“他们正在做所有的面试,创造巨型电子表格,与人交谈并表现出的东西。他们是正在做挖掘和侦探工作的人,这是非常有帮助的,” Tonjes said.

“这不是小小的壮举,我们知道,”Heather Hudson,巴尔的摩说’首席数据官。“它将需要很多手动工作,查看数据并找到这些关系。然后一旦我们看到我们拥有的东西,下一篇文章将是数据治理规则和标准化。”

在Johns Hopkins,管理员表示,该项目有助于进一步将学校纳入其城市的生活。“It’对大学以这种专业知识提供支持城市的肯定。它’大学对社区和市政府的深刻领带来说很重要,”大学计算机科学系副教授兰德伯恩斯表示’S Whiting Engineering学院。

努力同样有助于制定未来的劳动力。“我们的许多课程专门用于帮助人们在数据和云环境中工作,” said Burns. “It’巴尔的摩已经成为一个可以使用这些技能的地方。”

拓展议程

这不是城市’首先努力将其手动电子表格转换为更广泛可用的东西。相反,数据字典遵循称为CITISTAT的早期程序的高跟鞋。

在2009年推出,努力通过汇集来自多个机构的数据来使市政府更负责任,责任和成本效益。该词典采取了什么是绩效管理计划的原因,并扩展了概念,以在整个城市代理商中包含广泛的指标。

更广泛的议程具有某些技术障碍。对于一件事,现有的平面数据必须转换为关系数据库,尽管自动化例程最终可能会在任务中最终接管这项任务,但是必须先手术数据库。

与此同时,数据完整性可以在现有平台中粗略。例如,2007年,由于人为错误,可以轻松显示为2077。“所以这样做的另一个好处将是改善整个委员会的诚信,即使在不遵守的系统中’t自动拥有那种完整性,” Hudson said. “我们的数据将被清理为自然副作用。它在技术上是可行的;它’只是需要大量的努力。”

教育优势

巴尔的摩’IT规划人员不是唯一一项努力的人。在弗吉尼亚教育部,教育信息管理办公室主任伯纳加拿大希望在该州核开777个数据要素’S的学生机构,以明显的元素开始,如性别,种族,考试成绩,后期入学和从那里钻井。

弗吉尼亚纵向数据系统于2013年8月居住,由2010年美国复苏和再投资法案获得1750万美元。除此之外,该资金提供了200万美元,以帮助学区提高数据质量,并在三所大学和所有23个国家资助的电子成绩单开发’S社区学院。

除了教育部,努力的球员还包括弗吉尼亚,弗吉尼亚州就业委员会和弗吉尼亚州社区学院制度的国务院高等教育理事会。

规划者寻求为研究人员创造基于事实的信息,以及寻求开发未来劳动力的政策制定者。通过开发易于访问的硬数据池,“我们可以回答问题决策者使用真实数据要求,”该教育部的项目经理和数据字典的牵头开发人员表示将Goldschmidt。

和弗吉尼亚州巴尔的摩一样’在现有系统的不同性质和缺乏普通格式的情况下,努力受到阻碍。使事情更复杂,机构希望保留这些特质。

“我们的一个挑战是,每个机构都希望在我们存储和表征数据的方式方面保持其自主权,”加拿大说。作为妥协,每个机构仍然以自己的格式创建数据;它的方式进入了词典,然后常用元素被剔除并链接,同时保持基本结构完好无损。

该系统有助于克服其他问题:学生数据应该为研究目的是根本匿名的。在使数据可连接,IT管理器同时“de-identify”它,剥离个人数据。“You’没有将在那里拥有您的姓名或社会安全号码。但它’没有完全匿名;它仍然有像你的性别和种族这样的东西,” Canada said.

它采取了一些熟练的外交来实现这一目标。“与此联合模式所看到的,18个月的谈论订婚规则,在各机构之间创造商务商程,” said Goldschmidt.

事实上,IT团队迄今为止携带第三方促进者,以确保所有球员之间的公平感。

这些努力已经是果实:国家’根据新可用的数据,S教育领导人在科学和历史中调整了某些标准。

“已经基于此合并的信息进行了策略行动,” Canada said.


永远不会错过每日Govtech今天的故事时事通讯。

订阅


亚当石 贡献作家

亚当石的经验丰富的记者拥有20多年的经验,涵盖教育,技术,政府和军队,以及不同的其他主题。他的作品出现了全国几十个一般和利基出版物。 

E.Republic平台& Programs