Boston Restaurant Inspectors Inspectors学习什么呢?

基于哈佛的启动驱动数据托管了一个开放式竞争,其中参与者使用餐馆数据来开发将预测潜在的健康码违规的算法。



这个故事最初是发表的 数据智能城市解决方案.



 

全国各地的城市正在寻找新的方法来使用其行政数据。但数据是我们周围的,而且城市通过形成战略性数据伙伴关系和挖掘在线人群的知识,可以获得显着的见解。 

这是启动新项目后面的前提 驱动数据询问:Boston Restaurant Inspectors的询问员可以从Yelp评论中学习什么?与yelp合作,驱动数据正在托管一个开放的竞争,其中参与者使用Yelp Restaurant数据和波士顿餐厅检查数据,返回2006年,开发将预测潜在的健康码违规行为,并帮助波士顿官员更有效地瞄准他们的检查。

驱动数据是一家初创公司,位于哈佛州的ILAB,与公共和社会部门组织合作,以确定可以使用机器学习解决的挑战。一旦驱动数据及其客户端框架问题,它就会在其在线平台上托管开放式竞争,用户竞争开发提供最佳预测的算法。数百名参与者提交算法,驱动数据测试对新数据的条目。使最准确的预测的代码获胜。

虽然成立不到一年前,但驱动数据已经证明了它通过众群数据科学提供帮助组织改善其业务的能力。在其就职项目中,驱动数据与当地非营利组织合作,帮助学校通过更快地规范和分析学校预算来改善他们的资金。通过通过驱动数据的在线竞争开发的算法,组织将节省75%的时间,分析学校预算,从而增加了高度专业化的工作人员可以投入到开发解决方案并到达更广泛的学校的时间。

随着它的成功竞争,驱动数据目前正在竞争中与yelp合作,帮助波士顿健康检查员对何处和何时进行数据驱动的决策。如今,波士顿使用其有限数量的卫生检查员进行所有食品机构的年检,以及现场检查,将视察员发送到从餐馆名单中汲取的地点。虽然检查员具有广泛的个人体验可能导致他们的检查,但他们缺乏一个系统,允许他们从过去的模式中学习或利用新数据来识别可能的代码违规网站。通过使用由驱动数据的参与者开发的算法,检查员将能够更有效地根据从历史模式和最新客户评论中汲取的知识进行现场选择。

Yelp正在为竞争提供数据,包括返回2004年的餐厅评论,用户信息,登记和商业元数据。这些评论与2006年10月至今的波士顿的餐厅检查清单和历史检查结果数据相匹配。可通过城市的开放数据门户网站提供。竞争对手将使用与过去违规行为联系在线评论的模式以预测新违规最有可能的地方。

竞争于4月27日推出,对公众开放,运行8周。一旦竞争于6月23日结束,驱动数据将在未来6周内测试对新数据的预测。与正常检查相比,他们将如何预测违规行为的算法,这三个顶级表现将奖励奖金总额为5,000美元。根据过去的竞争和当前社区的规模,驱动数据期望200到500次竞争对手。

虽然竞争在波士顿数据上绘制了波士顿数据,但该算法基于任何类型的审查,算法有可能改善任何城市的预测。挑战成立于算法的处理文本数据的能力,然后可以应用于从其他城市的yelp的评论或从任何其他在线聚合器的评论。所有条目都必须是开源的,因此该代码将可供波士顿,yelp或任何其他政府或公司的任何其他政府或公司提供,以帮助他们改善当地运营。

有兴趣的数据有兴趣帮助城市扩大他们对他们提供的数据的理解,并扩大其数据库社区。通过与公司合作伙伴合作,城市可以开发生产性数据伙伴关系模型,并利用城市居民和其他合作伙伴的集体见解来推动更聪明的政府。通过激励社区参与数据驱动的决策,城市可以在开发更好,更聪明的政府的过程中与公民互动。