基于大数据的预测监管的承诺和危险

预测犯罪在他们承诺之前只能与输入数据一样好 - 并且通常是数据具有错误。

the-convernation.png.
像其他人一样,警察部门希望在花费的同时更有效。鉴于巨大的关注 大数据 近年来, 它提供的价值 在从天文学到医学的田野中,警察部门正在使用数据分析,这不应该告知部署稀缺资源。输入所谓的时代“预测警务。“

某种形式的预测政策可能现在在您附近的城市中生效。 孟菲斯 曾是一个 早期采用者。城市 明尼阿波利斯迈阿密 拥抱预测的警务。时间杂志被称为预测政策(特别参考圣克鲁斯市)之一 2011年的50个最佳发明。纽约市警察局威廉布拉顿最近表示预测政策是“未来的浪潮。“

“预测政策”一词表明,警察可以预测犯罪,并在它发生之前停止它,并立即逮捕罪魁祸首。作为 洛杉矶时报指出,这取决于“对先前犯罪的信息复杂的计算机分析,预测将发生犯罪。”

在一个非常基本的层面,任何人都很容易阅读犯罪地图并确定具有更高犯罪率的社区。它也很容易认识到窃贼倾向于在晚上瞄准企业,当他们没有占用,当时在当天瞄准家园时,居民在工作中逃离时。挑战是采取几十个这样的因素的组合,以确定犯罪更有可能发生的地方,谁更有可能提交它们。在这种分析中,预测性警务算法越来越擅长。事实上,这是电影少数族裔报告的前提,其中警察在犯罪之前可以逮捕和判定杀人犯。

Image-20151113-10401-6G0YF5.jpeg.


汤姆克鲁斯,出去胸部犯罪。二十世纪福克斯
 


 

 

以确定性预测犯罪是科幻小说可以拥有野外日子的东西。但作为一个数据科学家,我可以向您保证,实际上我们可以靠近确定性,即使是先进的技术。首先, 预测可以与输入数据一样好,并且通常这些输入数据具有错误。

但即使是完美,无差错的输入数据和 无偏见的处理
,最终算法是确定的是相关性。即使我们对童年的陷入困境的完全了解,您与帮派成员的社会化,您缺乏稳定的就业,您的Wacko帖子在社交媒体和您最近的枪支上购买,所有最佳算法都可以做的就是说它可能是可能的,但是不确定,你将犯下暴力罪行。毕竟,相信这样的预测,保证是否认自由意志。

饲料数据,释放概率

数据可以做的是给我们的概率,而不是确定性。良好的数据与良好分析耦合可以给我们非常好的概率估计。如果您在许多实例上占概率,则通常可以获得总计的强大估计。

例如,数据分析可以提供特定房屋将在特定日内闯入特定日子,基于该社区类似的房屋的历史记录。保险公司可能会在一年内所有的日子加入这一点,以决定保险房屋的收费多少。

警察部门可以在社区的所有房屋中增加这些概率,以估计在该社区中会有入室盗窃的可能性有多大程度。然后,他们可以将更多的官员在邻居中占据更高的犯罪概率,以便警方存在可能会阻止犯罪。这似乎是一系列胜利:较少的犯罪和有针对性地利用警方资源。事实上,统计数据 减少犯罪率支持我们直观的期望。

 

 

 

Image-20151113-10438-UCYQR5.PNG
预测政策超出了仅在犯罪已经发生的地方。 布雷特林德, cc by-sa
 

 

 

可能并不意味着肯定

类似的参数可以在我们面临有限的资源的多个竞技场中使用。现实地,海关代理不能彻底搜索每个乘客和每个包。税务机关无法审核每纳税申报表。所以他们定位“最有可能”的罪魁祸首。但可能性远非确定性:所有当局都知道的是赔率更高。毫无疑问,许多无辜的人都被标记为“可能”。如果你是无辜的,但被定位,它可能是一个大的麻烦,或者更糟。

有针对性的个人可能因海关搜索而不便,但预测性警务可以做出真正的伤害。考虑最近泰隆棕的案例 在纽约时报报道。他专门针对堪萨斯市警方的关注,因为他是已知帮派成员的朋友。换句话说,该算法挑选了他的犯罪,以基于他保留的公司犯下犯罪的可能性。他们告诉他他正在被关注,如果他滑倒,就会严重处理。

算法在挑选泰隆棕色这样的人时没有“犯错误”。它可能已经正确确定蒂蒙比你或我更有可能犯下谋杀案。但这与说他所做的(或遗嘱)杀死某人。

假设一个典型的公民将犯谋杀的一百万百万的机会,但蒂隆的速度是一千的机会。这让他成为谋杀罪的一千次,作为典型的公民。因此,警方将注意力集中在他身上,因此统计上有统计学意义。但不要忘记,他只有一个人犯下谋杀罪。对于千言万语的蒂森,只有一个是凶手和999人是谁是无辜的。我们愿意给您带来的不便或伤害999才能阻止这一点多少钱?

堪萨斯城远离这种先发制人的抢先接触,与被确定为“可能犯下犯罪”的公民。去年,有 相当大的争议 在芝加哥的类似程序。

 

 

 

图像-201113-10427-6wyr4f.jpg.
预防犯罪是目标,但个人自由是一种伤亡吗? IBMPhoto24., cc by-nc-nd

 

 

平衡犯罪减少民权

这种策略,即使有效减少犯罪,提升 公民自由担心。假设您适用于糟糕驱动程序的个人资料,并在您的驾驶记录中积分积分。考虑你在每次在车轮后面跟随你的巡逻车,你会感觉如何。更糟糕的是,它可能是,即使你正在尽力而为,你会偶尔的错误。对于我们大多数人来说,通过止挡标志或驾驶五英里以上的速度限制通常几乎没有结果。但由于您追随着您的警察,您可以为每一个小型犯罪进行一次票。结果,您最终会更加糟糕的驾驶记录。

是的,数据可以帮助提出预测,这些预测可以帮助警察节约他们的资源更聪明。但我们必须记住,当我们基于概率采取行动时,概率预测并不确定,并明确考虑对无辜人民的伤害。更广泛地说,数据科学可以带来许多好处,但需要注意确保它确实如此 manner.

谈话


h v jagadish.,伯纳德是电气工程和计算机科学教授的Galler Collediate教授 密歇根大学. 本文最初发布 谈话。阅读 来源文章.