Blogs

Predicción del crimen: ¿una realidad?
  • Santiago González
  • 2659 Views
  • 0 Comment
  • Big Data . Crime Predicction . Innovation . Predicción de crímenes .

Según la OMS, una de las principales preocupaciones de la sociedad mundial en la actualidad es la violencia y el crimen. Tanto es así que, el principal objetivo de la policía y de los sistemas judiciales criminales es evitar que se produzcan más crímenes, creando para ello centros de inteligencia con el fin de intentar prevenirlos.

En este sentido, como director de innovación, e influenciado por la ciencia ficción, me propuse analizar esta situación. Usando el tradicional método científico, el primer paso fue plantear preguntas e hipótesis: ¿Es posible predecir crímenes en lugar, fecha y hora? ¿Con cuanto nivel de detalle? ¿Tenemos experiencia en esto? ¿Quién nos puede ofrecer información? ¿Alguien lo ha hecho previamente, y con qué resultados?

Gracias a nuestros trabajos previos (predicción de sentencias judiciales sobre crímenes mundiales a través de la aplicación SHERLOC, y predicción de incidencias producidas en Seattle), creímos saber las necesidades de datos en el proyecto. No obstante, se investigó acerca de quienes habían hecho algo similar.

En el año 2014, se licenció la herramienta PredPol, basada en cambios sísmicos, para predecir crímenes en Los Ángeles, Chicago y Redmon. En los años 2015 y 2016 aparecieron investigaciones de la Universidad Jaume I y de Granada, uno aplicado a la policía de Rivas y otro a los Ángeles. Sin embargo, en todos ellos, no se disponía de información pública accesible para comparar posibles resultados. Entonces, ¿Qué información se puede usar para el estudio?

Investigando e intentando contactar con nuestros ministerios y departamentos de seguridad, nos dimos cuenta que, a corto plazo, solamente podíamos disponer de información histórica de crímenes ofrecido por el OPEN DATA del City Hall de Nueva York. Con esta información, se realizó un análisis exploratorio estadístico, donde se obtuvieron datos curiosos sobre Nueva York: el barrio más peligroso es Brooklin, el mes con menos crímenes es enero, la franja horaria con más crímenes es de 15:00-19:00, y la que menos de 5:00 a 6:00, el viernes es el día con menos crímenes cometidos.

¿Suficiente? No, ni mucho menos. Nos basamos en la premisa de que el entorno nos puede ayudar a reconocer patrones y, por ello, siempre proponemos el uso de fusión de datos de diferentes fuentes. Fuentes como la meteorología, eventos, fiestas, información de desempleo, obras públicas realizadas, noticias impactantes del New York Times son ejemplos el uso combinado de datos proveniente de distintas fuentes.

Ya tenemos objetivo, tenemos los datos y tenemos la motivación. ¿Qué nos falta? Sin duda, los requisitos que ha de cumplir nuestro modelado para que el proyecto triunfe: que sea escalable (ampliable si disponemos de mas datos), reforzado (reentrenable continuamente), rápido (si ha de ser reforzado, ha de ser un modelo rápido) y robusto (estable ante cambios).

La solución contempló un modelo por cada tipo de crimen, 12 modelos en total, todos ellos basados en detección de anomalías. ¿por qué detección de anomalías? Porque, en realidad, podemos tratar un crimen como algo atípico, una anomalía, que solo se produce en contadas ocasiones.

Los modelos eran capaces de indicar si se producía un determinado tipo de crimen en un precinto policial determinado de Nueva York, en franjas de una hora y en un dia concreto. Cumpliendo todos los objetivos, se llegó a obtener un metamodelo que englobaba a todos los modelos, con una precisión de acierto (tanto positivo como negativo) de 72 casos de cada 100, siendo el modelo de asesinatos el mejor de todos ellos (con una precisión de hasta el 86%).

Al terminar el proyecto, comencé a debatir sobre la viabilidad y utilidad del proyecto. Y esto me recordó a un dialogo de la pelicula Minority Report:

John Anderton: ¿Por qué la atrapaste?

Danny Witwer: Se iba a caer.

John Anderton: ¿Estás seguro?

Danny Witwer: Sí.

John Anderton: Pero no se cayó. La atrapaste. Tú lo evitaste, pero *iba* a suceder.

—————————————————————————————–

John Anderton: Why’d you catch that?

Danny Witwer: Because it was going to fall.

John Anderton: You’re certain?

Danny Witwer: Yeah.

John Anderton: But it didn’t fall. You caught it. The fact that you prevented it from happening doesn’t change the fact that it was *going* to happen.

¿Qué pretende decir el diálogo? En realidad, estamos prediciendo algo que va a ocurrir, pero que aún no ha ocurrido. Y depende directamente, no solo del entorno, sino también del comportamiento humano (algo que no se ha modelado). No obstante, suponiendo que somos capaces de predecir correctamente y evitar un crimen, ¿Cómo puede llegar a afectar el futuro a partir del cambio que se ha realizado producido por la predicción? ¿Ese futuro cambiado, puede ser predecible por ese modelo basado en detección de anomalías?

En conclusión, este proyecto demuestra la capacidad de Big Data para prevenir crímenes en Nueva York, pero si incluyéramos modelos de predicción de comportamiento humano (que incluye cambios de comportamiento por prevención de crímenes en el futuro) y lo uniéramos con los crímenes, ¿no sería más correcto?

Innovation Director at @synergicpartner | Follow me on Twitter (@santigt)

0 COMENTARIOS
DEJA TU COMENTARIO

Clientes destacados