Blogs

De la catástrofe a la acción: cómo Twitter puede salvar vidas
  • Darío Hernández
  • 1739 Views
  • 0 Comment
  • catástrofes . detección de catástrofes . Geolocalización . redes sociales . twitter .

El 16 de Abril de 2016, a las 18:52 horas locales, las poblaciones costeras del noroccidente ecuatoriano fueron asoladas por un terremoto de 7,6 en la escala de Richter. En 30 minutos se destruyeron las principales infraestructuras y fue un enorme golpe para la economía y el turismo de la zona, sin contar los centenares de muertos y heridos que se produjeron.

En este artículo, se analiza el complejo contexto que se originó en las horas siguientes al terremoto y se propone una potente herramienta de gestión de desastres, basada en Twitter, que pueda ser utilizada en casos similares en el futuro.

Las primeras alertas en forma de hashtags

En las horas siguientes al terremoto se declaró un estado de excepción que provocó un inusual movimiento de información en las redes sociales, en particular Facebook y Twitter, dado el hermetismo oficial inicial. Espontáneamente, surgieron hashtags que expresaban variados sentimientos de la comunidad desde la necesidad de información (#SismoEcuador), la solicitud de auxilio o necesidades específicas (#SeNecesitaEC), la desaparición de personas (#DesaparecidosEC) o el ofrecimiento de ayuda en las más diversas situaciones (#SeOfreceEC).

Entre el 17 y el 24 de Abril se generaron alrededor de medio millón de tweets con las citadas etiquetas, convirtiéndose en la tendencia más seguida de dicha semana, además de convertirse en el material idóneo para proponer esta solución.

Para ser más exactos, la problemática detectada en esas primeras horas tras el evento se puede resumir en 4 aspectos:

  • – Caos informativo: se producen informaciones falsas que generan más temor en la población.
  • – Mensajes contradictorios: a falta de información oficial, la gente se lanza a emitir mensajes sobre el terremoto en las redes sociales. Pero en un entorno de desesperación post-terremoto hay asociada una crisis de credibilidad.
  • – Relacionar peticiones de ayuda con oferta de servicios: como se comentó anteriormente, surgen dos hashtags #SeOfreceEC y #SeNecesitaEC donde miles de personas vuelcan expresiones sobre necesidades específicas y muchos ofrecen su ayuda para cubrirlas.
  • – Conocer las zonas con mayores necesidades: el difícil acceso a las zonas del desastre produce información oficial con mucho retraso. Las peticiones de ayuda son generalmente expresadas para un lugar geográfico en concreto, pero se puede obtener la geolocalización exacta del peticionario a partir del tweet.
Soluciones que ayudan a gestionar desastres naturales

Dado este contexto, diseñamos una solución de gestión de incidencias ante desastres naturales que puede ser utilizado por Gobiernos y ONG’s como complemento a los centros de mando ad-hoc que se implantan en este tipo de situaciones. La idea fundamental es explotar toda la información que se expresa en Twitter, debido a la problemática citada, mediante técnicas de aprendizaje profundo que permitan extraer características claves de cada tweet en un entorno con mucho “ruido” como fue el escenario de Twitter post-terremoto de los primeros días.

Los aspectos técnicos de la solución

En esta primera instancia, se plantea utilizar algoritmos que permitan limpiar el corpus del texto de mensajes con un alto grado de error de reconstrucción en el proceso de codificación-decodificación. En la gráfica siguiente se puede apreciar el procedimiento para el tratamiento inicial de los tweets en busca de las palabras de relevancia para el objetivo final de clasificación a gran escala de los mensajes:

Tweets detectan catástrofes naturales_1

Una vez obtenido el texto normalizado, el objetivo es categorizar los mensajes en, por ejemplo: peticiones de ayuda, reporte de incidencias o casos donde se expresa una necesidad explícita. Aquí, la técnica a utilizar es una red convolucional que clasifique el texto, ya normalizado, buscando patrones que representen las categorías mencionadas en una arquitectura de hiperplanos.

Un problema recurrente, en esta solución, es la aparición de tweets falsos que originan un clima de incertidumbre. Ante ello, se prevé verificar la autenticidad de la fuente utilizando las características clave de cada usuario (sentimiento de sus tweets, comunidad a la que pertenece, velocidad de propagación de sus mensajes, tipo de mensaje, entre otros) con la finalidad de aplicar otra arquitectura de red convolucional que permita encontrar patrones de clasificación intermedios y finales muy diferenciados (fiable-no fiable).

El formato de explotación es una visión geo-espacial con la categorización de los tweets incorporando variables de prioridad (para resolver los problemas más acuciantes), que permita al usuario clave de un centro de mando, la gestión rápida que este tipo de situaciones amérita. La solución, en su versión condensada, debería ser un mapa de procesos de la siguiente forma:

twiter geolocalización en tiempo real_2

Esta propuesta toma en cuenta las últimas novedades en el campo de la inteligencia artificial aplicada al procesamiento del lenguaje natural, con un enfoque de Data Science for Social Goods, el sentido del servicio al bienestar común. Llevarla hasta el final (una solución operativa) implica solventar problemas de generación de características clave, de diseño algorítmico y de operatividad, no necesariamente triviales, y que se abordará por fases.

Este es el primer artículo de los tres previstos para revisar todas las fases de la solución. En el siguiente, se revisará el proceso de feature engineering y la algoritmia relacionada con cada componente para su implementación en Theano (una de las principales librerías de Python especializada en modelos de Deep Learning).

Team Leader - Data Scientist @ Synergic Partners | Follow me on Twitter (@dariohernandez)

0 COMENTARIOS
DEJA TU COMENTARIO

Clientes destacados