Blogs

Anticiparse a la Fuga de Clientes mediante Palancas de Retención
  • Rubén Granados
  • 1382 Views
  • 0 Comment
  • Big Data . Churn Prediction . Data Science . Fuga de Clientes . Machine Learning . Palancas de Retencion .

 

Identificación y análisis de sendas de desvinculación de clientes

Saber qué clientes pueden dejar de serlo ha sido el objetivo de los clásicos modelos de fuga (churn) cuyo output final consistía en una probabilidad de abandono asociada a cada cliente en determinado rango temporal. Sin embargo, una vez que sabemos que el cliente se va a ir, nos surge una pregunta: ¿Qué hacer para evitar su marcha? Incluso llegar más allá: ¿Qué hacer para conseguir que el cliente ni siquiera se plantee su marcha?

Medidas preventivas de fuga de clientes en el sector bancario

En Synergic Partners hemos realizado un proyecto para una de las entidades bancarias más importantes de España en el cual se responde a estas preguntas con una metodología diseñada a partir de la combinación de varias técnicas de Machine Learning, Big Data, y Data Science, empleando herramientas de almacenamiento y procesamiento distribuidas (HDFS, Spark, etc.). El output final del proyecto sugiere las acciones necesarias (palancas de retención) para que el banco las lleve a cabo desde el punto de vista de negocio como medidas preventivas de fuga sobre grupos de clientes con riesgo de irse de la entidad.

Fase de Clustering: agrupamiento de clientes por comportamientos similares

La primera etapa de este proyecto consiste en analizar el histórico de datos y agrupar los clientes (tanto los fugados en algún momento, como los que no) mediante técnicas de clustering con el fin de obtener grupos de clientes con comportamientos similares. Se observa que los clusters que surgen están formados o bien por un alto porcentaje de fugados o bien por un alto porcentaje de no fugados, lo que resultará altamente interesante para caracterizar e identificar los clientes con comportamientos de mayor riesgo de fuga. La aproximación de clustering implementada se construye utilizando el algoritmo Random Ferns como selector de variables relacionadas con la fuga y, posteriormente, aplicando el algoritmo de aprendizaje no supervisado K-means. Para estimar la calidad de la segmentación aprendida, se mide la pureza de los clústeres identificados en relación a la proporción de clientes fugados o no en cada uno de ellos, obteniendo ratios altos de pureza en las agrupaciones. 

Blog Ruben 1

El siguiente paso se orienta a darle al modelo un carácter dinámico, con el objetivo de ser capaces de ver y analizar la evolución del cliente en el banco. Para lograrlo se lleva a cabo un clustering temporal, aplicando el modelo anteriormente aprendido a cada cliente en cada mes. Ésto permitirá analizar las sendas seguidas por los clientes en base a los clusters o estados por los que ha pasado a lo largo del histórico, pudiendo identificar las sendas de desvinculación más frecuentes en la entidad (aquellas en la que el cluster o estado final sea predominantemente de fuga).

Fase de identificación de motivos de fuga de clientes

Una vez identificadas las sendas que desembocan en la fuga del cliente (o en su permanencia), se plantea la pregunta de cómo detectar aquellos grupos que inicialmente no tienen riesgo de fuga pero que pueden moverse a estados más peligrosos en el futuro. Para ello, se utilizan algoritmos de minería de reglas y detección de patrones frecuentes para identificar las sendas más repetidas que acaban en fuga y, de este modo, poder estimar cuáles son los comportamientos con mayor riesgo de finalizar en fuga definitiva del cliente.

Fase de desviación de clientes de sendas de fuga o desvinculación

Vale, ya sabemos qué grupos de clientes están empezando a tener comportamientos particulares que pueden desembocar en fuga. Pero también queremos ayudar, siempre desde el análisis de los datos, a definir qué acciones o palancas de retención habría que aplicar para evitar dichas fugas. Siguiendo el planteamiento propuesto, el objetivo ahora es desviar a los clientes de las identificadas como sendas de desvinculación, tratando de modificar su tendencia mediante acciones orientadas a modificar las características que moverían a ese cliente hacia una senda con menos probabilidades de fuga. 

Blog Ruben 2

La metodología seguida para conseguir este objetivo utiliza la descripción de los clusters o estados en base a variables con sentido de negocio (medias, desviaciones típicas, ratios, etc., de forma discretizada), y en la posterior definición de las palancas de retención orientadas a mover un cliente desde un estado de fuga al más cercano de no fuga (entendiendo la cercanía como una medida de similitud o distancia entre clústeres).

Fase de identificación de palancas de retención

Tras todo este proceso, son identificadas las palancas de retención más apropiadas en cada caso que, interpretadas como acciones comerciales desde el punto de vista de negocio, permitirán evitar la fuga de una proporción importante de clientes, gracias al objetivo inicial de este proyecto centrado en la anticipación, y no solo en el cálculo de un score de fuga.

Autores:
  • Rubén Granados (@rubengra). Data Scientist Team Leader, Synergic Partners.
  • Antonio Fernández (@antoniofviz). Senior Data Scientist, Synergic Partners.

Data Scientist Team Leader @Synergic Partners | Follow me on Twitter (@rubengra)

Senior Data Scientist @Synergic Partners | Follow me on Twitter (@antoniofviz)

0 COMENTARIOS
DEJA TU COMENTARIO

Clientes destacados