Churn y redes sociales: un ejemplo en telecomunicaciones

He leído recientemente el artículo Social Ties and their Relevance to Churn in Mobile
Telecom Networks
porque ilustra una técnica muy de moda: el análisis de redes sociales (SNA) en en ámbito de las telecomunicaciones y, en particular, la construcción de indicadores tempranos de baja (churn) de clientes de telefonía móvil. Más aún, permite rediseñar estrategias basadas en los resultados para retener clientes: al clasificarlos mejor usando técnicas de SNA, pueden diseñarse estrategias activas para aquellos que no sólo tienen una mayor predisposición a darse de baja sino, además, a arrastrar con ellos a parte de su entorno social.

El artículo, en resumen, introduce dos indicadores. El primero, p(k), es más ilustrativo que práctico: se trata de la probabilidad de que un cliente que tiene k conexiones —una conexión es alguien con quien el cliente ha hablado durante un determinado periodo— que se han dado de baja previamente se dé él mismo de baja. El gráfico siguiente muestra cómo p(k) es una función creciente de k. Sin embargo, el indicador puede no ser particularmente útil dado que, estoy seguro, el número de clientes para los que k > 1 es, casi seguro, muy pequeño.

En la segunda parte los autores construyen un modelo de propagación. Les interesa no sólo contar —y construir, de paso, probabilidades de corte frecuentista— sino explicar la dinámica y aprovecharla para construir modelos más útiles. La idea es la siguiente: un cliente que se da de baja transmite una señal a aquellos con los que se comunica. La señal puede ser del tipo esta compañía es malísima, me voy a ir a esta otra. No se sabe realmente cómo es la influencia, pero los autores la aproximan de la siguiente manera:

  1. Asignan a cada cliente que se da de baja en un periodo determinado un cierto nivel de energía.
  2. Un porcentaje de este nivel de energía se transmite de ellos a sus contactos en función de ciertos criterios (a mayor nivel de contacto, mayor flujo de energía). Este criterio preserva la energía: la energía total del sistema antes y después de la redistribución es la misma.
  3. Los contactos que tienen un nivel de energía mayor que cero lo transmiten recursivamente a los suyos.
  4. El proceso se itera hasta que alcanza un equilibrio razonable.

Al final, a muchos clientes (técnicamente, a los que pertenecen a la unión de las componentes conexas que contienen a las bajas) se les habrá asociado un nivel de energía. Y este nivel de energía es, según los autores, un indicador temprano de baja de alto valor predictivo.

¿Será?

6 comentarios sobre “Churn y redes sociales: un ejemplo en telecomunicaciones

  1. Jorge 3 abril, 2012 15:15

    Y tanto que lo será, tengo la suerte te haber realizado modelos predictivos con redes sociales (nexos entre tráfico) y pasamos de predecir patrones cortoplacistas (2 – 3 meses) a patrones largoplacistas (6 a 8 meses). Funcionan y, muy bien.

    Si se fuga el líder de una red vecina, tú te fugas… Tema precios.

    Por otro lado, no lo enfocaría con energías, suena raro. Es más simple. Modelos epidemiológicos. Contagios.

    Pero lo interesante de esto no es predecir largo placista (solamente); sino la batería de acciones que se te plantean. Fidelizar a los líderes con pricing, por ejemplo. Evitas bajas masivas de la red que lidera y de vecinas. Aunque sea a margen 0 (si la ley lo permite, que de momento sí).

    Abrazo!

  2. datanalytics 3 abril, 2012 16:01

    @Jorge ¿Qué diferencia existe realmente entre un modelo que use una metáfora «epidemiológica» y otro que recurra a una alegoría de «transmisión de energía»? Piense que el artículo lo escribieron ingenieros para ingenieros, no biólogos para biólogos.

  3. Jorge 3 abril, 2012 21:44

    Que las epidemias se pueden controlar poniendo en cuarentena al causante (líder), en energía no sé qué querrá decir eso. Por esto incidía en las acciones, cambia el concepto, para evitar una fuga no atacas al que tiene probabilidad de fuga (solo), sino al líder.

    Bueno, qué más dará esto… Jajaja

  4. sergiojsj 4 abril, 2012 9:46

    Es un modelo difusivo bastante sencillo pero que da cuenta de la posibilidad de transmitir(contagiar) comportamientos a vecinos de orden mayor que 1.
    Yo tampoco veo la diferencia con modelos epidemiológicos salvo que para cortar la epidemia la cuarentena no es una alternativa posible.

  5. datanalytics 4 abril, 2012 10:31

    @sergiojsj Pensando un poco en el algoritmo (y sin hacer pruebas numéricas) tengo la sospecha de que a lo mejor la «energía» se difunde demasiado y la variable es demasiado uniforme en la población.

    Pero bueno, seguro que hay mil maneras de afinar y tratar de crear aproximaciones a una variable que, no olvidemos, no es observable y cuya existencia misma no deja de ser una mera hipótesis de trabajo.

Los comentarios están desabilitados.