Análisis predictivo

Muchos profesionales del Big Data se refieren a los modelos de análisis predictivo como “bolas de cristal”, que nos permiten predecir el futuro de nuestras organizaciones. Sin embargo, esta metáfora no se ajusta bien a la realidad, ya que de hecho lo que buscamos es que no se cumplan los pronósticos de nuestros modelos de análisis predictivo.

Sí, una de las grandes ventajas de aplicar tecnologías de Big Data en nuestra organización es que podemos aplicar diversas técnicas a nuestros datos para predecir cómo van a evolucionar en el futuro ciertas variables. A este conjunto de técnicas estadísticas y de aprendizaje automático se les suele denominar modelos predictivos y se encuadran dentro del campo del análisis predictivo (predictive analytics). Los modelos de análisis predictivos, que se construyen usando técnicas matemáticas y de inteligencia artificial, permiten inferir cómo se comportará en el futuro una variable (predecida) en función de una serie de variables predictoras. Un ejemplo simple sería predecir el volumen de ventas de un determinado producto durante los próximos meses en función de la inversión realizada en las campañas de marketing relacionadas con ese producto.

El ejercicio anterior sería útil por ejemplo para ajustar los procesos productivos y el stock necesario para atender a la demanda futura, acercándonos lo máximo posible a la excelencia operativa: sin sobreproducción y sin desabastecimiento. Pero ésa es una visión enfocada en la cadena de suministro. Si lo miramos desde el punto de vista de marketing, en realidad no queremos que se cumpla la predicción del modelo de análisis predictivo, lo que queremos es maximizar las ventas. En otras palabras, lo que vamos a hacer es usar los modelos de análisis predictivos como herramientas de simulación del futuro, que nos permitan accionar las palancas adecuadas en el presente, y así conseguir maximizar nuestros resultados.





Descarga gratis la guía: Computación cognitiva. La nueva revolución del Big Data




Por lo tanto, la clave está en detectar las palancas (variables predictoras) que más influyen en nuestra predicción, para cambiarlas y hacer que el futuro cambie hacia un estado mucho mejor del que sería si no estuviéramos usando un Big Data con capacidad de análisis predictivo. En este proceso, al usar modelos de análisis predictivos para tomar decisiones en el presente, lo que hacemos no es simplemente predecir de forma pasiva el futuro, sino que usamos los insights obtenidos (acerca de un posible futuro hipotético) para construir un futuro más provechoso para nuestros intereses. Pensemos, por ejemplo, en los modelos que predicen el abandono de clientes. Estos modelos pueden tomar como entrada cientos de variables con posible poder pronosticador sobre el abandono (facturación presente y pasada, interacción por diferentes canales, comportamiento de la red social más próxima, cambios de comportamiento recientes, etc.). La salida del modelo será una probabilidad de abandono para cada uno de los actuales clientes. Si simplemente usáramos el modelo como un insight, podríamos descubrir qué factores son los que más influyen en el abandono de ciertos tipos de clientes. Pero en realidad, lo que haremos será seleccionar al grupo de clientes con más valor para nosotros y también con más propensión de abandono con el objetivo de realizar una acción de retención sobre ellos. Y aquí está la clave, al “accionar sobre el insight obtenido” estamos usando nuestra predicción para hacer precisamente que ésta no se cumpla. Debemos ser conscientes de estos matices, pues a la hora de evaluar la utilidad de nuestros modelos de análisis predictivos, veremos que no sirve un enfoque basado en la ratio de aciertos (nuestro modelo no va a acertar porque hemos tomado las acciones necesarias para que falle en un sentido que nos beneficie).

Visto desde este enfoque de “insights accionables”, quizás es mejor considerar a los modelos de análisis predictivos como herramientas de simulación, más que como bolas de cristal. La simulación de posibles escenarios futuros es de gran utilidad para descubrir las palancas importantes que vamos a accionar. Siguiendo nuestro ejemplo anterior, la intención sería descubrir qué variables concretas son las que mejor predicen el abandono y la permanencia de los clientes.

Por último, es muy importante recordar que nuestros modelos de análisis predictivos se alimentan de datos de entrada. Si entre estos datos no se encuentran las variables que realmente causan el cambio en la variable a predecir nuestro modelo será inútil. La gran ventaja de las infraestructuras actuales de Big Data es que nos permiten construir modelos muy complejos en los que explorar gran cantidad de variables, de forma que podamos encontrar cuáles de ellas son las que realmente impactan en el futuro hipotético que estamos prediciendo. Aparte de seleccionar las variables de entrada, también es muy importante que éstas sean de buena calidad. En esencia, “un modelo es lo que come”, y por muy buenos y muy sofisticados que sean los algoritmos que usamos, si los alimentamos con datos de mala calidad (con errores, datos nulos, incompletos, etc.) no podrán aprender a capturar correctamente las relaciones entre las variables y por lo tanto harán malas predicciones, provocando que tomemos malas decisiones.




Descargar e-Book




Comentarios

Ramon - hace 1 año

Excelente articulo, bien claro conciso y preciso.

Deja tu comentario: