aprendizaje automatico

En este artículo revisamos algunas de las técnicas de aprendizaje automático que las empresas están utilizando para analizar la información que poseen y dotar de inteligencia a su proceso de toma de decisiones

La situación más habitual consiste en que la empresa dispone de datos históricos sobre cualquiera de las actividades que realiza y quiere aprender de ese pasado conocido para optimizar el resultado que obtendrá de esa actividad en el futuro.





Descarga gratis la guía: Computación cognitiva. La nueva revolución del Big Data




Las empresas suelen utilizar las técnicas de aprendizaje automático para dar a respuesta a preguntas del tipo ¿cuáles de mis clientes están a punto de abandonarme?, ¿cuál es el precio más alto que está dispuesto a pagar cada uno de mis clientes por disfrutar de cierto servicio?, ¿quiénes deben formar parte del público objetivo de mi próxima acción de marketing directo para maximizar el retorno de la inversión?, ¿cuántas unidades de mi producto debo fabricar para poder satisfacer la demanda de mis clientes? o ¿qué impacto ha tenido en la cifra de ventas la promoción que he realizado durante el último mes?

Clasificación de las técnicas de aprendizaje automático en función de su objetivo

Algunas de las técnicas de aprendizaje automático que más se usan en las empresas son:

Generalmente la situación de partida es un conjunto de individuos que sabemos que ante cierto estímulo tuvieron una respuesta positiva o negativa, y otras variables que aportan información sobre el comportamiento de esos individuos antes de recibir el estímulo, y el objetivo es obtener un mecanismo que asigne a otros individuos la probabilidad de responder positivamente en caso de recibir ese estímulo. En Unidad Editorial hemos empleado algoritmos de clasificación para calcular la probabilidad que tiene cada uno de nuestros lectores de hacer click en un banner publicitario de una categoría de producto específica, analizando los diferentes patrones de navegación por nuestros sites que mostraron los usuarios que en el pasado sí hicieron click frente a los que no lo hicieron. Alguno de los algoritmos que entrenan modelos de clasificación son los árboles de decisión, la regresión logística, las redes neuronales o las técnicas de boosting.

La diferencia con las técnicas de clasificación es que la variable que se desea predecir puede tomar cualquier valor real. Si entre las variables que se usan para realizar la predicción se encuentra el valor que tomó la variable que hay que predecir en diferentes momentos del pasado, es común emplear el término “técnicas de forecasting”. En Unidad Editorial utilizamos estas técnicas para predecir el número de ejemplares de cada una de nuestras cabeceras que se venderán cada día en cada uno de los puntos de venta, y la predicción tiene en cuenta los ejemplares vendidos los días anteriores, la tipología del punto de venta, el tipo de suplemento que acompaña a la publicación o el momento del año en el que nos encontremos. Los algoritmos más utilizados para obtener estos modelos son la regresión lineal múltiple, los árboles de regresión, el análisis de series temporales o las redes neuronales.

Las técnicas de clustering se utilizan para repartir a los individuos de un grupo en un número reducido de segmentos independientes que están construidos de forma que los miembros de cada segmento son muy parecidos entre ellos y muy diferentes de los miembros de los otros segmentos. En Unidad Editorial aprovechamos esta técnica para agrupar a los lectores de nuestros sites web en función de la frecuencia con la que nos visitan, la variedad de contenidos que leen, el tiempo que están consumiéndolos y el momento del día en el que lo hacen. Como no es operativamente posible definir una estrategia comercial diferente para cada uno de nuestros lectores, disponer de estas agrupaciones nos facilita encontrar el equilibrio entre el número de acciones comerciales definidas y la efectividad de las mismas. Los algoritmos más empleados para encontrar estos segmentos son el cluster jerárquico, el K-Means o las técnicas de Gaussian Mixtures.

Software apropiado para utilizar las técnicas de aprendizaje supervisado

Afortunadamente existe un gran número de plataformas informáticas que ponen a disposición de las empresas el uso de estos algoritmos. Algunas, como R, Python, KNIME o Weka son de libre distribución, mientras que para poder utilizar otras como SAS, IBM SPSS o RapidMiner hay que pagar una licencia comercial.

El Programa Superior en Big Data de ICEMD dota a los profesionales de conocimientos para liderar ámbitos estratégicos en las empresas de la economía digital. Más información e inscripciones aquí.El término aprendizaje automático, o su equivalente en inglés “machine learning”, se utiliza en el ámbito empresarial para referirse a un conjunto de algoritmos que permiten extraer conocimiento de los datos que la empresa tiene en su poder, para posteriormente utilizarlo en los procesos de toma de decisiones.





Descargar e-Book


Comentarios

Deja tu comentario: