mineria de datos

La revolución digital ha hecho posible que la información digitalizada sea fácil de capturar, procesar, almacenar, distribuir, y transmitir. Con el importante progreso en informática y en las tecnologías relacionadas y la expansión de su uso en diferentes aspectos de la vida, se continúa recogiendo y almacenando en bases de datos gran cantidad de información.

Descubrir conocimiento de este enorme volumen de datos es un reto en sí mismo. El avance de la tecnología para la gestión de bases de datos hace posible integrar diferentes tipos de datos, tales como imagen, video, texto, y otros datos numéricos, en una base de datos sencilla, facilitando el procesamiento multimedia.

La minería de datos nació con la idea de aprovechar dos cosas: la ingente cantidad de datos que se almacenaban en áreas como el comercio, la banca o la sanidad, y la potencia de los nuevos ordenadores para realizar operaciones de análisis sobre esos datos. El data mining permite encontrar información escondida en los datos que no siempre resulta aparente, ya que, dado el gigantesco volumen de datos existentes, gran parte de ese volumen nunca será analizado. La minería de datos es un proceso de identificación de información relevante extraída de grandes volúmenes de datos, con el objetivo de descubrir patrones y tendencias estructurando la información obtenida de un modo comprensible para su posterior utilización

En este siglo la demanda continuará creciendo, y el acceso a grandes volúmenes de datos multimedia traerá la mayor transformación para el global de la sociedad. Por tanto, el desarrollo de la tecnología de minería de datos avanzada continuará siendo una importante área de estudio, y, en consecuencia, se espera gastar muchos recursos en esta área de desarrollo en los próximos años.

Los pasos que incluye cualquier proceso de data mining empiezan con una selección de los datos a tratar en función de variables de predicción y cálculo, es decir, de un conjunto de variables objetivas y otro de variables independientes: las primeras son las que guían la elección en función de los objetivos que se persiguen con el análisis, y las segundas determinan de qué modo se llevará a cabo el proceso.

Tras ello, se analizan las propiedades del conjunto de datos seleccionados para detectar patrones, tendencias, valores atípicos y datos descartables con nulo valor informacional. Este análisis previo guiará el posterior procesamiento de los datos, que permitirá clasificarlos y segmentarlos en función del modelo predictivo elegido, y tras lo cual se elaborarán modelos de conocimiento gracias a la identificación de patrones de comportamiento, y de elementos de asociación y disociación entre las distintas variables usadas en el análisis previo.

Finalmente, una vez obtenido el o los modelos de conocimiento mediante el uso de las distintas técnicas aplicables, se procede a la validación de los mismos tras compararlos e interpretarlos, y a la elección del más satisfactorio según los resultados obtenidos. Si ningún modelo satisface las expectativas de conocimiento esperadas, el proceso se repite de nuevo cambiando variables y adoptando técnicas distintas a las usadas en los procesos anteriores, hasta obtener un modelo la explotación del cual satisfaga las necesidades de conocimiento corporativo expresadas.

Existen numerosas áreas donde la minería de datos se puede aplicar, prácticamente en todas las actividades humanas que generen datos:

Por poner algunos ejemplos, en los negocios la minería de datos es una disciplina que puede contribuir en la administración empresarial con respecto a la relación con el cliente en donde permitirá el contacto específico solamente con aquellos que presenten mayor probabilidad de responder positivamente a una determinada oferta o promoción. En los hábitos de compra en los supermercados, por ejemplo, se relaciona con la detección de los hábitos de compra de los clientes en determinados días en donde se evaluará qué productos consumen para focalizar la venta en ese punto. La minería de datos también puede ser de utilidad para el departamento de recursos humanos de una empresa, en donde se identificarán las características de los empleados que presentan mayor éxito en su gestión. Esta información puede ayudar a los planes de capacitación y de carrera de las personas que forman para de las organizaciones.

Uno de los compromisos de ICEMD, El Instituto de la Economía Digital de ESIC, es dotar a los profesionales de la economía digital de herramientas y conocimientos para el la optimización y correcto desempeño de sus recursos, en un entorno cambiante como el actual. El Programa Superior en Big Data aporta conocimientos para una excelente explotación de los datos, y acompaña al profesional en su toma de decisiones estratégica y táctica. Toda la información sobre estos estudios de ICEMD aquí.

 

Comentarios

Deja tu comentario: