'Data mining': definición, ejemplos y aplicaciones

Descubre cómo el 'data mining' predecirá nuestro comportamiento

Informática Empresa

El data mining ha abierto todo un mundo de posibilidades para los negocios. Este campo de la estadística computacional relaciona millones de datos aislados y sirve a las empresas, por ejemplo, para detectar patrones de conducta en sus clientes y predecir su comportamiento. Su objetivo es generar nuevas oportunidades de mercado.

El 'data mining' convierte la información en conocimiento.
El 'data mining' convierte la información en conocimiento.

¿QUÉ ES EL 'DATA MINING'?

La minería de datos o data mining es un proceso técnico, automático o semiautomático, que analiza grandes cantidades de información dispersa para darle sentido y convertirla en conocimiento. Busca anomalías, patrones o correlaciones entre millones de registros para predecir resultados, como indica el SAS Institute, uno de los referentes mundiales en analítica de negocios.

Mientras tanto la información crece sin parar. Un estudio de 2017 sobre big data revela que el 90% de los datos del mundo son posteriores a 2014 y su volumen se duplica cada 1,2 años. En este contexto, el data mining es una práctica estratégica considerada importante por casi el 80% de las organizaciones que aplican inteligencia empresarial (business intelligence), según Forbes.

Gracias a la acción conjunta de analítica y minería de datos, que combina estadística, Inteligencia Artificial y aprendizaje automático, las empresas pueden crear modelos para descubrir conexiones entre millones de registros. El data mining posibilita, entre otros aspectos:

  • Limpiar los datos de ruido y repeticiones.
  • Extraer la información relevante y utilizarla para evaluar posibles resultados.
  • Tomar mejores decisiones de negocio con mayor rapidez.

EJEMPLOS DE APLICACIONES DE LA MINERÍA DE DATOS

La capacidad predictiva del data mining ha cambiado el diseño de las estrategias empresariales. Ahora se puede entender el presente para anticiparse al futuro. Estos son algunos ejemplos de data mining en la industria actual:

  • 'Marketing'. La minería de datos se utiliza para explorar bases de datos cada vez mayores y mejorar la segmentación del mercado. Analizando las relaciones entre parámetros como edad de los clientes, género, gustos, etc., es posible adivinar su comportamiento para dirigir campañas personalizadas de fidelización o captación. El data mining en marketing predice también qué usuarios pueden darse de baja de un servicio, qué les interesa según sus búsquedas o qué debe incluir una lista de correo para lograr una tasa de respuesta mayor.
  • Comercio minorista. Los supermercados, por ejemplo, emplean los patrones de compra conjunta para identificar asociaciones de productos y decidir cómo situarlos en los diferentes pasillos y estanterías de los lineales. El data mining detecta además qué ofertas son las más valoradas por los clientes o incrementa la venta en la cola de caja.
  • Banca. Los bancos recurren a la minería de datos para entender mejor los riesgos del mercado. Es habitual que se aplique a la calificación crediticia (rating) y a sistemas inteligentes antifraude para analizar transacciones, movimientos de tarjetas, patrones de compra y datos financieros de los clientes. El data mining también permite a la banca conocer más sobre nuestras preferencias o hábitos en internet para optimizar el retorno de sus campañas de marketing, estudiar el rendimiento de los canales de venta o gestionar las obligaciones de cumplimiento de las regulaciones.
  • Medicina. La minería de datos favorece diagnósticos más precisos. Al contar con toda la información del paciente —historial, examen físico y patrones de terapias anteriores— se pueden prescribir tratamientos más efectivos. También posibilita una gestión más eficaz, eficiente y económica de los recursos sanitarios al identificar riesgos, predecir enfermedades en ciertos segmentos de la población o pronosticar la duración del ingreso hospitalario. Detectar fraudes e irregularidades y estrechar vínculos con los pacientes al ahondar en el conocimiento de sus necesidades son también ventajas de emplear el data mining en medicina.
  • Televisión y radio. Hay cadenas que aplican la minería de datos en tiempo real a sus registros de audiencia en televisión online (IPTV) y radio. Estos sistemas recaban y analizan sobre la marcha información anónima de las visualizaciones, las retransmisiones y la programación de los canales. Gracias al data mining se pueden emitir recomendaciones personalizadas a los radioyentes y telespectadores, conocer en directo sus intereses y su actividad, y entender mejor su conducta. Las cadenas obtienen, además, conocimiento muy valioso para sus anunciantes, que aprovechan estos datos para llegar con más precisión a sus clientes potenciales.

'DATA MINING': UNA PROFESIÓN DE FUTURO

Hoy en día, la búsqueda, el análisis y la gestión de datos representan un mercado de grandes oportunidades laborales. El profesional de data mining trabaja las bases de datos para evaluar la información y descartar la que no sea útil o confiable. Para ello, debe contar con conocimientos sobre big data, informática y análisis de información, y ser capaz de manejar diferentes tipos de software.

El informe anual de LinkedIn de 2017 sobre los empleos más emergentes señalaba que tres de los puestos con más demanda en Estados Unidos eran posiciones relacionadas con los datos masivos. Asimismo, IBM pronostica que la demanda de este tipo de profesionales crecerá un 28% de aquí a 2020.

Data mining

Identifica y extrae la información relevante de grandes conjuntos
de datos.

Utiliza diferentes técnicas
basadas en la estadística
y la Inteligencia Artificial.

Arroja resultados específicos
y concretos.

Crea modelos predictivos,
de clasificación o segmentación.

Transforma la información en conocimiento.

Big data

Se refiere a la recolección y almacenamiento de grandes
cantidades de datos.

Debido a su volumen es imposible
procesarlos con software
convencional.

Necesita herramientas especiales
para capturar, gestionar y tratar la información.

Estos grupos de datos tienen baja densidad de información para realizar predicciones.

La calidad de los datos puede variar mucho y afectar a los resultados del análisis.

Vs.
IBERDROLA