CursosOnlineEnDirecto-Benowu

Qué es Minería de Datos

Qué es Minería de Datos

¿Qué es la minería de datos?

Las técnicas de minería de datos se emplean para mejorar el rendimiento de procesos de negocio o industriales en los que se
manejan grandes volúmenes de información estructurada y almacenada en bases de datos.

Se trata de un proceso analítico diseñado para explorar grandes volúmenes de datos (generalmente datos de negocio y mercado) con el objeto de descubrir patrones y modelos de comportamiento o relaciones entre diferentes variables. Esto permite generar conocimiento que ayuda a mejorar la toma de decisiones en los procesos fundamentales de un negocio.

La minería de datos permite obtener valor a partir de la información que registran y manejan las empresas, lo que ayuda a dirigir esfuerzos de mejora respaldados en datos históricos de diversa índole.

Por ejemplo, se usan con éxito en aplicaciones de control de procesos productivos, como herramienta de ayuda a la
planificación y a la decisión en marketing, finanzas, etc.

Asimismo, la minería de datos es fundamental en la investigación científica y técnica, como herramienta de análisis y
descubrimiento de conocimiento a partir de datos de observación o de resultados de experimentos.

Fases de un Proyecto de Minería de Datos.

Los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos, independientemente de la
técnica específica de extracción de conocimiento usada.

Filtrado de datos:

El formato de los datos contenidos en la fuente de datos (base de datos, Data Warehouse...) nunca es el idóneo, y la mayoría de
las veces no es posible ni siquiera utilizar ningún algoritmo de minería sobre los datos "en bruto". Eliminan valores incorrectos, no válidos, desconocidos... Según las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del proceso), o se reducen el número de valores posibles (mediante redondeo, clustering,...).

Selección de variables:

Aún después de haber sido preprocesados, en la mayoría de los casos se tiene una cantidad ingente de datos. La selección de
características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema, sin apenas sacrificar
la calidad del modelo de conocimiento obtenido del proceso de minería.

Los métodos para la selección de características son básicamente dos:

- Aquellos basados en la elección de los mejores atributos del problema.
- Aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos.

Algoritmos de Extracción de Conocimiento:

Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento
observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado
diferente de los datos.

Interpretación y evaluación:

Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y
suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben
comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados
esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.

 

Fuente:

INTELIGENCIA EN REDES DE COMUNICACIONES.
MINERÍA DE DATOS-PREDICCIÓN METEOROLÓGICA
Realizado por:
David Paniagua Martín.
Juan Carlos Soler Pascual del Pobil.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Subir

Canal de aprender-libre.com

Reciba todas las publicaciones desde nuestro canal en Telegram

UNIRSE
CERRAR