Actualmente, dentro de una organización, el apoyo a la decisión se enfrenta a grandes problemas:

Hay almacenadas grandes cantidades de datos.

Los datos pueden provenir de fuentes muy distintas.

Los dominios de los datos pueden ser muy diversos.

Además se da la paradoja de que cuanta más información se posee (y más variada sea ésta) más difícil es extraer información útil. Para resolver estas situaciones surge el Data Mining (minería de datos).

Para llevar a cabo el minado de datos se necesitan sistemas de bases de datos.

Estos sistemas pueden ser de dos tipos:

• Sistemas de bases de datos tradicionales.
• Sistemas de Data Warehousing.

El Data Mining se basa en técnicas que han existido desde hace bastante tiempo. La razón de que ahora se haga uso de ellas para el minado de datos es que ahora existe una gran cantidad de datos recopilados, estructurados y organizados. En gran parte esto es debido a los sistemas de bases de datos, que permiten asegurar características tales como la integridad y la seguridad.

Las aplicaciones de minería de datos deberían tenerse muy en cuenta desde un principio, durante el diseño de un almacén de datos. Asimismo, las herramientas de minería de datos deberían ser diseñadas para facilitar su uso en conjunción con los almacenes de datos. De hecho, para muchas bases de datos de gran tamaño que se convierten en terabytes de datos, el éxito de la utilización de aplicaciones de minería de bases de datos dependerá en primer lugar de la construcción de un almacén de datos.

Data Mining es un proceso para extraer información útil a partir de grandes cantidades de datos. El Data Mining a través del descubrimiento y cuantificación de relaciones predictivas en los datos, permite transformar la información disponible en
conocimiento útil de negocio. Es una tecnología que ayuda a las empresas a concentrarse en la información más importante de sus bases de información.

Las herramientas de Data Mining predicen futuras tendencias y comportamientos y pueden responder, de forma rápida, a preguntas de negocios que tradicionalmente consumen demasiado tiempo para poder ser resueltas; esta herramientas exploran la base de datos en busca de patrones ocultos encontrando información predecible.

Esencialmente el Data Mining consiste en hacer una serie de consultas, cuyo resultado puede depender, a su vez, de de la respuesta de anteriores consultas.

La Minería de datos, con una fuerte base matemática (sobre todo en modelización) e informática, involucra a muchas otras disciplinas tales como:

  • Bases de Datos ( Contribuye con las técnicas deductivas de procesamiento de consultas)
  • Inteligencia Artificial (Aprendizaje computarizado, lógica difusa, programación lógica, redes neuronales, etc.)
  • Estadística ( Por medio de técnicas estadísticas como: Anova, regresiones, ji cuadrado, componentes principales, análisis cluster, etc.)
  • Investigación Operativa ( modelado, algoritmos y toma de decisiones)
  • Análisis matemático ( Por medio de técnicas matemáticas tales como las Series Temporales)
  • Visualización ( Para lograr una minería de datos interactiva).
  • Apoyo a la decisión ( Herramientas de evaluación del rendimiento, planificación, organización, árboles de decisión, etc.)
  • Heurística (Algoritmos genéticos, métodos del vecino más cercano, etc.)
  • Paralelismo (Para mejorar el rendimiento de los algoritmos de Data Mining).
  • Arquitectura de ordenadores ( Ofreciendo un entorno adecuado para la aplicación de las técnicas de Data Mining).

 

Fuente:

DATA MINING (MINERÍA DE DATOS)
Maria Amparo Guiñan Garcia.