Que es el data Mining

Que es el data Mining
Gestión Documental

Cuando hablamos de data Mining, nos referimos a la minería de datos que consiste en la extracción de la información que reside implícitamente en los datos.

Esa información era desconocida anteriormente y puede ser de utilidad en algún proceso.

La minería de datos o  data Mining se encarga de la preparación, el sondeo y la exploración de los datos para obtener la información que no se encuentra visible.

Bajo este procedimiento se engloba al conjunto de técnicas que se utilizan en la extracción de la información que permita su procesamiento.

Existe una vinculación a los procesos industriales debido a que resulta de utilidad obtener la información almacenada en las base de datos de la organización.

En lugar en donde se encuentra la minería de datos o data Mining es en la inteligencia artificial y en el análisis estadístico.

La utilización de las técnicas de minería permite abordar la solución a los inconvenientes que se pueden presentar en la predicción, en la clasificación y en la segmentación.

En cuanto al proceso data Mining se puede mencionar los siguientes puntos:

  • Selección del conjunto de datos

Se refiere a los datos que se desean predecir, calcular o inferir, que sirven para determinar los cálculos o los procesos.

  • El análisis de las propiedades de los datos

Son los histogramas, los diagramas de dispersión, los valores atípicos y también la ausencia de datos.

  • La transformación del conjunto de datos de entrada

Se realiza en función del análisis previo para poder prepararlo y aplicarlo a la técnica de minería de datos que mejor se adapte a la información que se desea analizar. A este proceso también se lo conoce como preprocesamiento de los datos.

  • La selección y la aplicación de la técnica de minería de datos

Es cuando se construye el modelo que permitirá realizar la predicción, la clasificación o la segmentación de la información.

  • La extracción de conocimiento

Se realiza mediante una técnica de minería de datos, obteniéndose un modelo de conocimiento que va a representar los patrones de comportamiento.

También se pueden utilizar varias técnicas simultáneamente para generar diversos modelos.

  • La interpretación y la evaluación de los datos

Se efectúa una vez que se ha obtenido el modelo, comprobando que las conclusiones obtenidas sean válidas y satisfactorias.

To Top