
A continuación mencionaremos los pasos que presenta un proceso de minería de datos: Seleccionar el conjunto de los datos Se trata de seleccionar la información relacionada con las variables objetivo y las variables independientes como también el muestreo de los registros disponibles. Analizar las propiedades de los datos Es con respecto al histograma, los diagramas de dispersión, la presencia de valores atípicos y la ausencia de datos. La transformación de los datos de entrada Se realiza de diversas formas y en función de un análisis previo con la intención de prepararlo para la aplicación de las técnicas de minería de datos que mejor se adapte a la información contenida. En realidad se trata de un procesamiento de datos. La selección y la aplicación de las técnicas de minería de datos Es un proceso en donde se construye el modelo predictivo, de clasificación o de segmentación. La extracción del conocimiento Se realiza mediante una técnica de minería de datos en donde se obtiene un modelo de conocimiento que representa a los valores del comportamiento que son observados en las variables del problema o sobre las relaciones que están asociadas a las mencionadas variables. La interpretación y la evaluación de los datos Una vez que se ha obtenido el modelo se debe validar los datos en donde se comprobará que los resultados obtenidos sean válidos y satisfactorios. Al realizar todo el proceso en la minería de datos se concluye que si el modelo final no supera la evaluación del mismo se podría llegar a repetir desde el principio o en cualquiera de los pasos cuantas veces sea necesario hasta lograr la obtención de un modelo satisfactorio. Una vez encontrado el modelo, si éste resulta aceptable ya estaría listo para su explotación, en donde se aplicarán en los sistemas de análisis de información de las organizaciones e inclusive el los sistemas transaccionales de la empresa. Tradicionalmente las técnicas de minería de datos eran aplicadas sobre la información contenida en los almacenes de datos, en donde muchas empresas han creado bases de información que están especialmente diseñadas para proyectos de minería de datos, centralizando la información potencialmente diseñada para proyectos de este tipo y la información potencial en todas las áreas de negocio.