Qué es Data WareHouse

data wharehouse
Gestión Documental

Data WareHouse es un repositorio o base de datos que se alimenta de varias fuentes que se han transformado o depurado en grupos de información de temas específicos relacionados con el mundo de los negocios, y que generalmente han sido obtenidos mediante el data mining. Este repositorio puede ser consultado en cualquier momento para obtener nuevas consultas, analizar, reportear y tomar decisiones, todo esto de manera inmediata y desde diferentes perspectivas con una gran velocidad en la respuesta.

Este repositorio de datos está creado precisamente para entregar la información correcta en el momento en que se hace una consulta por la persona indicada ofreciendo el formato adecuado, permitiendo que sea la perspectiva que sea en que se haga la consulta ofrezca los resultados esperados.

La información que se maneja en este caso ha de ser accesible, consistente, adaptable, estar bien protegida y ser un buen fundamento para la toma de decisiones en base a ella. Por eso mismo, es una herramienta considerada en muchas empresas en muchas estrategias. Basándose también en los datos se encuentra el marketing relacional.

Su ventaja principal es que se almacena en estructuras que permiten que la persistencia de la información sea homogénea y fiable, obteniendo también metadatos que permiten reconocer la pertenencia de la información, forma de cálculo, fiabilidad, periodicidad, etc. Los metadatos pretenden dar soporte a  los técnicos del datawarehouse. Sus desventajas se basan principalmente en el alto costo de mantenimiento.

La primera definición que encontramos del almacen de datos o datawarehouse es la de Bill Inmon, que había escrito sobre este tema y caracterizado precisamente este término con 4 características principales: no volátil, integrado, orientado a temas y variable en el tiempo. Es información  no volátil u ya que no se modifica ni elimina, por lo que se mantiene para las siguientes consultas. Es integrada porque contiene los datos de los sistemas operacionales de manera que son datos consistentes.  Está orientado a temas, es temático porque los elementos se relacionan entre sí en su mismo tema, es variable en el tiempo ya que pueden reflejar las variaciones que se producen a lo largo del tiempo.

Otra definición muy importante la encontramos en Ralph kimball que dice que es una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis.

No sólo tiene ventajas sino funciones interesantes, como el ser una herramienta muy importante para la toma de decisiones de un área funcional ya que se obtiene en ella información integrada y global de ese negocio. También permite aplicar análisis de datos para encontrar relaciones ocultas entre los datos del almacén de datos con el fin de perseguir un valor añadido a la información. Se pueden predecir situaciones futuras en base a datos pasados.

To Top