Inteligencia de Negocios: Definiciones de Data Warehouse

De acuerdo con la versión en castellano de Wikipedia se definen las bodegas de datos (Data Warehouse) como:

Una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza.” [1]

Y esta definición viene de la fuente original, Bill Inmon (padre del Data Warehouse). Él lo expresa en estos términos en libro “Building the Data Warehouse”. También, en versiones más actualizadas de sus publicaciones, por ejemplo, en libro “DW 2.0 The Architecture for the Next Generation of Data Warehousing”, usa variantes de esta misma definición.

Pero si contrastamos esta descripción la definición que la misma enciclopedia libre tiene en la versión de habla inglesa y que dice:

sistema utilizado para la presentación de informes y el análisis de datos, que considera el componente fundamental de la inteligencia de negocios. Los Data Warehouse son repositorios centrales de datos integrados de una o más fuentes dispares. Se almacenan los datos históricos e históricos en un solo lugar y se utilizan para crear informes analíticos para los trabajadores del conocimiento en toda la empresa.[2]

Está claro que la definición del Wikipedia en ingles está influenciada por la definición de Ralph Kimball, tal y como queda plasmada en el “The Data Warehouse ETL Toolkit” y que apunta:

es un sistema que extrae, limpia, adapta y entrega datos de origen en un almacén de datos dimensional y luego soporta e implementa consultas y análisis con el propósito de tomar decisiones.

Pero, a pesar de que influenciada por la definición de Kimball al eliminar la palabra dimensional de la definición del Wikipedia en inglés, esta descripción se aleja del elemento más fundamental de la metodología Kimball.

A mi gusto hay diferencias significativas entre las dos definiciones y que me gustaría enfatizar:

  • La versión en castellano es mucho más clara ya que al dar una lista de características permite a los desarrolladores clasificar más claramente que es y que no es un DW. La versión en inglés mucho más ambigua.
  • La versión en castellano define la Bodega como Repositorio, mientras que la versión en inglés enfatiza la dualidad del DW: es sistema en la primera parte de la definición y es repositorio en la segunda.
  • La versión en español enfatiza la unicidad del DW al declarar que es “una colección de datos”, mientras que en la versión de habla inglesa de la definición se refiere a “los Data Warehouse” y al usarlo como plural abre las puertas a muchas implementaciones del DW.
  • La versión en inglés hacer referencia a inteligencia de negocios que es un concepto que nace después del DW y que puede o no incluir al DW.

Revisar con tanto detalle un término podría parecer extremo, pero no lo es. Tal como lo menciona Ronald G. Ross en su libro Business Rule Concepts, un término representa solo la punta del iceberg con respecto a su significado ya que en realidad el concepto detrás de la definición representa un bloque fundamental sobre nuestras creencias y forma de pensar.

Yo por mi parte me quedo con la definición de Bill Inmon porque me parece que el termino es mucho más preciso, sin que esto signifique que siempre promueva su esquema de arquitectura. De hecho, mi enfoque pragmático de arquitectura me lleva con frecuencia a usar diseños que distan mucho de su guía modelo.

¿Cuál es tu opinión sobre las múltiples definiciones de Data Warehouse? ¿Con cuál definición te quedas?

2 respuestas a «Inteligencia de Negocios: Definiciones de Data Warehouse»

  1. Avatar de miguelegea

    Ya sabes que compartimos buena parte de las ideas. Aunque yo últimamente en arquitecturas estoy usando (quizá abusando) mucho de áreas de DI. me resultan cómodas a la hora de construir muy sistemáticamente y de poder usar mucho sql para crear transformaciones.

    1. Avatar de javiersql

      Si claro creo que en general nuestra practica de BI está muy alineada.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *