Diferencia entre Data Warehouse y Data Mart

Autor: Laura McKinney
Fecha De Creación: 2 Abril 2021
Fecha De Actualización: 13 Mayo 2024
Anonim
Data Lake vs Data Warehouse vs Data Mart: características y beneficios
Video: Data Lake vs Data Warehouse vs Data Mart: características y beneficios

Contenido


El almacén de datos y Data mart se utilizan como repositorio de datos y sirven el mismo propósito. Estos se pueden diferenciar a través de la cantidad de datos o información que almacenan.La diferencia vital entre un almacén de datos y un data mart es que un data warehouse es una base de datos que almacena información orientada a satisfacer las solicitudes de toma de decisiones, mientras que data mart es un subconjunto lógico completo de un almacén de datos completo.

En palabras simples, un data mart es un almacén de datos de alcance limitado y cuyos datos se pueden obtener resumiendo y seleccionando los datos del almacén de datos o con la ayuda de distintos procesos de extracción, transformación y carga del sistema de datos de origen.

  1. Cuadro comparativo
  2. Definición
  3. Diferencias clave
  4. Conclusión

Cuadro comparativo

Bases para la comparaciónAlmacén de datosData Mart
BásicoEl almacén de datos es independiente de la aplicación.El mercado de datos es específico para la aplicación del sistema de soporte de decisiones.
Tipo de sistema CentralizadoDescentralizado
Forma de datosDetalladoResumido
Uso de denormalizaciónLos datos están ligeramente desnormalizados.Los datos están altamente desnormalizados.
Modelo de datosDe arriba hacia abajoDe abajo hacia arriba
NaturalezaFlexible, orientado a datos y larga vida.Restrictivo, orientado a proyectos y corta vida.
Tipo de esquema utilizadoConstelación de hechosEstrella y copo de nieve
Facilidad de construcciónDifícil de construirSimple de construir


Definición de Data Warehouse

El termino almacén de datos significa una variante de tiempo, orientada a temas, no volátil y un grupo integrado de datos que ayudan en Toma de decisiones proceso de la gestión. Alternativamente, es un depósito de información recopilada de múltiples fuentes, almacenada en un esquema unificado, en un único sitio que permite la integración de una variedad de sistemas de aplicaciones. Una vez que se recopilan estos datos, se almacenan durante mucho tiempo, por lo tanto, tienen una larga vida y permiten el acceso a históricoinformación.

En consecuencia, el almacén de datos proporciona al usuario un único integrado interfaz con los datos a través de los cuales el usuario puede escribir consultas de soporte de decisiones fácilmente. El almacén de datos ayuda a convertir los datos en información. El diseño de un almacén de datos incluye un enfoque de arriba hacia abajo.


Recopila información sobre temas que abarcan toda la organización, como clientes, ventas, activos, artículos y, por lo tanto, su rango abarca toda la empresa. Generalmente, constelación de hechos se utiliza el esquema, que cubre una amplia variedad de temas. Un almacén de datos no es una estructura estática y es evolucionando continuamente.

Definición de Data Mart

UNA data mart se puede llamar como un subconjunto de un almacén de datos o un subgrupo de datos corporativos correspondientes a un determinado conjunto de usuarios. El almacén de datos involucra varios departamental y lógico marts de datos que deben ser persistentes en su ilustración de datos para garantizar robustez de un almacén de datos. Un data mart es un conjunto de tablas que se concentran en un tarea individual Estos están diseñados utilizando un enfoque ascendente.

La extensión del mercado de datos está restringida a algún tema específico elegido, por lo tanto, su alcance abarca todo el departamento. Estos generalmente se implementan en bajo costo servidores departamentales. El ciclo de implementación de los data marts se supervisa en semanas en lugar de mes y año.

Comoestrella y esquema de copo de nieve se dirigen hacia el modelado de un solo sujeto, por eso estos se usan comúnmente en el mercado de datos. Aunque, el esquema de estrella es más popular que el esquema de copo de nieve. Dependiendo de la fuente de datos, los marts de datos se pueden clasificar en dos tipos: dependiente y independiente data marts.

  1. El almacén de datos es independiente de la aplicación, mientras que data mart es específico para la aplicación del sistema de soporte de decisiones.
  2. Los datos se almacenan en un solo, centralizado repositorio en un almacén de datos. En contraposición, data mart almacena datos descentralmente en el área de usuario.
  3. El almacén de datos contiene un detallado forma de datos Por el contrario, data mart contiene resumido y datos seleccionados.
  4. Los datos en un almacén de datos son ligeramente desnormalizado mientras que en el caso de Data Mart es muy desnormalizado.
  5. La construcción del almacén de datos implica De arriba hacia abajo acercarse a, aproximarse. Por el contrario, al construir un data mart elde abajo hacia arriba Se utiliza el enfoque.
  6. El almacén de datos es flexible, orientado a la información y la naturaleza existente desde hace mucho tiempo. Por el contrario, un data mart es restrictivo, orientado a proyectos y tiene una existencia más corta.
  7. El esquema de constelación de hechos se usa generalmente para modelar un almacén de datos, mientras que en el esquema de estrella de data mart es más popular.

Conclusión

El almacén de datos proporciona una vista empresarial, un sistema de almacenamiento único y centralizado, una arquitectura inherente y una independencia de la aplicación, mientras que Data mart es un subconjunto de un almacén de datos que proporciona una vista de departamento, almacenamiento descentralizado. Como el almacén de datos es muy grande e integrado, tiene un alto riesgo de falla y dificultad para construirlo. Por otro lado, el data mart es fácil de construir y el riesgo de falla asociado también es menor, pero data mart podría experimentar fragmentación.