Data warehouse et data mart

Un data warehouse et un data mart se distinguent par le spectre qu'il recouvre :

  • Le data warehouse recouvre l'ensemble des données et problématiques d'analyse visées par l'entreprise.

  • Le data mart recouvre une partie des données et problématiques liées à un métier ou un sujet d'analyse en particulier

Un data mart est fréquemment un sous-ensemble du data warehouse de l'entreprise, obtenu par extraction et agrégation des données de celui-ci.

Datawarehouse et datamarts

Pourquoi des data marts ?

Les data marts sont destinés à pré-agréger des données disponibles de façon plus détaillée dans les data warehouse, afin à traiter plus facilement certaines questions spécifiques, critiques, etc.

ExempleTicket de caisse

Si un data warehouse enregistre un ensemble de ventes d'articles avec un grain très fin, un data mart peut faciliter une analyse dite de ticket de caisse (co-occurrence de ventes de produits par exemple) en adoptant un grain plus grossier (le ticket plutôt que l'article).

ComplémentTicket de caisse

La lecture de Entrepôts de données : guide pratique de modélisation dimensionnelle[1] est recommandée pour la modélisation dimensionnelle des tickets de caisse (en particulier pages 31-60 sur la grande distribution).