Data warehouse et data mart
Un data warehouse et un data mart se distinguent par le spectre qu'il recouvre :
Le data warehouse recouvre l'ensemble des données et problématiques d'analyse visées par l'entreprise.
Le data mart recouvre une partie des données et problématiques liées à un métier ou un sujet d'analyse en particulier
Un data mart est fréquemment un sous-ensemble du data warehouse de l'entreprise, obtenu par extraction et agrégation des données de celui-ci.
Pourquoi des data marts ?
Les data marts sont destinés à pré-agréger des données disponibles de façon plus détaillée dans les data warehouse, afin à traiter plus facilement certaines questions spécifiques, critiques, etc.
Exemple : Ticket de caisse
Si un data warehouse enregistre un ensemble de ventes d'articles avec un grain très fin, un data mart peut faciliter une analyse dite de ticket de caisse (co-occurrence de ventes de produits par exemple) en adoptant un grain plus grossier (le ticket plutôt que l'article).
Complément : Ticket de caisse
La lecture de Entrepôts de données : guide pratique de modélisation dimensionnelle[1] est recommandée pour la modélisation dimensionnelle des tickets de caisse (en particulier pages 31-60 sur la grande distribution).