Objectifs du modèle dimensionnel
La modélisation par schéma en étoile, par opposition aux schémas normalisés en 3NF, permet de répondre à deux besoins caractéristiques des systèmes décisionnels : la performance et la simplicité des requêtes.
Performance
En effet en tant que structures redondantes les schémas en étoiles permettent d'agréger la table des faits avec n'importe qu'elle dimension en une seule opération de jointure (deux ou trois pour les schémas en flocons).
Ce gain de performance est souvent critique puisque les volumes de données sont généralement d'un ordre de grandeur très supérieur à celui des systèmes transactionnels.
Cette redondance ne pose pas les mêmes problèmes que dans les systèmes transactionnels, en effet :
les données étant statiques (importées), il n'y a pas de risque de divergence d'information lors de mises à jour
l'usage du datawarehouse étant essentiellement statistique (regroupement), la conséquence d'une éventuelle erreur n'est pas du même ordre que dans un système transactionnel.
Simplicité
La présentation en étoile des données, avec les faits au centre et les dimensions autour, est particulièrement adaptée à l'écriture rapide de requêtes simples pour agréger des données de la table des faits selon des regroupements sur les tables de dimensions.
L'enjeu est de pouvoir répondre simplement et rapidement à une question simple, tandis qu'un modèle transactionnel, qui répond à d'autres contraintes, nécessitera souvent un code SQL complexe et des opérations multiples pour répondre à la même question. Cela permet notamment aux utilisateurs finaux de construire facilement de nouvelles requêtes au fil de leur exploration des données.
Fondamental : Caractéristiques d'un bon modèle décisionnel
Être performant pour le calcul d’agrégats sur de gros volumes de données (exploration de données, reporting)
Être appréhendable par un utilisateur final, en particulier pour formuler facilement des requêtes (exploration de données)
Être suffisamment performant au chargement pour répondre aux sollicitations de mise à jour (ETL[1])
Être évolutif en fonction des évolutions amont (sources transactionnels) et aval (besoins d'exploitation) (ETL, métadonnées)