Approche générale de modélisation
Rappel :
Fondamental :
Un modèle dimensionnel est le résultat :
d'une analyse des besoins : ce que je souhaite étudier.
d'une analyse des données disponibles : ce que je peux étudier.
Méthode : Méthode générale de modélisation
Analyse des données
Étude des sources de données (quantification, analyses générales)
Qualification des données (qualité et intérêt)
Intégration logique des données (simulation d'un schéma relationnel virtuel)
Normalisation du schéma virtuel en 3NF pour en avoir une vue cohérente
Analyse des besoins clients
Exprimer les besoins sous la forme de requêtes décisionnelles
Réaliser les vues hiérarchiques pour chaque requête
Sélectionner les requêtes qui seront effectivement réalisables en fonction des données disponibles
Conception du data warehouse et des data marts
Séparer les requêtes en fonction de la granularité de la table des faits (grain fin des ventes, grain plus grossier du ticket de caisse, etc.)
Créer un data warehouse intégrant toutes les requêtes de grain fin
Extraire un data mart par niveau de grain supérieur et/ou pour des thématiques particulières nécessitant par exemple une pré-agrégation
Remarque :
Il est généralement intéressant de paralléliser les tâches d'analyse des besoins et d'analyse des données.
En particulier il est inutile d'aller trop loin dans l'expression de besoins que l'on sait a priori impossibles à satisfaire pour cause d'absence de donnée ou d'absence de donnée exploitable.
Rappel : Informations
Il est conseillé de conserver certains champs d'information dans le modèle dimensionnel, même s'ils ne seront pas exploités pour les calculs ou les agrégats.
Cela permettra par exemple d'identifier des enregistrements, comme les désignations de produits.
On pourra noter en italique ces champs dans le modèle dimensionnel.