Approche générale de modélisation

Fondamental

Un modèle dimensionnel est le résultat :

  • d'une analyse des besoins : ce que je souhaite étudier.

  • d'une analyse des données disponibles : ce que je peux étudier.

MéthodeMéthode générale de modélisation

  1. Analyse des données

    1. Étude des sources de données (quantification, analyses générales)

    2. Qualification des données (qualité et intérêt)

    3. Intégration logique des données (simulation d'un schéma relationnel virtuel)

    4. Normalisation du schéma virtuel en 3NF pour en avoir une vue cohérente

  2. Analyse des besoins clients

    1. Exprimer les besoins sous la forme de requêtes décisionnelles

    2. Réaliser les vues hiérarchiques pour chaque requête

  3. Sélectionner les requêtes qui seront effectivement réalisables en fonction des données disponibles

  4. Conception du data warehouse et des data marts

    1. Séparer les requêtes en fonction de la granularité de la table des faits (grain fin des ventes, grain plus grossier du ticket de caisse, etc.)

    2. Créer un data warehouse intégrant toutes les requêtes de grain fin

    3. Extraire un data mart par niveau de grain supérieur et/ou pour des thématiques particulières nécessitant par exemple une pré-agrégation

Éléments méthodologiques pour la modélisation dimensionnelle

Remarque

Il est généralement intéressant de paralléliser les tâches d'analyse des besoins et d'analyse des données.

En particulier il est inutile d'aller trop loin dans l'expression de besoins que l'on sait a priori impossibles à satisfaire pour cause d'absence de donnée ou d'absence de donnée exploitable.

RappelInformations

Il est conseillé de conserver certains champs d'information dans le modèle dimensionnel, même s'ils ne seront pas exploités pour les calculs ou les agrégats.

Cela permettra par exemple d'identifier des enregistrements, comme les désignations de produits.

On pourra noter en italique ces champs dans le modèle dimensionnel.