Arbitrages pour le choix des données

ConseilPilotage par les besoins

Un projet de datawarehouse est destiné à répondre à des besoins d'analyse, en cela il doit prioritairement prendre en considération les besoins réels d'analyse des utilisateurs. En particulier il est déconseillé de travailler uniquement à partir des données sources existantes, puisque les utilisateurs cherchent justement à sortir de la réalité transactionnelle ( Entrepôts de données : guide pratique de modélisation dimensionnelle[1], p.34).

Bien entendu, la possibilité de répondre aux besoins dépend des données disponibles et de leur qualité.

MéthodeDiagramme Utilité / Qualité

Chaque données peut être qualifiée selon une utilité (donnée intéressante ou non) et une qualité (données facile à exploiter ou coûteuse à nettoyer).

Ces deux paramètres peuvent ensuite servir à choisir les données que l'on conserve (et que l'on va devoir éventuellement nettoyer) de celle que l'on abandonne.

Diagramme Utilité / Qualité