Arbitrages pour le choix des données
Conseil : Pilotage par les besoins
Un projet de datawarehouse est destiné à répondre à des besoins d'analyse, en cela il doit prioritairement prendre en considération les besoins réels d'analyse des utilisateurs. En particulier il est déconseillé de travailler uniquement à partir des données sources existantes, puisque les utilisateurs cherchent justement à sortir de la réalité transactionnelle ( Entrepôts de données : guide pratique de modélisation dimensionnelle[1], p.34).
Bien entendu, la possibilité de répondre aux besoins dépend des données disponibles et de leur qualité.
Méthode : Diagramme Utilité / Qualité
Chaque données peut être qualifiée selon une utilité (donnée intéressante ou non) et une qualité (données facile à exploiter ou coûteuse à nettoyer).
Ces deux paramètres peuvent ensuite servir à choisir les données que l'on conserve (et que l'on va devoir éventuellement nettoyer) de celle que l'on abandonne.