Exploitation des données

Les données agrégées dans un système décisionnel servent à trois grandes catégories d'usage :

  • La production de rapport récurrents (reporting)

  • L'exploration manuelle

  • L'analyse de données (descriptive ou prédictive)

DéfinitionReporting

Le principe du reporting est d'agréger et de synthétiser des données nombreuses et complexes sous forme d'indicateurs, de tableaux, de graphiques permettant d'en avoir une appréhension globale et simplifiée.

Le reporting s'appuie principalement sur les agrégats (GROUP BY en SQL par exemple) afin de faire apparaître des comptages, sommes ou moyennes en fonction de critères d'analyses.

Le reporting est généralement récurrent, le même rapport sera produit à intervalles réguliers pour contrôler les variations des indicateurs.

DéfinitionExploration manuelle

Une autre exploitation de données en contexte décisionnel consiste à pouvoir explorer les données de façon peu dirigée (heuristique) afin de trouver des réponses à des questions que l'on ne s'est pas posées (sérendipité). L'idée générale est plutôt que les réponses aux premières questions que l'on se posent conduiront à se poser de nouvelles questions.

L'exploration de données s'appuie sur des outils permettant de manipulation (IHM) et de visualiser (infovis) les données selon des requêtes dynamiquement produites par des utilisateurs experts du domaine.

DéfinitionAnalyse de données

L'analyse de données est une branche de la statistique qui permet de mettre en évidence des tendances des données ou corrélations entre les données non évidentes a priori.

  • Dans le cas de l'analyse descriptive, ll s'agit de rechercher une information statistique "cachée" que l'on ne connaît pas a priori.

  • L'approche prédictive consiste à réaliser un modèle statistique des corrélations entre les données à partir d'échantillons d'apprentissage, puis à appliquer le modèle à des données nouvelles pour prédire leur comportement, avec des raisonnements du type "si ... alors" ; ou pour classifier des données (tel objet caractérisé par telles données appartient-il à telle classe ?). Les résultats sont généralement qualifiés par une probabilité d’occurrence.