Principe de l'ETL

DéfinitionProcessus "Extraction, Transformation, Load"

L'ETL[1] est le processus qui permet de charger un data warehouse à partir de données externes généralement issues de bases transactionnelles. Son rôle est de récupérer ces données et de les traiter pour qu'elles correspondent aux besoins du modèle dimensionnel.

En général les données sources doivent être "nettoyées" et aménagées pour être exploitables par les outils décisionnels.

Fondamental

You get the data out of its original source location (E), you do something to it (T), and then you load it (L) into a final set of tables for the users to query.

(Kimball et al., 2008, p369)[2]

Fondamental

Selon Kimball (2004, p.xxi)[3] 70% de l'effort consacré à un projet de BI est dépensé dans l'ETL.