L'ETL est le processus qui permet de charger un data warehouse à partir de données externes généralement issues de bases transactionnelles. Son rôle est de récupérer ces données et de les traiter pour qu'elles correspondent aux besoins du modèle dimensionnel.
En général les données sources doivent être "nettoyées" et aménagées pour être exploitables par les outils décisionnels.
You get the data out of its original source location (E), you do something to it (T), and then you load it (L) into a final set of tables for the users to query.
Selon Kimball (2004, p.xxi) 70% de l'effort consacré à un projet de BI est dépensé dans l'ETL.