ETL avec Pentaho Data Integration

Spoon

Rappel

Spoon est l'interface graphique de Pentaho Data Integration qui permet de créer graphiquement un processus d'ETL.

Espace de travail

Spoon manipule deux sortes d'objets :

  • les transformations ;

  • et les tâches.

DéfinitionTransformation

Comme son nom l'indique, la transformation va permettre d'effectuer des transformations sur les données. Plus largement, elle récupère les données depuis leurs sources, effectue les traitements sur ces données et délivre les données résultantes.

Ce type d'objet sera sauvegardé dans des fichiers portant l'extension .ktr (pour Kettle transformation).

DéfinitionTâche

Une tâche, quant à elle, ne permet pas de travailler directement sur les données mais propose différents services autour de celles-ci.

Ce type d'objet sera sauvegardé dans des fichiers portant l'extension .kjb (pour Kettle job).

ExempleExemples de services de tâche

  • Vérification de la présence d'un fichier

  • Synchronisation des transformations

  • Alerte par mail en cas d'échec d'une transformation

  • ...

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Morgane Becret, Stéphane Crozat, 2014-2015 Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)