ETL avec Pentaho Data Integration

Les modules de PDI

Spoon

Ce module propose une interface graphique qui permet à l'utilisateur de créer facilement un processus d'ETL sans avoir à saisir de code. C'est le seul module de PDI qui propose une interface graphique. Pour tous les autres, il faut passer par l'invite de commandes.

Pan

Ce module permet d'exécuter les transformations réalisées dans Spoon en utilisant l'invite de commandes.

ExempleExécution de la transformation Hello avec Pan

Requête : Pan.bat /file <chemin>/Hello.ktr /norep

Cela permet de lancer des transformations sur nos données sans ouvrir de logiciel et éventuellement, comme cela pourrait être le cas dans une entreprise, de lancer facilement l'exécution de multiples transformations via un simple batch.

Kitchen

Kitchen permet l'exécution de tâches en mode batch et propose un plan de suivi de ces tâches pour contrôler facilement le processus d'ETL.

ExempleExécution de la tâche updateWarehouse avec Kitchen

Requête : kitchen.bat /file:<chemin>\updateWarehouse.kjb /level:Basic

De même que précédemment, cela facilite l'exécution des tâches construites via l'interface graphique.

Carte

Ce module est en fait un serveur web qui permet d'exécuter des tâches ET des transformations à distance. Pour cela, il prend en compte un fichier XML (en utilisant une servlet) qui contient la transformation ou la tâche à exécuter et la configuration d'exécution. Il permet également de contrôler à distance, démarrer ou arrêter les processus en cours sur le serveur.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Morgane Becret, Stéphane Crozat, 2014-2015 Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)