L'ETL Datastage

Les clients Datastage

La partie cliente de Datastage se compose des modules suivants:

  • Administrator : Administration des projets DataStage et du Serveur.

  • Designer : Création des jobs DataStage

  • Director : Lancement et suivi d'exécution des jobs DataStage

  • Manager : Gestion des méta données du référentiel

Nous n'aborderons dans ce cours que les modules Designer et Director, essentiels à tout nouveau développeur Datastage.

Datastage Designer

Interface graphique de Designer

DataStage Designer permet de développer des processus afin d'extraire, de nettoyer, de transformer, d'intégrer et de charger les données dans les tables du DataWarehouse.

DataStage Designer fournit en outre une méthode de flux de données visuelle pour interconnecter et configurer facilement les composants réutilisables.

Développement sous Designer

DéfinitionUn job

Chaque travail (ou Job) spécifie les sources de données, les transformations éventuelles et la destination des données.

Un job peut être assimilé à un "traitement", c'est un programme Datastage exécutable.

Les jobs DataStage sont :

  • Conçus et bâtis sous Designer.

  • Planifiés, appelés et surveillés sous Director.

  • Exécutés sous le contrôle de DataStage.

DéfinitionUn stage

Un Job est composé de stages reliés entre eux par des liens. Ces liens décrivent le flux de données.

Les stages réalisent la plupart des plus courantes opérations d'intégration de données comme le tri (Sort Stage) ou la jointure (Join Stage).

Il est possible de définir ses propres stages sous Datastage en C++.

Plus d'informations, ici.

DéfinitionJob Sequence

Une Job Sequence est ... une séquence de jobs. Cela permet d'agencer les jobs, ou plutôt l'exécution des jobs selon l'ordre désiré. Plus encore, une Sequence permet de réaliser des boucles de traitements ou de les "triggeriser".

Datastage Director

Datastage Director

DataStage Director permet de valider, exécuter, planifier et surveiller les jobs DataStage. Il permet également de collecter des statistiques d'exécution des jobs.

La visualisation de l'exécution des jobs sous Director peut se faire selon 3 modes différents :

Mode Status  : liste les jobs en mentionnant leur Statut (Compilé, Non Compilé, Finished, Aborted,...), les date et heure de début d'exécution et les date et heure de dernière exécution.

Mode Schedule   : Liste le détail des jobs à exécuter via le scheduler en mentionnant les options de l'exécution (date et heure, valeur des paramètres,...).

Mode Log  : affiche le journal détaillé de l'exécution d'un Job donné.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Sélim Zénagui, 2013 Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)