Les clients Datastage
La partie cliente de Datastage se compose des modules suivants:
Administrator : Administration des projets DataStage et du Serveur.
Designer : Création des jobs DataStage
Director : Lancement et suivi d'exécution des jobs DataStage
Manager : Gestion des méta données du référentiel
Nous n'aborderons dans ce cours que les modules Designer et Director, essentiels à tout nouveau développeur Datastage.
Datastage Designer
DataStage Designer permet de développer des processus afin d'extraire, de nettoyer, de transformer, d'intégrer et de charger les données dans les tables du DataWarehouse.
DataStage Designer fournit en outre une méthode de flux de données visuelle pour interconnecter et configurer facilement les composants réutilisables.
Développement sous Designer
Définition : Un job
Chaque travail (ou Job) spécifie les sources de données, les transformations éventuelles et la destination des données.
Un job peut être assimilé à un "traitement", c'est un programme Datastage exécutable.
Les jobs DataStage sont :
Conçus et bâtis sous Designer.
Planifiés, appelés et surveillés sous Director.
Exécutés sous le contrôle de DataStage.
Définition : Un stage
Un Job est composé de stages reliés entre eux par des liens. Ces liens décrivent le flux de données.
Les stages réalisent la plupart des plus courantes opérations d'intégration de données comme le tri (Sort Stage) ou la jointure (Join Stage).
Il est possible de définir ses propres stages sous Datastage en C++.
Plus d'informations, ici.
Définition : Job Sequence
Une Job Sequence est ... une séquence de jobs. Cela permet d'agencer les jobs, ou plutôt l'exécution des jobs selon l'ordre désiré. Plus encore, une Sequence permet de réaliser des boucles de traitements ou de les "triggeriser".
Datastage Director
DataStage Director permet de valider, exécuter, planifier et surveiller les jobs DataStage. Il permet également de collecter des statistiques d'exécution des jobs.
La visualisation de l'exécution des jobs sous Director peut se faire selon 3 modes différents :
Mode Status : liste les jobs en mentionnant leur Statut (Compilé, Non Compilé, Finished, Aborted,...), les date et heure de début d'exécution et les date et heure de dernière exécution.
Mode Schedule : Liste le détail des jobs à exécuter via le scheduler en mentionnant les options de l'exécution (date et heure, valeur des paramètres,...).
Mode Log : affiche le journal détaillé de l'exécution d'un Job donné.