MapReduce dans Hadoop

Principe du Map

Concept général du Map

Dans l'étape Map, le but est de partir d'un couple <clé, valeur> et d'y associé de nouveaux couples <clé, valeur>.

1
// En pseudo code cela donnerait
2
Map(void * document) {
3
    int cles = 1;
4
    foreach mot in document
5
        calculIntermediaire(mot, cles);
6
}

Le nombre de tâches Map ne dépend pas du nombre de nœuds, mais du nombre de blocs de données en entrée. Chaque bloc se fait assigner une seule tâche Map. De plus, toutes les tâches Map n'ont pas besoin d'être exécutées en même temps en parallèle.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Oriane Colomb, Bruno Da Silva, Stéphane Karagulmez, 2013-2017 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Réalisé avec Scenari (nouvelle fenêtre)