MapReduce dans Hadoop

Découverte des jobs

Comment utiliser les jobs déjà présent dans Hadoop ?

Une fois Hadoop installé et lancé, il suffit de lancé les exemples déjà présent sous le nom de hadoop-mapreduce-examples-{version}.jar du répertoire /usr/lib/hadoop-mapreduce à l'aide de la commande :

sudo -u USER hadoop jar /usr/lib/hadoop-mapreduce/JAR ARGUMENT1 ARGUMENT2 ARGUMENT3

Premier Job : Calcul de PI

Ce premier job MapReduce permet d'estimer la valeur du nombre pi et ne requiert pas de fichiers.

Le programme utilise une méthode statistique Monte-Carlo pour faire l'estimation.

Question

Lancer hadoop-mapreduce-examples-{version} avec comme argument pi, le nombre de map souhaitées (2) et le nombre d'échantillon souhaités par map (5).

Question

NbMots.txt

Ajouter le fichier NbMots.txt dans le système de fichier.

Lancer hadoop-mapreduce-examples-{version} avec comme argument wordcount le nom du fichier en input (NbMots.txt) et la sortie (out).

Ce fichier contient la phrase suivante :

Tout ce qui est rare est cher , un cheval bon marché est rare , donc un cheval bon marché est cher .

Question

Lancer hadoop-mapreduce-examples-{version} avec comme argument wordmean le nom du fichier en input (NbMots.txt) et la sortie (out).

Question

sudoku.dta

http://www.mkyong.com/hadoop/how-to-solve-sudoku-using-hadoop/

Ajouter le fichier sudoku.dta dans le système de fichier.

Lancer hadoop-mapreduce-examples-{version} avec comme argument sudoku le nom du fichier en input (sudoku.dta).

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Oriane Colomb, Bruno Da Silva, Stéphane Karagulmez, 2013-2017 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Réalisé avec Scenari (nouvelle fenêtre)