Introduction à Hadoop

Installer Hadoop

Pré-requis

Hadoop nécessite Java pour être utilisé. Vous pouvez retrouver les versions de Java recommandées pour Hadoop sur le site officiel : https://wiki.apache.org/hadoop/HadoopJavaVersions.

Pour vérifier si vous avez Java ou quelle est votre version, vous pouvez lancer la commande java -version :

1
$ java -version
2
java version "1.8.0_111"
3
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
4
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

Si vous n'avez pas Java ou que votre version risque de poser problème avec Hadoop, vous pouvez installer une version adaptée sur le site officiel de Java : https://www.java.com/fr/.

Téléchargement

Vous pouvez télécharger Hadoop sur son site officiel : http://hadoop.apache.org/releases.html. Je vous conseille la dernière version 2 (la 2.3.7 à l'heure à laquelle j'écris ces lignes).

Vous pouvez aussi télécharger directement la version 2.7.3 à l'adresse suivante : http://apache.mirrors.ovh.net/ftp.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz.

Installation

Une fois téléchargé, Hadoop est un simple fichier binaire à exécuter : il suffit d'extraire l'archive là où vous le souhaitez et de se rendre dans ce dossier avec la console pour commencer à travailler.

Vérification de votre installation

Une fois dans la console, dans le dossier de Hadoop, si vous listez le dossier, vous devriez voir quelque chose comme :

1
$ cd /dossier/de/hadoop
2
$ ls -l
3
total 136
4
drwxr-xr-x 2 tgalopin tgalopin  4096 août  18 03:49 bin
5
drwxr-xr-x 3 tgalopin tgalopin  4096 août  18 03:49 etc
6
drwxr-xr-x 2 tgalopin tgalopin  4096 août  18 03:49 include
7
drwxr-xr-x 3 tgalopin tgalopin  4096 août  18 03:49 lib
8
drwxr-xr-x 2 tgalopin tgalopin  4096 août  18 03:49 libexec
9
-rw-r--r-- 1 tgalopin tgalopin 84854 août  18 03:49 LICENSE.txt
10
-rw-r--r-- 1 tgalopin tgalopin 14978 août  18 03:49 NOTICE.txt
11
-rw-r--r-- 1 tgalopin tgalopin  1366 janv. 10 23:27 README_HDFS.txt
12
-rw-r--r-- 1 tgalopin tgalopin  1366 août  18 03:49 README.txt
13
drwxr-xr-x 2 tgalopin tgalopin  4096 août  18 03:49 sbin
14
drwxr-xr-x 4 tgalopin tgalopin  4096 août  18 03:49 share

Si vous obtenez bien cela, vous pouvez alors lancer la commande ./bin/hadoop version pour vérifier le bon fonctionnement de votre installation :

1
$ cd /dossier/de/hadoop
2
$ ./bin/hadoop version
3
Hadoop 2.7.3
4
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r baa91f7c6bc9cb92be5982de4719c1c8af91ccff
5
Compiled by root on 2016-08-18T01:41Z
6
Compiled with protoc 2.5.0
7
From source with checksum 2e4ce5f957ea4db193bce3734ff29ff4
8
This command was run using /home/tgalopin/hadoop-2.7.3/share/hadoop/common/hadoop-common-2.7.3.jar
PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Titouan Galopin, Bruno Da Silva, Stéphane Karagulmez, 2013-2017 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Paternité - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)