Installer Hadoop
Pré-requis
Hadoop nécessite Java pour être utilisé. Vous pouvez retrouver les versions de Java recommandées pour Hadoop sur le site officiel : https://wiki.apache.org/hadoop/HadoopJavaVersions.
Pour vérifier si vous avez Java ou quelle est votre version, vous pouvez lancer la commande java -version
:
$ java -version
java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)
Si vous n'avez pas Java ou que votre version risque de poser problème avec Hadoop, vous pouvez installer une version adaptée sur le site officiel de Java : https://www.java.com/fr/.
Téléchargement
Vous pouvez télécharger Hadoop sur son site officiel : http://hadoop.apache.org/releases.html. Je vous conseille la dernière version 2 (la 2.3.7 à l'heure à laquelle j'écris ces lignes).
Vous pouvez aussi télécharger directement la version 2.7.3 à l'adresse suivante : http://apache.mirrors.ovh.net/ftp.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz.
Installation
Une fois téléchargé, Hadoop est un simple fichier binaire à exécuter : il suffit d'extraire l'archive là où vous le souhaitez et de se rendre dans ce dossier avec la console pour commencer à travailler.
Vérification de votre installation
Une fois dans la console, dans le dossier de Hadoop, si vous listez le dossier, vous devriez voir quelque chose comme :
$ cd /dossier/de/hadoop
$ ls -l
total 136
drwxr-xr-x 2 tgalopin tgalopin 4096 août 18 03:49 bin
drwxr-xr-x 3 tgalopin tgalopin 4096 août 18 03:49 etc
drwxr-xr-x 2 tgalopin tgalopin 4096 août 18 03:49 include
drwxr-xr-x 3 tgalopin tgalopin 4096 août 18 03:49 lib
drwxr-xr-x 2 tgalopin tgalopin 4096 août 18 03:49 libexec
-rw-r--r-- 1 tgalopin tgalopin 84854 août 18 03:49 LICENSE.txt
-rw-r--r-- 1 tgalopin tgalopin 14978 août 18 03:49 NOTICE.txt
-rw-r--r-- 1 tgalopin tgalopin 1366 janv. 10 23:27 README_HDFS.txt
-rw-r--r-- 1 tgalopin tgalopin 1366 août 18 03:49 README.txt
drwxr-xr-x 2 tgalopin tgalopin 4096 août 18 03:49 sbin
drwxr-xr-x 4 tgalopin tgalopin 4096 août 18 03:49 share
Si vous obtenez bien cela, vous pouvez alors lancer la commande ./bin/hadoop version
pour vérifier le bon fonctionnement de votre installation :
$ cd /dossier/de/hadoop
$ ./bin/hadoop version
Hadoop 2.7.3
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r baa91f7c6bc9cb92be5982de4719c1c8af91ccff
Compiled by root on 2016-08-18T01:41Z
Compiled with protoc 2.5.0
From source with checksum 2e4ce5f957ea4db193bce3734ff29ff4
This command was run using /home/tgalopin/hadoop-2.7.3/share/hadoop/common/hadoop-common-2.7.3.jar