Pourquoi MapReduce ?
Rappel : Big Data
MapReduce essaie de répondre aux problématique amené par les Big Data, qui sont des données:
volumineuses,
variées,
complexes,
qui changent rapidement.
Solution de MapReduce
MapReduce résout le problème en divisant les taches de traitement en plus petites parties et en les assignant à plusieurs ordinateurs.
A la fin du traitement, les résultats sont collecté à un seul endroit et intégré pour former le résultat de traitement.
Remarque : Qui l'utilise ?
Cette solution est utilisée par toutes les entreprises qui doivent gérés de gros volumes de données :
Facebook
Twitter
Amazon
Google
Exemple : Pour quel besoin ?
Facebook l'utilise pour la production de rapports à usage interne, comme la performance des campagnes publicitaires opérées par la plate-forme sociale, ou des statistiques diverses (croissance du nombre des utilisateurs, consultation des pages, temps moyen de consultation du site, etc.
Complément : Dans quel contexte l'utiliser ?
Pour des données non structuré et sans schéma (pas de langage trop lourd comme le SQL, XML).
Pour de très grand clusters.
Traitement et analyse de type batch.