MapReduce dans Hadoop

Pourquoi MapReduce ?

RappelBig Data

MapReduce essaie de répondre aux problématique amené par les Big Data, qui sont des données:

  • volumineuses,

  • variées,

  • complexes,

  • qui changent rapidement.

Solution de MapReduce

MapReduce résout le problème en divisant les taches de traitement en plus petites parties et en les assignant à plusieurs ordinateurs.

A la fin du traitement, les résultats sont collecté à un seul endroit et intégré pour former le résultat de traitement.

https://www.tutorialspoint.com/map_reduce/map_reduce_introduction.htm

RemarqueQui l'utilise ?

Cette solution est utilisée par toutes les entreprises qui doivent gérés de gros volumes de données :

  • Facebook

  • Twitter

  • Amazon

  • Google

ExemplePour quel besoin ?

Facebook l'utilise pour la production de rapports à usage interne, comme la performance des campagnes publicitaires opérées par la plate-forme sociale, ou des statistiques diverses (croissance du nombre des utilisateurs, consultation des pages, temps moyen de consultation du site, etc.

ComplémentDans quel contexte l'utiliser ?

  • Pour des données non structuré et sans schéma (pas de langage trop lourd comme le SQL, XML).

  • Pour de très grand clusters.

  • Traitement et analyse de type batch.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Oriane Colomb, Bruno Da Silva, Stéphane Karagulmez, 2013-2017 (Contributions : Stéphane Crozat, les étudiants de l'UTC) Réalisé avec Scenari (nouvelle fenêtre)