Hadoop

Hadoop

59,95 $

Maîtriser l’écosystème Big Data : HDFS, MapReduce, Hive, Spark…

Auteur

Oussama Lafi

ISBN

978-2-409-05430-3

Collection

Expert IT

Pages

583 pages

Éditeur

ENI 2026

Disponible au Québec

Juin 2026

Livraison gratuite pour tout achat supérieur à 50$
  • Délai de 4 à 7 jours ouvrables

Le Big Data occupe aujourd’hui une place centrale dans les architectures décisionnelles modernes. Hadoop en est l’un des piliers historiques et demeure une technologie incontournable pour comprendre les fondements du stockage massif et du traitement distribué de données à grande échelle.

Pensé aussi bien pour les débutants que pour les professionnels souhaitant structurer leurs connaissances, cet ouvrage propose un parcours progressif, clair et structuré, qui accompagne le lecteur depuis les bases du Big Data jusqu’à la réalisation de projets concrets avec Hadoop. Après une introduction aux enjeux du Big Data et à la genèse d’Hadoop, le livre détaille l’architecture du framework, son fonctionnement interne et ses briques fondamentales : HDFSYARN et MapReduce.

Le lecteur est guidé pas à pas dans l’installation d’un cluster Hadoop en local, puis dans la manipulation du système de fichiers distribué HDFS à travers des commandes, des exemples pratiques et des scénarios proches des environnements professionnels. Les premiers traitements MapReduce en Python permettent ensuite de comprendre en profondeur la logique du calcul distribué.

L’ouvrage ouvre également sur l’écosystème Hadoop moderne avec HivePigSparkHBaseSqoopOozie, ainsi que les outils d’ingestion, d’orchestration et de gouvernance. Enfin, plusieurs chapitres sont consacrés à des projets Big Data complets, offrant une approche méthodologique, des bonnes pratiques et des cas d’usage concrets.