Techno - C’est quoi Apache YARN ?

Techno - C’est quoi Apache YARN ?

Date de sortie
October 3, 2024
Auteur
Bertrand Fabre

Aujourd’hui je vous présente Apache YARN.

Définition rapide

Apache YARN (Yet Another Resource Negotiator) est la technologie de gestion des ressources et de planification des tâches de manière distribuée, qui a entamé la séparation entre stockage et calcul.

Apache Hadoop

Apache YARN est sortie avec la version 2.0 d’Apache Hadoop.

Elle apporte donc une utilisation plus efficace et flexible des ressources du cluster Hadoop.

ResourceManager

C’est lui qui va gérer les ressources globales du cluster et qui les attribue aux applications.

NodeManager

Ce composant est présent sur chaque nœud du cluster et permet l’exécution de tâches, de la surveillance des ressources locales et de la gestion des conteneurs.

ApplicationMaster

C’est lui qui va lancer les containers et se charger de “négocier” avec le ResourceManager tout en travaillant avec le NodeManager pour exécuter et surveiller les tâches.

Compatibilités

Apache YARN supporte différentes application comme Apache Spark, Flink, MapReduce, etc.

Scalable

C’est devenu un classique voire même un basique dans les applications et outils liés à la Big Data, YARN pet s’adapter à des environnements nécessitant des ressources mouvantes, et surtout grandissantes.

Merci de votre lecture !