Techno - C’est quoi Apache Atlas ?

Techno - C’est quoi Apache Atlas ?

Date de sortie
August 15, 2024
Auteur
Bertrand Fabre

Aujourd’hui, je vous présente l’outil Apache Atlas.

Définition rapide

Apache Atlas est un outil de Data Governance qui permet de mieux comprendre et gérer les métadonnées.

Data Catalog

Le catalogue de données d'Apache Atlas permet aux utilisateurs de rechercher et de découvrir des Datasets, d'en connaître l'origine (Data Lineage), et d'en comprendre la structure.

Classification des Données

Apache Atlas permet de classer les données. Par exemple, on peut marquer des données comme "sensibles" ou "confidentielles" afin d’aider à appliquer des règles de gouvernance spécifiques.

API REST

Apache Atlas propose une API RESTful qui permet à d’autres outils d'interagir avec le catalogue de métadonnées.

Intégration

Apache Atlas s'intègre avec des outils comme Apache Hive, Apache Sqoop, Apache Kafka, et d’autres

Merci de votre lecture !