Aujourd’hui, je vous présente l’outil Apache Atlas.
Définition rapide
Apache Atlas est un outil de Data Governance qui permet de mieux comprendre et gérer les métadonnées.
Data Catalog
Le catalogue de données d'Apache Atlas permet aux utilisateurs de rechercher et de découvrir des Datasets, d'en connaître l'origine (Data Lineage), et d'en comprendre la structure.
Classification des Données
Apache Atlas permet de classer les données. Par exemple, on peut marquer des données comme "sensibles" ou "confidentielles" afin d’aider à appliquer des règles de gouvernance spécifiques.
API REST
Apache Atlas propose une API RESTful qui permet à d’autres outils d'interagir avec le catalogue de métadonnées.
Intégration
Apache Atlas s'intègre avec des outils comme Apache Hive, Apache Sqoop, Apache Kafka, et d’autres
Merci de votre lecture !