📚 Le concept data : c’est quoi une architecture en médaillon ?
Définition rapide
C’est une organisation des données qui propose trois stades/couches de maturité de ces dernières : Bronze, Silver et Gold.
Bronze
Cette première couche est l’endroit où les données brutes sont ingérées depuis diverses sources.
Dans cette couche il y a un historique de toutes les données collectées.
Bien sûr, il peut y avoir divers formats de fichiers, en streaming ou batch, par API, etc.
L’idée est vraiment de centraliser et stocker les données rapidement sans perdre d’informations.
Elle prend tout son sens avec l’utilisation du concept d’ELT où l’on charge d’abord les données dans le système cible avant des les traiter.
Silver
Cette seconde couche est dédiée à la transformation, l’agrégation et la normalisation des données provenant de la couche Bronze.
C’est ici que les données vont être nettoyer : gestion des doublons, des valeurs manquantes, des formats, etc.
Attention les données de cette ne sont pas encore censés être consommées pour l’analytique.
Gold
C’est dans cette dernière couche que les données sont enrichies : règles métier, ajout d’autres dimensions.
Elles sont donc prête pour la consommation par les outils d’analyse afin de suivre les KPI à travers des tableaux de bord ou pour le machine learning.
Merci de votre lecture !