📚 Le concept data : c’est quoi le Data Vault ?
Définition rapide
C’est une méthodologie de modélisation de données centrée sur le stockage des données historique et sur la traçabilité des changements. Cette méthodologie est divisée en trois entités principales : hubs, links et satellites.
Hubs
Ce sont les entités principales, que l’on pourrait apparenter aux référentiels mais amaigris.
En effet, les Hubs contiennent des identifiants uniques pour des objets métier tels que les produits, les clients, les sites, etc., ainsi que des metadata qui aide à comprendre d’où vient la donnée, à quelle date.
Links
Ces tables représentent les relations entre les Hubs. Par exemple, un produit est disponible sur plusieurs sites mais pas tous ou, un client a acheter certains produits.
Satellites
C’est là où se trouvent les descriptifs détaillés et l’historique des Hubs. Des metadata sont également présentent. Il est possible de suivre toutes les modifications des données dans le temps.
Historisation
C’est le point fort de ce schéma qui permet d’avoir plusieurs version de la donnée, ce qui facilite les analyses des évolutions et l’auditabilité.
Merci de votre lecture !