Aujourd’hui je vous présente Apache XTable
Définition rapide
C’est un outil permettant l’utilisation de divers format de tables utilisées au sein des Data Lakehouses à travers une unique interface.
En incubation
Attention, ce projet est encore en incubation chez Apache et ne prend donc pas encore en charge toutes les fonctionnalités de tous les formats de tables.
Les formats de tables
XTable a comme objectif de pouvoir fonctionner sur les formats de tables comme :
- Apache Hudi ;
- Delta Lake ;
- Apache Iceberg.
À terme, Apache XTable pourrait pleinement profiter de chacun des avantages de chaque format.
“Write once query everywhere”
La promesse de Apache XTable est exposée sur leur site avec le principe d’écrire une fois une requête pour qu’elle soit utilisée sur n’importe quel format de table.
Metadata
Apache XTable se base sur les métadonnées des formats de tables lus pour les traduire et écrire vers le format cible.
Les coûts
La donnée n’étant pas dupliquée ou déplacée cela évite des frais de stockage supplémentaires.
Merci de votre lecture !