Date de sortie
December 5, 2024
Auteur
Bertrand Fabre
Aujourd’hui je vous présente Apache Drill
Définition rapide
Apache Drill est une plateforme qui permet d’interroger des données volumineuses stockées dans différents formats et dans différents système via SQL grâce à son moteur de requêtes.
Les sans schéma fixe et SQL
Il est possible de requêter des données semi-structurées ou non structurées en SQL alors qu’elles n’ont, par définition, pas de schéma fixe.
En effet, Apache Drill détecte automatiquement la structure des données à la volée.
Compatibilité
Drill se branche un peu partout :
- Bases relationnelles : MySQL, PostgreSQL, Oracle ;
- Fichiers locaux ou distribués : CSV, JSON, Parquet, Avro, etc. ;
- Systèmes Big Data : Apache HDFS, Amazon S3, Google Cloud Storage ;
- Bases NoSQL : MongoDB, Cassandra, HBase.
La BI
Il est possible d’intégrer Drill avec des outils de Data Vizualisation comme Tableau, ou Power BI.
Merci de votre lecture !