Techno - C’est quoi Apache Drill ?

Techno - C’est quoi Apache Drill ?

Date de sortie
December 5, 2024
Auteur
Bertrand Fabre

Aujourd’hui je vous présente Apache Drill

Définition rapide

Apache Drill est une plateforme qui permet d’interroger des données volumineuses stockées dans différents formats et dans différents système via SQL grâce à son moteur de requêtes.

Les sans schéma fixe et SQL

Il est possible de requêter des données semi-structurées ou non structurées en SQL alors qu’elles n’ont, par définition, pas de schéma fixe.

En effet, Apache Drill détecte automatiquement la structure des données à la volée.

Compatibilité

Drill se branche un peu partout :

  • Bases relationnelles : MySQL, PostgreSQL, Oracle ;
  • Fichiers locaux ou distribués : CSV, JSON, Parquet, Avro, etc. ;
  • Systèmes Big Data : Apache HDFS, Amazon S3, Google Cloud Storage ;
  • Bases NoSQL : MongoDB, Cassandra, HBase.

La BI

Il est possible d’intégrer Drill avec des outils de Data Vizualisation comme Tableau, ou Power BI.

Merci de votre lecture !