Techno - C’est quoi Apache Kylin ?

Techno - C’est quoi Apache Kylin ?

Date de sortie
November 21, 2024
Auteur
Bertrand Fabre

Aujourd’hui je vous présente Apache Kylin

Définition rapide

Apache Kylin est un moteur d’analyse OLAP. C’est donc un outil adapté pour des requêtes rapides sur de grands volumes de données.

Modèle de données

Avant d’exécuter des requêtes, l’utilisateur doit faire une modélisation des données afin de spécifier des dimensions et des mesures.

Un peu à la Business Object pour ceux qui ont déjà travaillé sur ce dernier.

Les cubes OLAP

Ce n’est qu’après la modélisation que des cubes multidimensionnels sont générés.

Les cubes servent à pré-agréger les données afin d’accélérer leur mise à disposition lors des requêtes. En effet, lorsque les requêtes sont exécutées les données étant déjà prêtes, la réponse est donc beaucoup plus rapide.

SQL

Le mode d’interrogation des cubes est le SQL. Cela est fortement utile avec l’omniprésence du SQL dans les outils data.

Intégrations

Apache Kylin s’intègre avec Apache Hadoop, HBase et Spark, mais aussi avec des outils de Data Vizualisation comme Tableau.

L’architecture

  • Kylin Engine : moteur d’exécution pour la création des cubes et l’exécution des requêtes ;
  • Kylin Server : gestion de l’interface utilisateur et mise à disposition d’API pour la gestion des cubes et l’exécution des requêtes ;
  • Kylin Manager : permet aux utilisateurs de configurer et de gérer les cubes, les projets et les requêtes ;
  • HBase et HDFS : stockage des cubes avec HBase et des données brutes sur HDFS.

Merci de votre lecture !