Aujourd’hui je vous présente Apache Kylin
Définition rapide
Apache Kylin est un moteur d’analyse OLAP. C’est donc un outil adapté pour des requêtes rapides sur de grands volumes de données.
Modèle de données
Avant d’exécuter des requêtes, l’utilisateur doit faire une modélisation des données afin de spécifier des dimensions et des mesures.
Un peu à la Business Object pour ceux qui ont déjà travaillé sur ce dernier.
Les cubes OLAP
Ce n’est qu’après la modélisation que des cubes multidimensionnels sont générés.
Les cubes servent à pré-agréger les données afin d’accélérer leur mise à disposition lors des requêtes. En effet, lorsque les requêtes sont exécutées les données étant déjà prêtes, la réponse est donc beaucoup plus rapide.
SQL
Le mode d’interrogation des cubes est le SQL. Cela est fortement utile avec l’omniprésence du SQL dans les outils data.
Intégrations
Apache Kylin s’intègre avec Apache Hadoop, HBase et Spark, mais aussi avec des outils de Data Vizualisation comme Tableau.
L’architecture
- Kylin Engine : moteur d’exécution pour la création des cubes et l’exécution des requêtes ;
- Kylin Server : gestion de l’interface utilisateur et mise à disposition d’API pour la gestion des cubes et l’exécution des requêtes ;
- Kylin Manager : permet aux utilisateurs de configurer et de gérer les cubes, les projets et les requêtes ;
- HBase et HDFS : stockage des cubes avec HBase et des données brutes sur HDFS.
Merci de votre lecture !