Aujourd’hui, je vous explique ce qui se cache derrière le terme de base de données OLAP.
Les appellations
Pour commencer, que signifie cet acronyme ?
→ OnLine Analytical Processing
Lorsque que vous entendez parler de bases analytique, on parle souvent de base OLAP et/ou de Data Warehouse tels que BigQuery, Redshift, Snowflake, etc.
🧐 Et concrètement, qu’est-ce que c’est ?
🎲 Les cubes multidimensionnels
Lorsque l’on parle d’OLAP, les cubes de sont pas loin.
Les cubes sont des structures de données où ces données sont indexées et pré-calculées sur divers axes (temps, produit, région, client, etc) et diverses mesures (chiffre d’affaires, nombre de transactions, coûts, etc.).
🚅 Temps de réponse
Grâce à ce type de structure de données, les temps de réponses sont particulièrement rapide comme les données sont déjà calculées.
💾 Stockage
Le revers est que tous ces axes d’analyse déjà calculés nécessites un stockage important.
🛠️ Quelques outils
- Google BigQuery ;
- Microsoft SQL Server Analysis Services (SSAS) ;
- Amazon Redshift ;
- Oracle OLAP ;
- Apache Druid ;
- SAP BW/4HANA.
🤔 Les Data Warehouses sont-ils des bases OLAP ?
Je dirai que ce ne sont pas des cubes traditionnels.
Néanmoins, ils sont clairement taillés pour faire de l’analytique à grande échelle et ceux grâce à plusieurs fonctionnalités clés :
- Leur stockage en colonne ;
- La rapidité des traitements volumineux ;
- La séparation entre stockage et calcul ;
- Certains propose le partitionnement et le clustering de table et des vues matérialisées.
Google BigQuery, Amazon Redshift (Spectrum), Azure Synapse Analytics, Snowflake et Databricks, pour ne citer qu’eux, apporte une nouvelle approche de l’analytique à grande échelle.
Merci de votre lecture !