Concept - C’est quoi une base de données OLAP ?

Concept - C’est quoi une base de données OLAP ?

Date de sortie
July 17, 2024
Auteur
Bertrand Fabre

Aujourd’hui, je vous explique ce qui se cache derrière le terme de base de données OLAP.

Les appellations

Pour commencer, que signifie cet acronyme ?

OnLine Analytical Processing

Lorsque que vous entendez parler de bases analytique, on parle souvent de base OLAP et/ou de Data Warehouse tels que BigQuery, Redshift, Snowflake, etc.

🧐 Et concrètement, qu’est-ce que c’est ?

🎲 Les cubes multidimensionnels

Lorsque l’on parle d’OLAP, les cubes de sont pas loin.

Les cubes sont des structures de données où ces données sont indexées et pré-calculées sur divers axes (temps, produit, région, client, etc) et diverses mesures (chiffre d’affaires, nombre de transactions, coûts, etc.).

🚅 Temps de réponse

Grâce à ce type de structure de données, les temps de réponses sont particulièrement rapide comme les données sont déjà calculées.

💾 Stockage

Le revers est que tous ces axes d’analyse déjà calculés nécessites un stockage important.

🛠️ Quelques outils

  • Google BigQuery ;
  • Microsoft SQL Server Analysis Services (SSAS) ;
  • Amazon Redshift ;
  • Oracle OLAP ;
  • Apache Druid ;
  • SAP BW/4HANA.

🤔 Les Data Warehouses sont-ils des bases OLAP ?

Je dirai que ce ne sont pas des cubes traditionnels.

Néanmoins, ils sont clairement taillés pour faire de l’analytique à grande échelle et ceux grâce à plusieurs fonctionnalités clés :

  • Leur stockage en colonne ;
  • La rapidité des traitements volumineux ;
  • La séparation entre stockage et calcul ;
  • Certains propose le partitionnement et le clustering de table et des vues matérialisées.

Google BigQuery, Amazon Redshift (Spectrum), Azure Synapse Analytics, Snowflake et Databricks, pour ne citer qu’eux, apporte une nouvelle approche de l’analytique à grande échelle.

Merci de votre lecture !