Le Modern Data Stack : Comprendre et exploiter une révolution technologique

Smart Bees présente le Modern Data Stack
Logo Profil writer Smart Bees
Par Gauthier Haicault
Dernière modification le 21 Juin, 2024

Tout le monde parle aujourd'hui du Modern Data Stack (MDS). Travaillant en tant que Consultant Analytics depuis plusieurs années, j’ai commencé à mettre en place de nombreux systèmes utilisant les différentes technologies comprises dans ce MDS. Mais la première fois que j'ai entendu parler du "Modern Data Stack", c’était plus récemment.

Dans cet article, je veux montrer ma compréhension du terme Modern Data Stack et pourquoi il est vraiment important pour les entreprises aujourd’hui. 

Sommaire :

  • Qu'est-ce que le Modern Data Stack ?
  • Pourquoi le Modern Data Stack est-il "moderne" ?
  • Le futur du Modern Data Stack

1. Qu'est-ce que le Modern Data Stack ?

La définition la plus générale (et peut-être la plus floue) du Modern Data Stack est qu'il s'agit d'un ensemble d'outils construits autour d'un entrepôt de données (ou data warehouse) pour simplifier l'intégration des données.

Vous avez sans doute déjà lu mes articles sur les CDP Composable ! Il s’agit d’une pièce maîtresse d’une MDS. L’idée derrière le Modern Data Stack est de faire gagner du temps à vos ingénieurs, vos data analyst et à vos équipes marketing. Le point à retenir, dans un Modern Data Stack, l'intégration des données consiste à regrouper des données provenant de différentes sources, puis à les analyser et les activer ! 

Fonctionnalités du Modern Data Stack

  • Collecte de la donnée : Collecte les données de diverses sources (généralement avec la logique d’ETL que nous allons voir un peu plus bas).
  • Entrepôt de données centralisé : Stocke les données de diverses sources.
  • Transformation des données : Nettoie et transforme les données brutes en informations exploitables.
  • Activation des données : Fournit des données bien modélisées pour les activer dans vos outils

2. Pourquoi le Modern Data Stack est-il "moderne" ?

Pourquoi “moderne” ? C’est encore du marketing ça … En réalité, ce terme a été popularisé par des entreprises comme Fivetran et dbt. Si je fais un peu d’histoire, le terme "Modern Data Stack" est devenu courant après 2020, notamment grâce aux discours et articles de figures influentes comme Tristan Handy, PDG de dbt.

Le développement du Modern Data Stack est donc divisé en plusieurs périodes marquées par des avancées technologiques et des changements dans la gestion des données.

Pourquoi mettre en place un Modern Data Stack ?

Pour comprendre pourquoi nous avons besoin d'un Modern Data Stack pour son entreprise, il est essentiel de se concentrer sur les données elles-mêmes plutôt que sur la technologie. L'essence du Modern Data Stack est de transformer la manière dont les entreprises utilisent la technologie pour gérer leurs données.

L'un des principaux changements apportés par le Modern Data Stack est le passage de l'ETL (Extract, Transform, Load) à l'ELT (Extract, Load, Transform). Cette nouvelle approche permet de simplifier la gestion des données en déplaçant la transformation des données directement à l'intérieur de l'entrepôt de données.

Différence entre ETL et ELT

  • ETL : Les données doivent être extraites, transformées, puis chargées dans l'entrepôt de données.
  • ELT : Les données sont extraites et chargées dans l'entrepôt de données, puis transformées à l'intérieur de celui-ci.

Avantages de l'ELT

  • Simplicité : Réduit la complexité de la gestion des pipelines de données.
  • Préservation des données : Permet de stocker toutes les données brutes dans l'entrepôt, éliminant les problèmes de perte de données.

Et maintenant, on retrouve la technologie de reverse ETL ! J’y consacre un article complet que vous pouvez lire via le lien. Grâce à celui-ci, vous pouvez activer votre donnée transformée dans les différents outils marketing que vous utilisez au sein de votre entreprise.

3. Le futur du Modern Data Stack

L'idée d'un système unique capable de tout faire (traitement opérationnel, analytique, en flux, visualisation des données, partage des données, gouvernance des données, etc.) est séduisante, mais il est peu probable qu'un tel système devienne la norme à court terme. Les entreprises préfèrent généralement des solutions spécialisées qui répondent mieux à leurs besoins spécifiques.

Smart Bees présente le Modern Data Stack

Dans le Modern Data Stack, l’idée est de construire la suite d’outils autour de votre entrepôt de données qui correspond le mieux à vos besoins. La construction de celui-ci peut également se faire étape par étape et pas uniquement d’un coup. Pour les entreprises en croissance, ça vous permet d’avancer des coûts petit à petit au lieu de partir sur des solutions packagées jouant le rôle du Modern Data Stack. 

Pour conclure

Le Modern Data Stack révolutionne la manière dont les entreprises gèrent leurs données, en simplifiant la gestion et en réduisant les coûts. Cette approche permet aux entreprises de se concentrer davantage sur les données elles-mêmes plutôt que sur les logiciels. Bien que le Modern Data Stack continue d'évoluer rapidement, il représente déjà un changement significatif par rapport aux méthodes de gestion des données du passé.

Si vous souhaitez échanger sur ce sujet, n’hésitez pas à nous contacter chez Smart Bees