Si vous utilisez Google Analytics 4 (GA4), vous pouvez exploiter la puissance de BigQuery. Cet outil fait partie intégrante de Google Cloud Platform (GCP).
L’idée derrière cet export est de connecter vos données GA4 à un entrepôt de données GCP entièrement opérationnel pour améliorer vos analyses de sites web et d'applications. Une fois les données stockées dans cet entrepôt, vous pourrez les exploiter. Soit en les activant avec des Reverse ETL dans vos plateformes médias soit dans des reportings !
Sommaire :
BigQuery est un entrepôt de données Google créé dans le Cloud, qui permet l'analyse interactive massive de grands ensembles de données et de les activer pour son business. En collaboration avec l'espace de stockage Google, BigQuery permet de stocker des ensembles de données volumineux et lancer des requêtes SQL très rapides grâce à la puissance de calcul de ses machines Google.
Une analyse plus complète : La connexion des données d'événements et d'audience de GA4 à BigQuery permet de comprendre en profondeur les interactions des utilisateurs et les performances de l'entreprise. Vous pouvez créer des rapports personnalisés, compléter d'autres données telles que celles du CRM et activer les données en fonction des exigences et des objectifs de votre entreprise. En connectant GA4 à GCP, vous n'êtes pas impacté par la cardinalité, le seuillage ou la limite de rétention de GA4. Je reviendrai sur ce point vers la fin d’article 😉
Assurer la pérennité des données pour les années à venir : Transférer les données de Google Universal Analytics (UA) vers BigQuery assure la continuité des données. Google prévoit de mettre fin à l'accès aux données UA en juillet 2024 ; ainsi, si ces données ne sont pas sauvegardées dans BigQuery dès maintenant, elles seront perdues.
Une intégration gratuite : GA4 offre une intégration gratuite avec BigQuery, ce qui en fait une solution rentable et accessible pour les entreprises de toutes tailles.
Ajouter d’autres sources de données à ses données GA4 : L’unification des données, on apprécie chez Smart Bees, or BigQuery est disponible pour de nombreuses autres plateformes (plateformes publicitaires, CRM etc.). Donc dans l’idée, vous pouvez importer divers types de données dans BigQuery. Celui-ci vous servira ainsi de datalake. Derrière avec un peu de cleaning, vous serez en mesure de combiner vos données avec des données de navigation provenant de GA4.
Créer vos propres modèles d’attribution : précédemment dans GA4, on avait l’opportunité d’avoir plusieurs modèles d’attribution accessibles. Ça n’est plus le cas. Ainsi, avec vos données GA4 et BigQuery, vous pouvez créer des modèles d'attribution personnalisés basés sur vos propres règles business. Cela vous permet de ne plus être limité par le modèle d’attribution présent dans GA4.
La création d’audience : Avec l'intégration de GA4 et BigQuery, vous pouvez créer des segments d'audience personnalisés. Toujours dans l’idée de combiner des sources de données diverses, vous pouvez créer des segments business qui seront activables dans vos outils média ou CRM. Ces segments combineront des attributs de comportement utilisateur sur site et des données CRM. Avec la dépréciation des cookies tiers, se baser sur vos données propriétaires devient de plus en plus important !
La configuration de l'exportation de données de GA4 vers Google BigQuery nécessite plusieurs étapes que je vais vous expliquer ci-dessous :
Donc ça, c’est dans un premier temps dans Google Cloud Platform. Maintenant passons au set-up dans GA4, et à l’association de votre projet BigQuery avec votre propriété GA4.
Si vous avez des questions sur le set-up, n’hésitez pas à nous contacter ;)
Maintenant que vous recevez de la donnée dans votre projet BigQuery, je vais m’attarder sur quelques points qu’il faut prendre en compte dans vos analyses.
Les données que vous voyez et analysez dans l'interface GA4 ne sont pas strictement des données brutes. C’est un vrai point d’attention ! En effet, elles font l'objet d'un certain nombre de modélisations et de traitements avant d'aboutir aux rapports que vous visualisez dans l'interface GA4. Par exemple, on peut citer la modélisation des conversions et l’acceptation des signaux Google pour commencer !
Je vous résume ces points ici : 👇
La mesure des "utilisateurs" que vous voyez dans les rapports préconstruits de GA4 n'est pas le nombre total d'utilisateurs, mais plutôt les utilisateurs actifs. Un utilisateur actif est défini comme un utilisateur qui a une session engagée.
Lorsque vous effectuez un comptage des utilisateurs dans l'ensemble de données Google BigQuery, celui-ci est basé sur le nombre total d'utilisateurs et renvoie un nombre plus élevé, car il inclut également les utilisateurs qui ont eu une session définie comme non engagée.
Les mesures que vous voyez et analysez dans l'interface GA4 sont estimées à l'aide d'un algorithme appelé HyperLogLog++ pour assurer un équilibre entre la vitesse d'exécution des rapports et la précision des données.
L'analyse des données brutes du GA4 dans BigQuery ne sera pas soumise à l'algorithme HyperLogLog++ et donnera des résultats légèrement différents.
Les dimensions présentant une cardinalité élevée (c'est-à-dire un grand nombre de valeurs uniques) peuvent être regroupées dans une ligne “other” dans l'interface GA4 lorsqu'un rapport dépasse la limite de cardinalité pour la table sous-jacente. Ça devient vite problématique !
Mais la bonne nouvelle, c’est que les données brutes de GA4 dans Google BigQuery ne seront pas affectées par la cardinalité. Encore une fois, vous verrez des différences entre vos rapports natifs et ceux exploités dans BigQuery.
N’hésitez pas à lire l'article sur la cardinalité dans GA4 👈
Si vous avez activé Google Signals dans votre configuration GA4, ces informations seront disponibles dans l'interface GA4, mais ne seront pas disponibles dans l'exportation de données Google BigQuery.
Google Signals aide à consolider le nombre d'utilisateurs à travers différents types de navigateurs et d'appareils pour les utilisateurs connectés à Google, ce qui créera des différences dans les données par rapport à l'exportation de Google BigQuery. Dans vos rapports GA4, Google Signals est responsable de l'échantillonnage pour des enjeux liés à la protection de la vie privée des utilisateurs.
Lorsque le mode de consentement de Google est activé, les données de l'interface GA4 sont modélisées pour les personnes qui refusent de donner leur consentement.
Alors que les pings sans consentement sont disponibles dans vos données brutes de Google BigQuery, cet ensemble de données ne fait l'objet d'aucune modélisation, ce qui explique les différences attendues entre les deux ensembles de données.
Les données de l'interface GA4 font donc l'objet d'une modélisation et d'une transformation par le biais d'intégrations telles que Google Signals et Google Consent Mode.
Les données collectées dans Google BigQuery sont sous leur forme brute et ne font l'objet d'aucune modélisation.
Cette différence est l’intérêt principal de mettre en place l’export GA4 vers BigQuery, vous l’avez vu, il s’agit d’une clé pour aller encore plus loin dans vos analyses et vos activations.
Si vous avez des questions, n'hésitez pas à nous contactez chez Smart Bees !