Mars 2024 – La modélisation promise par Google apparait enfin dans GA4

Nous sommes le 25 mars 2024 et nous pouvons enfin voir, dans certains des comptes GA4 sur lesquels nous travaillons, la fameuse modélisation promise par Google aux annonceurs mettant en place le Consent Mode V2 (version avancée).

 

Première surprise: nous pensions avoir 2 “vues” des données dans GA4 :

  • Sans modélisation (uniquement avec les données consenties)
  • AVEC modélisation.

En pratique, seule une vue est disponible (la vue modélisée).

Ce n’est évidemment pas idéal puisque nous ne pouvons détailler la modélisation réalisée par Google et donc estimer sa fiabilité. Il faudra donc, comme souvent, croiser et comparer les données des différentes plateformes et du back-office pour se faire une opinion.

Pour le reste, cette modélisation semble bien rapprocher les données GA4 du réel. Nous avons comparé le chiffre d’affaires back-office avec le chiffre d’affaires “modélisé sur une période de 7 jours

Comment fonctionne la modélisation du comportement via le consent mode V2 de Google ?

Depuis l’entrée en vigueur du DMA et sous l’impulsion du RGPD, Google assume la responsabilité de collecter le consentement des utilisateurs, notamment en ce qui concerne l’acceptation ou le refus des cookies. Cette nouvelle réglementation risquant d’entraîner d’importantes pertes de données, Google a développé le Consent Mode v2, rendant son utilisation obligatoire pour les annonceurs Google Ads depuis le 6 mars 2024

Lorsque vous utilisez le Consent Mode v2 de Google et ajoutez une bannière de consentement (une CMP) à votre site Web ou à votre application, GA4 cesse de collecter des données sur les utilisateurs refusant les cookies. Pour compenser cette perte de données, le Consent Mode V2 utilise l’apprentissage automatique pour modéliser le comportement de ces utilisateurs. Cette modélisation permet d’obtenir des données GA4 proches du réel

Différences entre les données modélisées et observées

  • Acceptation – Lorsque des internautes visitent votre site Web ou votre application et autorisent les cookies Analytics, Google Analytics 4 enregistre le comportement des utilisateurs à l’aide de différents identifiants. Ce type de données est appelé données observées et est considéré comme le plus fiable.
  • Refus – Si les utilisateurs refusent le suivi, leurs événements ne seront pas associés à un identifiant utilisateur persistant, ce qui entraînera une absence de données. Dans ce cas, GA4 utilisera des données modélisées pour estimer le comportement des utilisateurs.  

NB: la bannière ci-dessous a plus d’importance qu’il n’y parait. Pensez à optimiser votre taux de consentement (PS: le bouton “Refuser” est obligatoire et doit être comparable au bouton d’acceptation pour que la bannière soit conforme).

Méthode de modélisation utilisée par Google

Google applique les “bonnespratiques de l’apprentissage automatique pour la modélisation GA4. 3 critères ont été retenues par l’entreprise Californienne :

  • Précision : GA4 utilise la validation “Holdback” (voir ci-dessous pour la définition) pour garantir la précision des données, en comparant les données estimées avec une partie des données observées.

Holdback validation (a machine learning best practice) maintains the accuracy of Google’s models.  A portion of observed conversions (validation data) are held back and split. Then, validation data that was run through the model is compared with validation data that wasn’t. The validation results are used to check for inaccuracy and to further tune the model. (Source)

  • Fiabilité : La modélisation comportementale n’est activée que si un nombre suffisant d’utilisateurs a donné son consentement, assurant ainsi la qualité du modèle.
  • Séparation : Google utilise des algorithmes de modélisation distincts pour estimer votre activité commerciale (rapports e-commerce etc.) et le comportement de vos clients.

Comment configurer la modélisation dans GA4 ?

Pour utiliser la modélisation comportementale dans GA4 pour votre site Web ou votre application, vous devez respecter les pré-requis suivants :

  • Le Consent Mode v2 est activé sur toutes les pages de vos sites Web et sur toutes les écrans d’application de vos applications.
  • Le Consent Mode v2 pour les pages Web doit être implémenté de manière à ce que les balises Google soient chargées avant l’apparition de la fenêtre de consentement, pas seulement si l’utilisateur donne son consentement (il s’agit donc d’une implémentation avancée / Consent mode V2 avancé).
  • Votre site Web ou votre application collecte au moins 1000 événements par jour avec analytics_storage=’denied’ pendant au moins 7 jours.
  • Le site possède au moins 1000 utilisateurs quotidiens envoyant des événements avec analytics_storage=’granted’ pendant au moins 7 des 28 derniers jours
  • Vous devez avoir sélectionner le mode de reporting “Mélangée“. (onglet “Administration” de votre compte Google Analytics)

 

Si vous ne faites pas cette modification dans l’administration, vous verrez à priori le message suivant dans l’interface :

Affichage de la modélisation du comportement dans Google Analytics

Google Analytics intègre les données modélisées lorsque suffisamment de données ont été collectées. D’après notre expérience, la date d’apparition des données modélisées est imprévisible. Un matin, vous vous connectez à GA4 et un message vous informe que vos efforts ont payé – vous avez accès aux données modélisés.

D’ailleurs, lorsque des données modélisées deviennent disponibles, vous remarquerez probablement des différences dans les rapports “modélisés” versus ceux associés à des périodes qui ne contiennent que des données observées : un nombre d’utilisateurs plus élevé, etc.

Utilisez l’icône de qualité des données (voir ci-dessous) pour identifier quand les données modélisées sont utilisées.

Le tableau ci-dessous résume les messages associés à l’icône de qualité des données :

Certains messages peuvent également apparaître sous forme de bannière dans l’interface de Google Analytics. Le tableau suivant répertorie les messages de bannière et leur emplacement :

 

Fonctionnalités non compatibles

Certaines fonctionnalités de Google Analytics ne sont pas compatibles avec les données modélisées, notamment les audiences, l’explorateur d’utilisateurs, les segments avec une séquence, les rapports sur la fidélisation et les métriques prédictives.

Notre accompagnement

Nous proposons des solutions d’installation du Consent Mode V2 notamment via des CMP comme ConsentManager ou CookiePro. Ces outils ont l’avantage de permettre une optimisation du taux de consentement, sujet important si l’on veut réduire la part de données modélisées et travailler avec des données fiables.

Bonne journée,

L’équipe Snow Globe