Avec la fin de Google Universal Analytics et son remplacement par GA4 il est probable que vous vous retrouviez dans la situation d’avoir tout l’historique de données (souvent plusieurs années) de votre site web dans Universal Analytics et entre quelques jours et environ un an de données récentes dans GA4 ; le problème étant maintenant de faire cohabiter ces données dans un seul et même rapport.
Est il possible d’importer ses données Universal Analytics dans GA4 ?
La question a le mérite d’être posée car la solution la plus confortable aurait pu consister à réimporter l’historique de données d’Universal Analytics dans GA4 pour pouvoir bénéficier de rapports de comparaisons avec les années précédentes directement dans GA4. Malheureusement il y a trop de différentes entre ces deux versions de la solution analytics de Google pour qu’une telle solution puisse être mise en place. Leurs modèles de données sont trop éloignés pour qu’un import de UA vers GA4 soit possible. Il va donc falloir passer par un outil de reporting externe comme Looker Studio.
Création d’un rapport cumulé UA / GA4 dans Looker Studio
L’outil gratuit de data visualisation Google Looker Studio permet de créer des rapports depuis des sources de données diverses comme par exemple :
- Des connexions directes avec des outils comme UA ou GA4
- Des bases de données externes comme les bases BigQuery
- Des feuilles de calcul Google Sheets
Les 3 solutions pourraient être intéressantes pour nous comme par exemple l’utilisation des connecteurs directs de Looker Studio avec UA et GA4. Nous pourrions ainsi chercher à créer une source combinée entre les deux. Le premier souci de cette solution vient du fait que nous allons avoir des périodes de chevauchement de données entre les deux outils (UA encore actif et GA4 déjà en place). De plus les événements et objectifs ne vont pas être nommés de la même façon entre les deux ce qui va rendre la continuité d’analyse quasi impossible. Nous n’allons donc pas pouvoir nous orienter vers la première solution.
La seconde solution est, elle, parfaitement valable. Nous pourrions par exemple récupérer les données de notre compte UA une bonne fois dans BigQuery et y connecter également notre compte GA4 grace à la connexion native qui existe entre ces deux solutions de Google. Le seul point faible de cette solution c’est que BigQuery nécessite un abonnement mensuel dont le tarif varie avec la quantité de données à y stocker. Nous allons donc ici plutôt opter pour la solution gratuite Google Sheets.
Récupération des données UA dans Google Sheets
Cette étape est relativement simple. Il existe en effet une extension de Google pour Google Sheets permettant d’y importer simplement ses données GA ; vous aurez donc besoin de l’installer depuis la marketplace de Google Workspace si vous ne l’avez pas déjà fait en suivant ce lien : https://workspace.google.com/u/0/marketplace/app/google_analytics/477988381226
Une fois cette extension installée vous pourrez créer un rapport en suivant le lien depuis le menu Extensions de votre Sheet.
Il vous suffit de donner un nom à votre rapport (une feuille sera créée dans le classeur avec ce nom), de choisir la vue UA dans laquelle vous souhaitez prendre les données, de sélectionner des métriques (sessions, objectifs, etc…) et les dimensions sur lesquelles les splitter. De prime abord le générateur de rapport peut paraître incomplet (il n’est pas exemple pas possible d’y sélectionner une plage de dates) mais ce n’est pas grave. En effet une fois le rapport lancé il sera possible de revenir dessus avec plus de précisions.
Dans le cas présent nous souhaitons exporter les données principales du compte (utilisateurs, sessions, pages vues et objectifs remplis) sur les 4 dernières années pour 4 grandes familles de trafic (SEO, SEA, Direct et le reste). En créant le premier rapport avec le générateur ci-dessus une feuille « Report Configuration » va être générée dans laquelle nous allons pouvoir affiner les choses (plage de dates, filtres, etc…) pour créer ces 4 rapports.
Les dates peuvent être saisies sous plusieurs formats mais le plus simple pour éviter les erreurs consiste à utiliser le format américain (ANNEE-MOIS-JOUR), les métriques et les dimensions peuvent être modifiées facilement et les filtres sur l’utm_medium nous permettent de créer des rapports distincts SEO, SEA ou autre. Vous noterez que pour éviter les pertes j’ai créé 3 rapports filtrés et un rapport total qui permettra ensuite de faire la différence entre lui et les 3 autres.
Une fois les réglages en place retour au menu Extensions > Google Analytics > Run reports pour faire tourner le tout. Si vous avez fait des erreurs de configuration une alerte vous l’indiquera et sinon vous obtiendrez une message de confirmation disant que tout s’est bien passé.
Il ne reste plus qu’à créer une feuille UA-Autre pour faire la différence entre le total et les 3 rapports filtrés pour terminer la partie récupération des données depuis UA.
Récupération des données GA4 dans Google Sheets
Notre objectif à ce stade consiste à obtenir les mêmes exports de données sur les mêmes familles de trafic mais depuis GA4 et sur la plage de date qui commence le lendemain du dernier jour de données de l’export UA.
Contrairement à UA il n’existe par contre pas de connecteur « officiel » entre GA4 et Google Sheets. Bien qu’il soit toujours possible de passer par des exports manuels de rapports GA4 à réimporter dans Google Sheets nous allons privilégier l’utilisation d’un add-on non officiel au fonctionnement comparable à celui d’UA : https://workspace.google.com/u/0/marketplace/app/ga4_google_analytics_connector_by_syncwi/416305139582
Une fois l’extension installée elle peut être lancée depuis le menu extensions de Google Sheets comme la précédente.
La création d’un premier rapport est ensuite comparable à l’extension UA. Il s’agit de sélectionner un compte Google et une propriété GA4, de lister les métriques et dimensions que l’on souhaite récupérer ainsi qu’une plage de dates et si besoin d’ajouter un ou plusieurs filtres. Pour ceux qui ont déjà utilisé l’extension payante Supermetrics le fonctionnement en sidebar devrait sembler assez familier.
Le point positif supplémentaire de cette extension c’est qu’il est possible de la configurer pour mettre en place un update périodique des données collectées.
Pour plus de simplicité dans la gestion des dates je vous conseille de choisir une plage de dates longues du premier jour pour lequel vous souhaitez récupérer les données GA4 (ex: 1er Juillet 2023) à une date future assez lointaine (ex : 31 Décembre 2030) avec une refresh quotidien en début d’après midi (GA4 est un peu long à compiler les données) et le réglage « Udpate or add rows as needed » pour maximiser les performances des récupérations.
En suivant ces règles nous avons crée 4 rapports distincts pour récupérer les données du trafic SEO (Session medium organic), du trafic SEA (Session medium cpc), du trafic Direct (Session source (direct)) et du reste (exclusion des autres réglages).
L’exemple de récupération de données GA4 effectuée avec ce module complémentaire n’est pas la seule solution possible. Si vous le souhaitez vous trouverez dans cet article des alternatives.
Création d’une source de données compilant l’ensemble de ces données
A ce stade nous disposons donc d’un classeur Google Sheet contenant :
- 4 feuilles contenant des données (fixes) de trafic et de conversions issues de l’historique Universal Analytics sur 4 familles de trafic (SEA, SEO, Direct et autre)
- 4 feuilles contenant des données (évolutives) de trafic et de conversions comparables à UA mais issues de GA4 sur les 4 même familles de trafic
Avant de pouvoir en faire une source de données il nous reste à les compiler dans une feuille unique. Nous allons donc ajouter une feuille vide au classeur et y placer nos en-têtes de colonnes.
Et pour alimenter cette feuille à partir des autres nous allons utiliser des fonctions QUERY de Google Sheets. L’objectif de cet article n’étant pas de vous détailler le fonctionnement de cette fonction je vous laisse le lien de la documentation Google la concernant (https://support.google.com/docs/answer/3093343?hl=en) ainsi que le code permettant de compiler les 8 feuilles en une.
={
QUERY('UA-SEA'!A16:G;"select A,B,C,D,E,F,G,'SEA' where C > 0");
QUERY('UA-SEO'!A16:G;"select A,B,C,D,E,F,G,'SEO' where C > 0");
QUERY('UA-Direct'!A16:G;"select A,B,C,D,E,F,G,'Direct' where C > 0");
QUERY('UA-Autre'!A16:G;"select A,B,C,D,E,F,G,'Autre' where C > 0");
QUERY('GA4-SEA'!A3:G;"select A,B,C,D,E,F,G,'SEA' where C > 0");
QUERY('GA4-SEO'!A3:G;"select A,B,C,D,E,F,G,'SEO' where C > 0");
QUERY('GA4-Direct'!A3:G;"select A,B,C,D,E,F,G,'Direct' where C > 0");
QUERY('GA4-Autre'!A3:G;"select A,B,C,D,E,F,G,'Autre' where C > 0")
}
Chaque ligne correspond à l’appel de l’une des feuilles du classeur et permet de récupérer le contenu des colonnes de A à G (qui contiennent les valeurs récupérées des UA et GA4). Nous rajoutons également dans les QUERY à la main pour chaque feuille le nom de la source de trafic concernée (SEA, SEO, Direct, Autre). Et notre feuille globale est ainsi remplie.
A chaque appel de feuille nous avons une ligne quasiment vide mais cela ne posera pas de problème dans la mesure où ces lignes ne contiennent aucune date. Nous pouvons donc nous rendre dans Google Looker Studio pour y créer une nouvelle source de données.
Nous choisissons donc logiquement Google Sheets dans la liste de connecteurs proposés et sélectionnons le classeur que nous venons de travailler et sa feuille globale comme association.
Lors de la création d’une source de données depuis une Sheet chaque en-tête de colonne devient un champ dont le format (Date, Texte, Nombre) est automatiquement reconnu. Quand cette reconnaissance fonctionne mal il est tout à fait possible de modifier manuellement le type de données associée au champ concerné.
Création du rapport final dans Looker Studio
Il ne reste maintenant que l’étape la plus simple qui consiste à créer un rapport basé sur cette source de données.
Depuis n’importe quel dashboard Looker Studio le menu « Ressource > Gérer les nouvelles sources de données » permet d’accéder à la liste des sources du dashboard pour les modifier ou en ajouter.
En passant par le lien « Mes sources de données » nous retrouvons ainsi la source fraichement crée pour l’associer et la rendre utilisable dans le dashboard.
Il ne reste alors plus qu’à créer les tableaux ou graphiques que l’on souhaite sur cette source. Comme par exemple une feuille comprenant les métriques principales sur une plage de dates données comparées à l’année précédente avec une zone de filtre sur les sources de trafic.
Les courbes d’évolution sont également possibles avec une continuité totale des données entre UA et GA4.