Google Analytics : quel processus ?

Auteur(s) de l'article

Petit rappel

Google Analytics est un outil très utile. Il sert à analyser le comportement des visiteurs sur un site ou une application. Il nous permet d’avoir un très grand nombre d’informations et grâce à ces données, nous pouvons proposer des améliorations tout au long de la vie du site. Il nous permet de voir notamment de quelles sources viennent les visiteurs.
Il est très fréquent que des robots ou des sites considérés comme des spams viennent visiter les sites, ce qui fausse les données. En effet, ce ne sont pas les publics cibles et il est préférable de ne pas tenir compte de ces visites-là.
La raison pour laquelle ce type de spams (appelé Ghost Spam et Referral Spam)vient polluer les données de Google Analytics et influencer le traffic du site est qu'ils essaient d'augmenter le traffic vers leurs sites. (Source : Wikipedia : Referer spam).

Comptes, propriétés et vues

Avant d'aller dans les détails de notre processus pour Google Analytics, il est nécessaire de faire un petit récapitulatif de sa structure.
google analytics structure de compte
Le niveau supérieur est le compte. Nous associons généralement un compte à un client. Les comptes peuvent avoir une ou plusieurs propriétés.
"Une propriété désigne un site Web, une application mobile ou un appareil (une borne ou un terminal point de vente, par exemple)."
Google Analytics
Si un client a plusieurs sites internet, nous créons plusieurs propriétés sous son compte. Ce sont les propriétés qui génèrent les codes de tracking à insérer dans le code du site. Une propriété peut avoir des vues. Ce sont les points d’accès aux rapports. (Pour en savoir plus, je vous invite à lire la documentation de Google Analytics.)
Tracking code : Google Analytics fonctionne grâce à l'insertion d'un code Javascript dans les pages d'un site internet. Ce code permet de traquer les visiteurs et leurs actions sur le site.

Recommandations

Google Analytics recommande de créer plusieurs vues. La première vue, celle par défaut, n’a aucun filtre. Elle récolte absolument toutes les données, que les visites appartiennent à des robots ou à notre public cible. Cette vue est très importante car elle sert de référence.
La deuxième vue est appelée “Master view”, c’est sur celle-ci qu’on applique les différents filtres. Il est aussi recommandé de créer une vue “Test”, qui permet de tester les filtres et d’être certain de leur fonctionnement avant de les appliquer sur la Master View. Pour en savoir plus, voici une explication détaillée.

Filtres

Voici une liste non-exhaustive des filtres que nous conseillons d’appliquer à la Master View. Premièrement, il est obligatoire de filtrer les visites de notre agence. Nous créons donc un filtre “Antistatique IP” qui exclut les visites venant de nos collaborateurs. En effet, si nous en tenions compte, il y aurait des pics de visites à la publication ou lorsque nous travaillons dessus, alors que dans la plupart des cas, nous ne sommes pas le public cible.
Nous excluons aussi généralement les adresses IP des collaborateurs de l’entreprise cliente, pour les mêmes raisons que celles d’Antistatique.
google analytics filtres
Pour enlever le “bruit” et les robots indésirables qui visitent nos sites et faussent nos résultats, nous avons mis en place plusieurs filtres :
Tout d'abord, nous appliquons un filtre "Valid Hostname", celui-ci est très utile, il permet d'enlever la majorité des spams, qu'ils soient de référence, organique ou simplement de fausses visites directes. Ce filtre a plusieurs avantages, on ne l'applique qu'une seule fois et on n'a pas besoin d'attendre les visites des spams, on peut le mettre avant, de manière préventive. Les spams utilisent un hostname invalide ou non défini, ce filtre ne laisse passer que le hostname du site en question.
Il est possible de mettre ensuite en place des filtres pour exclure les visites des robots connus à l’aide des expressions RegexBen Travis, digital analyst, a créé quelques expressions permettant d’exclure un grand nombre de ces robots. Vous pouvez trouver ces expressions ici.
Regex ou regular expression ou expressions rationnelles sont une chaîne de caractères permettant de décrire un ensemble variable par l'utilisation d'une syntaxe précise. Plus d'informations.
Il y a bien entendu des visites venant d'autres robots ou spams, en inspectant les sources des visites régulièrement, nous pouvons ajouter les adresses qui ne sont pas prises en compte dans les expressions Regex.

Et vous ?

Grâce à ce processus, nous avons des données exploitables sur Google Analytics et nous pouvons les analyser et les traiter en ayant des résultats intéressants. De cette manière, nous pouvons proposer des améliorations concrètes et valables à nos clients pour leurs sites.
Et vous, quelle est votre méthodologie ? Quel filtre mettez-vous en place ?