Solutions pour bloquer le Spam dans Google Analytics pour le trafic référent

Solutions anti-spam dans Google Analytics

Vous constatez certainement depuis quelques mois l’apparition de domaines référents avec un taux de rebond de 100% dans le rapport Acquisition>Tout le trafic >Sites référents  tels que:

  • Sharebutton.org
  • social-buttons.com
  • free-social-buttons.com

Sites ayant un taux de rebond de 100% dans Google Analytics

Le tableau précédent affiche une liste de sites Internet avec un taux de rebond de 100%.

Ce n’est pas forcément un critère déterminant pour interpréter les sites comme du Spam, cependant il s’agit d’un indicateur non négligeable.

J’ai réalisé un graphique regroupant ces sites SPAM sur un mois.

Graphique représentant les sites référents de SPAM

Vous remarquerez que le graphique présente des sessions par site « robot ou programme » avec un taux de rebond à 100%.

Voici un constat devenu classique dans les statistiques observées.

Je vous propose différentes solutions pour retirer ces sites identifiés comme spammeurs.

Pour ma part, la dernière solution permet de bloquer plus efficacement ces sites polluants, et de sécuriser l’ensemble de votre stratégie de tags.

Les solutions pour retirer les site référents peu qualitatifs

Première méthode : bloquer les sites dans le fichier Htaccess au niveau Serveur


RewriteEngine on

RewriteCond %{HTTP_REFERER} ^http://.*floating-share-buttons.com/ [NC,OR]]


Constat : c’est efficace en partie mais fastidieux.

Deuxième méthode : Exclusion de sites référents dans Google Analytics

Avec la version universelle de suivi Google Analytics, nous avons la possibilité d’exclure directement depuis la plateforme les noms de domaines.

En effet, les versions précédentes nécessitent une intégration technique dans le code source pour exclure les domaines référents non désirés dans les rapports de statistiques.

Noms de domaines à exclure

Constat : de même que la méthode précédente, la mise à jour régulière du listing doit être effectuée.

Pour plus d’infos, rendez-vous sur le centre d’aide Google Analytics

Troisième méthode : Google Tag Manager pour cacher vos balises de suivi (tracking)

GTM (Google Tag Manager) est un gestionnaire de balises permettant d’encapsuler vos scripts de suivi tels que Google Analytics, Adwords, Bing Ads, Facebook…

En plus de l’utilisation simplifiée pour déployer les balises par l’équipe marketing, l’outil GTM permet en outre de contenir l’ensemble des balises utilisées.

Nous mettons alors en place un seul script de suivi sur l’ensemble des pages du site.

En effet dans le code source de votre page, le code de suivi Analytics se présente de la manière suivante :

Script Google Analytics


<script>

(function(i,s,o,g,r,a,m){i[‘GoogleAnalyticsObject’]=r;i[r]=i[r]||function(){

(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),

m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)

})(window,document,’script’,’//www.google-analytics.com/analytics.js’,’ga’);

ga(‘create’, ‘UA-XXXXXXXX-1’, ‘auto’);

ga(‘send’, ‘pageview’);

</script>


Script Google Google Tag Manager 


<!– Google Tag Manager –>

<noscript><iframe src= »//www.googletagmanager.com/ns.html?id=GTM-W93T2B »

height= »0″ width= »0″ style= »display:none;visibility:hidden »></iframe></noscript>

<script>(function(w,d,s,l,i){w[l]=w[l]||[];w[l].push({‘gtm.start’:

new Date().getTime(),event:’gtm.js’});var f=d.getElementsByTagName(s)[0],

j=d.createElement(s),dl=l!=’dataLayer’?’&l=’+l: »;j.async=true;j.src=

‘//www.googletagmanager.com/gtm.js?id=’+i+dl;f.parentNode.insertBefore(j,f);

})(window,document,’script’,’dataLayer’,‘GTM-XXXXX’);</script>

<!– End Google Tag Manager –>>


De ce fait, les robots et programmes de scraping ne peuvent plus connaître l’ID de suivi de votre script Google Analytics puisque celui-ci est invisible.

En effet, nous pouvons, à l’aide de frameworks ou outils, parcourir un site internet et récupérer des données sans trop d’effort. Notamment les identifiants de suivi Analytics, il est même possible d’automatiser ces tâches.

Les sites de SPAM utilisent alors le protocole de mesure de Google pour envoyer des données sur un compte à partir de l’identifiant de suivi récupéré.

Il est très simple alors d’envoyer des données pour susciter l’attention du webmarketeur en charge de l’analyse du trafic.

C’est pourquoi, la solution la plus logique consiste à masquer les identifiants des différents tracking mis en place sur votre site Internet pour éviter des statistiques tronquées par quelques affiliés ou publicitaires avisés.

Exemple actuel de pub intrusive dans les résultats de Google Analytics : on retrouve comme site référent rankings-analytics.com qui nous redirige en fait vers un autre site http://semalt.com/ qui est un site proposant des outils SEO.

Facebook
Twitter
LinkedIn