Sous Matomo, il n’y a quasiment rien à faire. Depuis 2014, les équipes et la communauté de Matomo tiennent à jour une liste des sites web dits « spam referrer » pour les bloquer en amont de l’analyse de votre site via leur outils. Ainsi les données que vous visualisez sont justes sans rien avoir à configurer. 

Comment marche un spam referrer ?

Pour ce qui est du trafic fantôme sur Matomo, vous n’avez donc rien à faire. Vous pouvez simplement spécifier précisément chaque sous-domaine que vous souhaitez faire remonter dans vos statistiques plutôt que d’obtenir des données globales pour votre domaine. Cela renforce la fiabilité des données remontées.

Interface de Matomo montrant comment configurer une URL

Sous Google Analytics, c’est un peu plus compliqué, car cette fonctionnalité n’est pas disponible. Ainsi la première étape consiste à éliminer les visites « fantômes » qui ne passent même pas par votre domaine. Retrouvez cette information dans Audience > Technologie > Réseau, onglet « nom d’hôte ». Un nom d’hôte est un sous-domaine (blog.exemple.fr et www.exemple.fr sont des sous-domaines de exemple.fr). Vous voyez alors que les sites référents ciblent d’autres sites que votre nom de domaine. Il faut supprimer ce trafic. Pour cela, créer un filtre qui n’inclut que le trafic vers votre nom d’hôte.

L’interface Google Analytics pour créer un filtre pour n’inclure que votre nom d’hôte

Dans la règle de filtrage, vous ajoutez a minima votre domaine avec et sans les www. Potentiellement vous pouvez avoir aussi d’autres sous-domaines (blog.exemple.fr), pensez à les ajouter aussi pour que le trafic lié à ces sous-domaines soit pris en compte. Pour tous les ajouter correctement, il vous suffit de :

  • les séparer par cette barre oblique : | ;
  • intégrer un antislash (\) avant chaque point (exemple\.fr).

Ensuite, il faut aussi créer un filtre pour exclure les sites référents avec des adresses qui ne semblent pas cohérentes (exemple : нымтдай.с.квыи.моаогд.рф), les adresses de pages visitées qui ne correspondent pas à des URL de votre site web, des attributs de langues qui ne correspondent en rien à des attributs réels. Vous y associez ensuite toutes les URL référentes pour trouver l’origine de ce spam.

Cette méthode est relativement fastidieuse et difficilement exhaustive. Pour la compléter, vous pouvez cocher la case « Exclure tous les appels provenant de robots connus » dans la section « Paramètres de la vue ». Ce ne sera pas exhaustif mais cela permet d’éliminer un certain nombres de sites parasites.

D’autres données peuvent être supprimées : par exemple, les pages de brouillon que vous avez créées et visitées avant de les publier (selon votre CMS, elles peuvent être identifiables par la présence de « preview » dans l’URL. Créez alors un filtre : exclure › Pages › contenant « preview »).

Categorized in: