Détecter le cloaking grâce à Google Analytics

Le cloaking est une technique bien connue de nombreux référenceurs et ceci depuis plusieurs années. Le principe est excessivement simple, cela consiste à afficher un contenu différent sur une page donnée en fonction d'une ou plusieurs caractéristiques du visiteur :

  • L'adresse IP
  • Le User Agent
  • L' hôte
  • Le navigateur
  • Le referer
  • Etc.

Le cloaking est ainsi utilisé sur de nombreux sites multilingues qui en fonction de la configuration du navigateur (HTTP_ACCEPT_LANGUAGE) affiche le site dans une certaine langue.

Certains référenceurs ont mis en place des techniques de cloaking plus ou moins évoluées afin (entre autre) d'afficher un contenu optimisé pour les robots Google et un contenu plus "marketing" pour les visiteurs.

L'idée est également de cacher les optimisations à ses concurrents...

Si l'on considère que les redirections javascript placées sur un nombre impressionnant de pages satellites ne sont pas du cloaking, la technique la plus simple est certainement de réaliser un cloaking sur USER_AGENT :

$google=false;
$google=strpos($_SERVER["HTTP_USER_AGENT"],"Googlebot");
if($google!=false)
{
echo"Bonjour Google Bot";
}
else
{
echo"Bonjour cher visiteur";
}

Comme vous pouvez le voir, cette technique est très facile à mettre en place mais aussi très dangereuse... Google peut très bien se rendre compte de la supercherie grâce à ses multiples robots possédant des USER_AGENT différents, tout comme vos concurrents si ils changent leur USER_AGENT notamment en utilisant le plugin firefox User Agent Switcher.

Si vous voulez faire un test, vous pouvez le faire sur cette page .

Il est également possible de se baser sur l'adresse IP du visiteur. Cette technique de claoking est assez fastidieuse puisqu'elle nécessite d'effectuer une veille permanente (qu'il faut automatiser) sur les adresses IP utilisées par les différents robots de Google. Le plus simple est certainement d'utiliser la fonction php gethostbyaddr() et donc de cloaker sur l'hôte de l'ordinateur demandant l'affichage de la page.

L'idée de ce billet n'est pas d'apprendre à cloaker ou de fournir les scripts adéquats. Vous les trouverez sans difficulté en faisant quelques recherches sur Google.

Bref, visualiser une page réalisant du cloaking sur l'hôte et interdisant l'archivage (la règle d'or de tout cloakeur qui se respecte) parait difficile et à même fait l'objet d'un concours passionnant.

Ce matin, en surfant sur l'un des meilleurs forums francophones, une discussion a retenu mon attention. Le membre arnoweb2 propose une technique pour se faire passer très simplement pour Google et détecter facilement le meilleur des cloakings : Même USER AGENT, bonne IP et surtout l'hôte Google !

Cloaking sur google Analytics

L'idée est simple et était sous notre nez depuis des mois :

  1. Ajouter dans Google Analytics le site à tester
  2. Afficher la page via Synthèse Donnée/Site

Google affiche la page exactement telle qu'il la voit dans une iframe.

Une solution (très rapidement trouvée par Jan, l'auteur du concours et cloakeur invétéré) est d'interdire l'affichage dans une iframe via un petit script en javascript mais comme il le dit très bien, "cela reste du javascript" 😉

Ne manquez pas les futurs articles via Twitter

A propos de l'éditeur d'Oseox.fr

Aurélien Bardon est un passionné de SEO. Il crée Outil-Referencement.com en 2005, Oseox.fr en 2008, fonde en 2009 l'agence SEO Aseox à Lille et lance en 2016 Oseox Software, une plateforme de logiciels SEO.

Oseox Monitoring