Google autorise le cloaking
Voici ce que l'on peux lire sur la page d'aide aux éditeurs de Google Actualités :
Pour être en mesure d'inclure vos articles dans Google Actualités, notre robot d'exploration doit pouvoir accéder au contenu de votre site. À l'heure actuelle, les robots d'exploration ne peuvent pas remplir les formulaires d'inscription, et ne prennent pas en charge les cookies. Par conséquent, si nous voulons explorer votre site correctement, nous devons pouvoir contourner votre page d'inscription.
Pour ce faire, la meilleure méthode consiste à configurer vos serveurs Web de sorte qu'ils ne présentent pas la page d'inscription à nos robots d'exploration (lorsque le user-agent est "Googlebot"). Vous pouvez vérifier que la requête provient réellement de notre robot en vous assurant que l'adresse IP est comprise dans la plage 66.249.64.0/20.
Il s'agit ni plus ni moins que du cloaking, surprenant non ?
La plage d'IPs proposée est également surprenante. On sait depuis longtemps que les robots de Google utilisent de nombreuses IPs différentes et qu'elles ne commencent pas toutes par 66.
Est ce que les bots de Google Actualités utilisent juste cette plage ? Difficile de répondre mais dans tous les cas, si Google donne l'autorisation... 🙂
Bon Cloaking !