Round Robin DNS et Data center de Google

Vous avez sûrement déjà remarqué que les pages de résultats des moteurs de recherche ou SERP (Search Engine Results Page) évoluent rapidement.

Il vous est peut être même déjà arrivé de taper une requête à quelques minutes d'intervalle et de ne pas retrouver l'excellent site que vous veniez de visiter. Si vous êtes client d'une agence de référencement, il est possible que vous ayez constaté des différences entre vos rapports de positionnement et vos propres tests.

Non, Google ne se fiche pas de vous et encore moins votre prestataire de référencement.

N'avez vous jamais été surpris par la rapidité du site Google à s'afficher ? Certes la page est minimaliste et les graphistes de chez Google aiment le style dépouillé mais lorsque l'on sait que Google traite plus de 1000 requêtes à la seconde il y a de quoi être impressionné.

Afin d'offrir un service toujours aussi efficace et pour répondre aux demandes toujours plus nombreuses des internautes, Google a déployé une armée de serveurs un peu partout dans le monde. Le chiffre exact est inconnu mais se situe entre 100 000 et 500 000 PCs, peut être plus...

Le temps de réponse moyen sur Google tourne autour de la demi seconde et environ 500 PCs sont utilisés pour répondre à une requête.

Nous avions déjà parlé dans un précédent billet des data centers de Google et proposé cette photo d'un nouveau data center en construction.

Mine de rien cette introduction commence à être longue et il est temps de rentrer dans le vif du sujet.

Lorsque vous vous connectez pour la première fois de la journée à Google.fr, vous êtes automatiquement dirigé vers un des data centers de Google.

Nous n'allons pas nous étendre trop longuement sur le fonctionnement des serveurs DNS mais en gros :

Pour accéder à un site Web, nous avons l’habitude de taper une adresse du type : http://domaine.tld dans la barre de notre navigateur. Pourtant, pour que le site demandé soit affiché, il faut connaître l’adresse IP du serveur (exemple : 64.233.167.99) qui héberge le site.

Vous conviendrez qu'il est plus facile de retenir des noms qu'une série de chiffres.

C’est ici que le serveur DNS intervient ; il jouera alors le rôle de traducteur entre le nom de domaine (facile à retenir mais incompréhensible par la machine) et l’adresse IP (difficile à retenir mais compréhensible par la machine).

Les serveurs DNS ne sont donc ni plus ni moins qu’une grande base de données contenant une table de correspondance entre nom de domaine et adresse IP. (Après vient le débat du contrôle des serveurs...). Votre navigateur préféré, au hasard Mozilla Firefox, obtiendra donc l'adresse IP du site en passant par un serveur DNS.

Bref, tout cela pour dire qu'une IP va être associée au nom de domaine. Cette IP sera mémorisée par votre navigateur dans son cache DNS pendant un certain laps de temps appelé "time to live" ou plus simplement TTL.

Le TTL du domaine google.fr lorsque l'on interroge un serveur DNS est d'environ 4 minutes. L'intérêt est de ne pas devoir interroger de nouveau un DNS pour obtenir l'adresse IP correspondant au nom de domaine.

C'est Google qui choisit quelle IP (quel datacenter) il va attribuer pour les 4 prochaines minutes en fonction de l'origine géographique de l'internaute, de la charge supportée par les data centers et de l'engorgement des tuyaux... Si je ne me trompe pas, on appelle cela du load balancing, technique utilisée par tous les sites très populaires utilisant plusieurs serveurs. Le terme Round Robin est également utilisé pour les systèmes de répartition de charge d'où le titre de ce billet.

En fait le terme Round Robin est utilisé dans de nombreux domaines comme l'indique la page de Wikipedia consacrée à cette expression.

Ce système a donc un impact sur les pages de résultats qui vont sont proposées. Nous n'allons pas détailler le process d'indexation de Google mais il faut savoir que les bases de données de Google (l'index) sont mouvantes et en permanence alimentées par des robots.

L'index n'est pas rigoureusement le même sur tous les data centers. Certes il y a une mise à jour qui s'opère visiblement en continue entre chaque data center mais cela n'est pas suffisant. Auparavant pour combler ce "problème", il existait une phase appelée "Google Dance" au cours de laquelle tous les data centers étaient alignés sur le même index.

Outre l'intérêt de la répartition de la charge, cela peut servir à Google de mener des tests grandeur nature en "faisant tourner" différents algorithmes sur plusieurs data centers et d'observer les résultats.

C'est pourquoi si vous avez bien suivi 🙂 vous pouvez donc très bien passer d'un data center à un entre en quelques minutes et ainsi observer des résultats différents.

 

Ne manquez pas les futurs articles via Twitter

A propos de l'éditeur d'Oseox.fr

Aurélien Bardon est un passionné de SEO. Il crée Outil-Referencement.com en 2005, Oseox.fr en 2008, fonde en 2009 l'agence SEO Aseox à Lille et lance en 2016 Oseox Software, une plateforme de logiciels SEO.

Oseox Monitoring