Data center
Qu'est ce qu'un data center ?
Le terme "data center" (DC) n'est pas propre au moteur de recherche. Il s'agit d'un bâtiment où sont "rangés" de nombreux ordinateurs. Les disques durs de ces serveurs stockent un nombre important de données d'où le nom "data center". Ce type d'installation est généralement très fortement sécurisée (gardée 24h/24H), dispose d'une alimentation électrique et d'une architecture redondante ainsi que bien souvent d'un système de refroidissement spécifique.
Les data centers des moteurs de recherche
Comme nous l'avons vu précédemment, les robots des moteurs de recherche copient le web. Pour stocker toutes ces données, les géants du Search ont construit d'immenses data centers.
Par ailleurs, afin de pouvoir répondre rapidement aux demandes de tous les internautes et résister aux pannes, ces data centers sont répartis dans le monde entier.
Ressources énergétiques et data centers
Ce type de structure consomme énormément d'électricité. Il s'agit d'ailleurs de la principale dépense de Google. Imaginez des centaines de milliers d'ordinateurs allumés en permanence et tournant à plein régime ! L'impact écologique est réel et l'on commence à parler d'aujourd'hui de "data center vert".
Voici la photo d'un data center de Google installé en Amérique :
La chaleur produite par cette installation est tellement importante, qu'il est obligatoire d'avoir pensé en amont à un système de refroidissement. Ici, l'on peut voir un cours d'eau utilisé pour refroidir les installations. Il faut savoir que certains data centers sont reliés directement à des nappes phréatiques !
Le nombre de serveurs de Google était estimé il y a quelques années à 400 000. Aujourd'hui on peut penser que le million est atteint. Il faut savoir que pour satisfaire une seule requête, Google utilise jusqu' à 500 ordinateurs !
Round Robin, Data center et Référencement
Cette architecture a des répercussions pour l'utilisateur. Lorsque l'on interroge Google, il est possible de tomber sur l'un ou l'autre de ces data centers en fonction de plusieurs éléments (charge, localisation, round robin...). Les bases de données (index) des data centers ne sont pas tous rigoureusement identiques. Il y a quelques années, la "Google Dance" était une période où tous les DC se synchronisaient. Aujourd'hui, les index sont globalement très proches.
Il est donc possible d'observer des variations dans les pages de résultats. Pour être certain d'observer les mêmes résultats d'un poste à l'autre, il ne faut pas passer par le domaine google.fr mais saisir directement l'adresse IP du data center souhaité. Par exemple : http://64.233.161.107/
Investissement et Data center
Le coût d'un data center tels que ceux de Google est énorme. Le nouveau DC situé à Saint Ghislain en Belgique représente un investissement de 250 millions d'euros.
Le ticket d'entrée pour un nouvel acteur mondial du Search est donc aujourd'hui tout simplement monstrueux.