Merci de ta réponse, je connaissais même pas le 503
Il n'y a vraiment que ce robot qui soit aussi agressif, trop même !
Je vais mettre cela en place pour les prochain sites sur dédié tant c'est rapide à faire, petite explication pour les intéressés (je l'ai pas mis en place, c'est donc incomplet, je peux donner les sources plus tard si certaisn se montrent intéressés, une tâche CRON tournerait avec quelque chose du genre :
Code:
#ps xuc | grep apache
En récupérant le % CPU, mémoire, si la limite est dépassée, je remplace le htaccess du site (et conserve le "normal" à la racine en le renommant) :
Code:
#mv /path/to/site/.htaccess /path/to/site/.htaccess_temp
#mv /path/to/site/.htaccess_503 /path/to/site/.htaccess
Ce .htaccess contenant la même chose avec ceci après le lancement de du mode de réecriture :
Code:
RewriteCond %{HTTP_USER_AGENT} ^.*(BaiduSpider|slurp|crawl|bot|...) [NC]
RewriteRule .* 503.php
redirection des robots sur 503.php qui contient :
Code:
<?php
header('HTTP/1.1 503 Service Temporarily Unavailable');
header('Status: 503 Service Temporarily Unavailable');
?>
Juste pour savoir, google ne risque t-il pas, (si d'aventure j'interdis google) d'en conclure que le site tourne sur un serveur merdique et qu'il ne mérite de ce fait qu'une moindre audience ?