Services : Blog Forum Flux
Formation Trafic : Référencement Liens sponsorisés Affiliation Ecommerce Nom de domaine E-réputation Marketing Mobile Black Hat Outils Referencement
Formation Technique : Performance Web Html Css Sql Curl Asp Dotnet Php Ajax Wordpress Twitter Google Analytics

Forum Oseox
Oseox

Crawler ou indexer par les robots

Forum Référencement et Trafic
Nous sommes le Jeu 24 Mai 2018 01:14

Heures au format UTC [ Heure d’été ]




Poster un nouveau sujet Répondre au sujet
Auteur Message
MessagePosté: Jeu 21 Mai 2009 17:50 
Avatar de l’utilisateur
Salut,

On utilise souvent le terme crawler et indexer.
Est ce que indexer est la traduction précise de crawler ?

Après avoir lu pas mal d'articles j'ai l'impression qu'il y a une différence mais je ne suis pas sur de voir la nuance.

Merci d'éclairer ma lanterne :)


Haut
 Profil Envoyer un e-mail  
 
MessagePosté: Jeu 21 Mai 2009 18:11 
Avatar de l’utilisateur
Salut Sevrine,

crawler = visiter une page web
indexer = la mettre dans l'index

Donc, crawler une page c'est la préparer à être indexée, si elle est bonne candidate bien sur :)

Bonne soirée


Haut
 Profil Envoyer un e-mail  
 
MessagePosté: Jeu 21 Mai 2009 20:20 
Bonjour,

Ce sont les robots qui crawlent et les moteurs de recherche qui indexent.

Le robot crawle ( = visite ) les pages web et stocke les infos collectées (contenu des pages et quelques autres données techniques). Cela peut être le robot d'un moteur de recherche ou d'un logiciel mal intentionné qui recherche des failles ou d'un service de veille (surveillance de la concurrence, étude de marché) ou autre.

On dit qu'une page est indexée par un moteur de recherche quand elle apparaît dans les résultats de recherche du moteur.

Le fichier robots.txt peut interdire le crawl de certaines adresses. La balise "noindex" peut être utilisée pour interdire l'indexation de certaines adresses. Les robots et moteurs de recherche bien éduqués (Google, Yahoo, Microsoft,...) respectent ces interdictions, mais certains robots et certains moteurs ne respectent pas robots.txt ou la balise "noindex".

Jean-Luc


Haut
 Profil Envoyer un e-mail  
 
Afficher les messages postés depuis:  Trier par  
Poster un nouveau sujet Répondre au sujet  [ 3 messages ] 

Heures au format UTC [ Heure d’été ]


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité


Vous ne pouvez pas poster de nouveaux sujets
Vous ne pouvez pas répondre aux sujets
Vous ne pouvez pas éditer vos messages
Vous ne pouvez pas supprimer vos messages
Vous ne pouvez pas joindre des fichiers

Rechercher:
Aller à:  
cron
Abonnez-vous au flux RSS

Blog

Copyright : Moteur, traduction et optimisation
Merci de votre visite sur le forum Oseox