Liste de critères pouvant nuire à votre référencement

Cet article vous propose une synthèse de plusieurs articles issus de mon tutoriel référencement ainsi que quelques compléments.

Une des premières étapes lorsque l'on s'intéresse à la visibilité d'un site dans les moteurs de recherche est de s'assurer que les robots peuvent accéder sans difficulté au contenu afin de l'indexer. En effet, sans indexation, pas de positionnement...

L'utilisation de plus en plus fréquente de CMS open source à la pointe (enfin tout est relatif) des standards a ôté énormément de ces contraintes. Ce qui a fait dire à beaucoup de personnes que l'utilisation de telle ou telle solution était "bonne pour le référencement".

En fait, une fois les contraintes éliminées, ce sera essentiellement le contenu apporté et la popularité générée qui viendra faire la différence.

Les Frames

Cette technologie d'un autre age mais encore enseignée dans les écoles et universités où beaucoup d'intervenants brillent par leur incompétence, aura pour conséquence aux yeux des moteurs de recherche de "diviser une page web en plusieurs partie".

Frame et référencement

Chaque partie considérée alors comme indépendante pourra être indexée et ressortir de la sorte dans les pages de résultats :

Partie de page indexée issue d'un frameset

Pour plus d'information, vous pouvez vous reporter au tutoriel Frame et Référencement.

Les Sessions

L'ouverture de session par les robots entrainera bien souvent l'apparition d'une série de chiffres dans chaque URL, un identifiant de session. Ceci entrainera trois problèmes majeurs :

  1. URL non pérenne
  2. Duplication de contenu
  3. Nombre infini de pages à indexer

Pour plus d'information, vous pouvez vous reporter au tutoriel Session et Référencement

Les Formulaires

Lorsque du contenu texte est accessible uniquement après le renseignement et la validation d'un formulaire, il ne sera pas possible (dans la majorité des cas) pour les robots d'avoir accès à votre contenu.

Ce problème se retrouve notamment sur certains sites de biens immobiliers, d'emplois etc qui repose sur l'utilisation massive de bases de données.

Il est alors nécessaire de promouvoir des accès sous forme de liens textes crawlables.

Pour plus d'information, vous pouvez vous reporter au tutoriel Formulaires et Référencement

Le Flash

Les robots comme certains utilisateurs humains éprouvent des difficultés à consulter le contenu présent dans des fichiers flash. Malgré quelques avancées, une alternative HTML est toujours nécessaire.

Pour plus d'information, vous pouvez vous reporter au tutoriel Flash et Référencement

L'Ajax

L'utilisation de javascript et le rechargement partiel de pages posent de sérieux problèmes aux moteurs ainsi qu'à certains utilisateurs.

Encore une fois, il est nécessaire de prévoir des moyens d'accès alternatifs afin de s'assurer une indexation correcte. Naviguer sur un site avec javascript désactivé réserve parfois quelques surprises...

Pour plus d'information, vous pouvez vous reporter au tutoriel Ajax et Référencement

Les Entêtes HTTP

La bonne configuration de son serveur web et la vérification des entêtes HTTP envoyés est un point souvent oublié. Pourtant il peut être la source de problèmes.

Pour plus d'information, vous pouvez vous reporter au tutoriel HTTP et Référencement

Les points suivants sont plus complexes à expliquer et ne font pas encore l'objet d'articles dédiés dans le tutoriel référencement proposé sur Oseox. Toutefois, afin de vous proposer un peu plus qu'une synthèse voici un léger complément.

Proportion contenu texte Versus contenu cliquable

Apparemment, les pages présentant dans leur contenu beaucoup de liens, peu de contenu non cliquable et ayant peu de popularité sont plus difficiles à faire indexer que les pages traditionnelles.

Certainement une mesure pour lutter contre le spam bien que cela ne soit qu'une constatation et une hypothèse personnelle.

Proportion contenu contextuel Versus contenu structurel

Il apparait que les moteurs soient capables de distinguer différentes zones dans un même site et notamment la zone plus "statique" que l'on peut appeler "zone structurel" où l'on retrouve souvent le même contenu entre plusieurs pages et la zone plus dynamique que l'on peut appeler "zone contextuelle" où est affiché le contenu propre à la page.

Bien entendu, ces explications sont assez simplistes puisque les brevets déposés par un moteur comme Google vont assez loin dans leur analyse des différentes zones d'un template mais je pense que cela est suffisant pour comprendre l'idée générale.

Une page ayant peu de contenu dans sa zone "contextuelle" et ayant une faible popularité aura du mal à être indexée.

La proportion de contenu similaire

Ce point rejoint dans une certaine mesure le point précédent.

Si le contenu "contextuel" d'une page est très similaire a du contenu présent sur le même site ou un autre site et que la popularité de cette page est faible alors il y a de forte chance pour qu'elle soit exclue de l'index ou du moins non positionnée.

Un discriminant : La popularité

Comme vous l'avez peut être remarqué pour les derniers points évoqués, la popularité d'une page joue parfois un rôle. On peut imaginer qu'avant de supprimer ou non une page de son index ou de réduire sa visibilité, les moteurs de recherche et Google en tête considèrent sa popularité.

Une popularité forte jouera bien entendu en faveur de la page analysée. Si vous voyez d'autres critères pouvant nuire à l'indexation d'une page, n'hésitez pas à apporter votre contribution dans les commentaires.

Ne manquez pas les futurs articles via Twitter

A propos de l'éditeur d'Oseox.fr

Aurélien Bardon est un passionné de SEO. Il crée Outil-Referencement.com en 2005, Oseox.fr en 2008, fonde en 2009 l'agence SEO Aseox à Lille et lance en 2016 Oseox Software, une plateforme de logiciels SEO.

Oseox Monitoring