Plan de site Navigation
Blog & Blues Techniques et Standards de la Qualité Web

Accueil > weblog


- Lire le billet précédent - Lire le billet suivant -

Web Standards propaganda & moteurs de recherche

Par Laurent Denis, le 19 décembre 2004.

Source : SES Chicago Report.
  • Le balisage sémantique ne compromet pas votre classement par les moteurs de recherche. Il peut même vous apporter un petit plus. Cependant, ce gain sera minuscule, et ne sera pas toujours une question de sémantique. Les moteurs de recherche semblent utiliser le balisage de la même manière qu'un être humain : les titres et les éléments qui donnent plus de poids dans la présentation, tels que <strong> et <i>, augmenteront légèrement le poids de leur contenu. En fait, même les éléments de présentation peuvent avoir un effet. Ils [Matt Bailey and Shari Thurow] ont également déclaré que si vous utilisez ces éléments uniquement pour améliorer votre classement, vous jouez perdant.
  • Plus le contenu est placé tôt dans le document, plus il a de poids... Mais là encore, l'effet est vraiment mineur.
  • L'attribut title des liens et le texte longdesc n'a aucun effet, positif ou négatif, sur le classement par les moteurs de recherche. Le conseil donné est d'avoir le même texte pour l'intitulé du lien et pour l'attribut title, et que tout ce que vous mettrez dans un longdesc doit pointer vers la page elle-même [et non vers une autre page] (...)
  • La validité du document n'est ni une aide, ni une gêne pour le classement ; la validation est totalement ignorée. L'avis (en substance) d'un représentant de Yahoo! était que la validation n'aide pas à mieux trouver les informations pour l'utilisateurs, car une bonne information peut aussi bien se trtouver dans des pages invalides (ce qui est usuellement le cas).
  • (...)
  • De nombreuses choses que nous considérons bonnes, comme les techniques de remplacement d'image et de Flash, ne peuvent technologiquement pas être distinguées des techniques de spamming des moteurs de recherches (Principalement parce que ces choses sont souvent utilisées dans le but de spammer les moteurs de recherche). Des pratiques telles le fait de déplacer un texte hors de la zone de visualisation dans le but de montrer une image d'arrière-plan, ou de cacher des calques de texte pour un affichage dynamique, et ainsi de suite... sont toutes rassemblées sous le terme de cloaking propre à l'industrie SEO (...)

Trackbacks

Les trackbacks pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.

Commentaires

Laurent Denis, le 19 décembre 2004

e-t172, le 19 décembre 2004

"Des pratiques telles le fait de déplacer un texte hors de la zone de visualisation dans le but de montrer une image d'arrière-plan, ou de cacher des calques de texte pour un affichage dynamique, et ainsi de suite... sont toutes rassemblées sous le terme de cloaking propre à l'industrie SEO (...)"

Tu peux mieux expliquer ce point ? J'ai rien compris.

Laurent Denis, le 19 décembre 2004

En fait, tout ce qui masque à l'affichage un contenu HTML, même temporairement, peut rentrer dans la catégorie "cloaking" puisque c'est potentiellement une tentative de manipuler le moteur de recherche en ajoutant un contenu caché composé par exemple de mots-clés répétés : Les scripts et les CSS recourant à display:none, visibility:hidden, position: absolute; top: -5000px;, width: 1px; height: 1px, ou encore color: #fff; background-color: #fff;, clip...

Cela-dit, il ne faut pas dramatiser : comme le rappelle Eric Meyer dans la suite de son article, les principaux moteurs de recherche ne prennent pas de mesures de rétorsion massive a priori face à ce type de pratique (ils ne les prennent en compte qu'en cas de dénonciation).

Mais ce qui est plus intéressant, c'est cette incompatibilité entre :

  • la logique "CSS" qui donne toute liberté à un auteur (ou un utilisateur) de différencier le rendu d'un même contenu HTML selon les media (contenu réservé à l'affichage en projection, handheld, ou à la restitution print ou speech, etc.)
  • la logique "moteurs de recherche" selon laquelle toute différenciation ou adaptation de contenu est a priori frauduleuse.

C'est à rapprocher du postulat selon lequel le Web sémantique est illusoire parce qu'il repose sur l'honnêteté a priori des auteurs : la prise en compte réelle des meta-données par les moteurs de recherche les mettrait à la merci de l'inévitable malhonnêteté humaine smiley clin d'oeil

A l'heure actuelle, les moteurs de recherche préfèrent finalement :

  • Ignorer en grande partie les informations "ajoutées" au contenu par les auteurs
  • Déterminer à leur propre manière (et de façon plus indépendante) la validité du contenu.

Sebastien Billard, le 27 janvier 2005

Précision : le cloaking stricto sensu c'est délivrer un contenu différent aux moteurs et aux utilisateurs en se basant sur des technologie d'IP delivery ou d'agent delivery.

Les moteurs sont facilement abusés par les possibilités de masquage par les propriétés CSS car ils ne lisent pas les feuilles de style.

Christophe, le 19 novembre 2005

Bonjour, j'ai utilisé la technique du display:none dans la css pour ajouter des mots clés qui n'apparaissaient pas sur mon site. Quelques minutes plus tard, j'ai consultez votre article concernant cette technique et j'ai rapidement fait marche arrière.
Malheureusement, il semble que le robot de google soit passé entre les deux manipulations.
J'ai quelques questions :
- Est-ce que google m'a définitivement rayé de sa liste ?
- Combien de temps va-t-il falloir pour apparaitre de nouveau ?
- J'ai des mots clés qui n'apparaissent pas dans les textes de mon site mais qui sont pourtant important. Si je comprend bien, il faut écrire du texte qui contient ces mots clés pour qu'il soit référencé. Je trouve que ceci est un peu idiot... J'ai justement fais en sorte de mettre peu de texte sur mon site pour qu'il soit clair. Quel est le bon compromis et finalement, comment faire pour avoir un site clair mais bien référencé ??? Est-ce réellement compatible ???

Les commentaires pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.