Accueil > weblog
- Lire le billet précédent - Lire le billet suivant -
Par Laurent Denis, le 21 janvier 2005.
Ne me dites pas que c'est une spécification ! Je ne sais même pas ce que cette nouvelle valeur d'attribut est supposée vouloir dire exactement :
From now on, when Google sees the attribute (rel="nofollow") on hyperlinks, those links won't get any credit when we rank websites in our search results.;
Any link with this tag will indicate to a crawler it is not necessarily approved by this page and shouldn’t be followed nor contribute weight for ranking.;
By adding a rel="nofollow" attribute to hyperlinks, webmasters and weblog owners can tell search engines that the links are effectively untrusted.;
Followed ? Not followed ? Followed with no credit ? Maybe someday "followed with bad credit" ? An what the hell does "untrusted" mean ?
[edit 2005-01-23]
Technocrati semble vouloir définir de son côté le profil nofollow.
En l'état, la définition qu'en donne Technocrati limite le nofollow à son interprétation la plus étroite : le lien peut être suivi par un robot d'indexation, mais, n'ayant pas été créé par l'auteur de la page où il se trouve, il ne devrait générer aucun gain de poids
ou de rang
au bénéfice de la cible.
De l'art d'ajouter un peu de confusion à ce qui est déjà beaucoup trop confus...
Les trackbacks pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.
Commentaires
David Latapie, le 21 janvier 2005
C'est inspiré du meta robot
<meta name="robots" content="nofollow" />
Mais le meta robot a de fortes chances d'être une convention, et non une spéc.
Laurent Denis, le 21 janvier 2005
Non, David. Le Standard for Robot Exclusion auquel est emprunté abusivement le "nofollow" en question, a, lui, le mérite de préciser clairement sa nature :
Il ne vise d'autre part pas du tout les mêmes fins que le "nofollow" de Google.
Philippe Worontzoff, le 21 janvier 2005
Untrusted simply means that it is not trusted.
En français, untrusted veut dire "qui n'est pas de confiance". Maintenant, tu demande peut-être ce que ça entraine du point de vue de leur algorithme, je pense que justement, il utilise un terme vague pour ne pas trop dévoiller la partie de leur algorithme qui concerne ce rel="nofollow". Mais, c'est peut-être ce que tu insinuais en posant la question "An what the hell does "untrusted" mean ?".
Laurent Denis, le 22 janvier 2005
Ce que je demande, c'est une définition précise de ce que signifie "nofollow":
- le lien sera-t-il ignoré par l'algorythme de calcul de pertinence tout en étant "suivi" par le robet d'indexation ?
- ou sera-t-il également ignoré ("not followed") par le robot ?
- la valeur d'attribut doit-être être unique pour être prise en compte ? Google et consors respectent-ils www.w3.org/TR/html401/str... qui autorise plusieurs valeurs successives d'attribut rel séparées par des espaces ? (Voir l'utilisation faite par XFN). Ou restreignent-ils le champ d'application de l'attribut rel à leur seul problème local ?
- "nofollow" est-il pris en compte par nos petits comiques pour l'élément link ?
- quid d'une valeur "follow" ?
- quid des règles de priorité entre <meta name="robots" content="index follow"> et <a rel="nofollow"> ?
- quid de l'application à une <meta name="DC.Relation.Replaces" content="document_perime.html" /> ?
- quid des besoins éventuels d'autres moteurs à l'algorithme différent (Ask Jeeves par exemple) : allons-nous voir se multiplier les valeurs de rel ? Chaque moteur ayant sa propre exigence ?
- quid d'un working draft sur le sujet, d'un appel à commentaires, bref, d'un processus cohérent, critique et collectif d'élaboration de ce nouveau profil ?
Google me propose d'appliquer un hack cuisiné en interne, non documenté et passablement problématique.
Groumphy, le 22 janvier 2005
Selon ma logique, je dirais que celui qui utiliserais le "nofollow" (sympathison le ainsi), ne serait ni suivis ni indexé... De ce fait, cela répondrais à la question sur l'algorythme de pertinance etc.
Mais dans tous cela, pourquoi utiliser une telle balise ?
Préférer le fichier ROBOTS.TXT n'est-il pas mieux ?
Si je ne veux pas que ma page soit indexée, je la fixe dans un répertoire et j'argumente mon fichier ROBOTS.TXT vers le DISALLOW: /MONREPERTOIRE/ ... Ou a la rigueur j'indique le DISALLOW sur ma page même (si je suis fainéant de la bouger).
Pour en revenir sur ce qui à causé ce "nofollow" événement (le blog en lui-même ?), ne devrait-il pas être en répertoire DISALLOW ?
Ganf, le 22 janvier 2005
Le robots.txt agit sur toute la page, le nofollow agit au niveau du lien. Ca permet de garder des liens "de confiance" (ceux du billet) et des liens "tiers" (ceux des commentaires) dans la même page.
Ca permet aussi d'indexer les commentaires sans suivre les liens (ce qu'un disallow ne permet pas).
Groumphy, le 23 janvier 2005
Merci de ces précisions Ganf.
Laurent Denis, le 23 janvier 2005
Robots.txt et rel="nofollow" diffèrent sur un point très important:
- robots.txt n'intervient en rien dans la signification (la sémantique, si vous voulez) du document. C'est un moyen totalement indépendant de la ressource Web de résoudre un problème propre à un contexte très étroit, celui de l'indexation par les robots.
- A l'inverse, rel="nofollow" modifie le document lui-même, et surtout, modifie potentiellement le sens de l'attribut rel, pour répondre à un problème encore plus étroit et temporaire : alléger la charge d'indexation de quelques moteurs de recherche que gênent la prolifération des liens dans des sites ne répondant pas à leur modèle (modèle selon lequel tout lien a été volontairement choisi par l'auteur du document, ce qui permet d'inférer de sa présence un jugement de valeur sur la cible).
On me dira sans doute que les <meta name="robots" ...> s'exposent, elles, à la critique que je viens de formuler pour le rel="nofollow". Oui. Mais à un point près : ces metas propres aux robots d'indexation ne prêtent à aucune dérive vers l'interprétation des liens comme jugement de valeur. Elles ne se rapportent pas à la cible des liens, mais au document où ils se trouvent.
A l'inverse, quelle est la dérive déjà inventée pour le rel="nofollow" ? "Ah, chic ! Je vais enfin pouvoir lier une page sans l'approuver." Quoi qu'en dise Google, il vient de créer une pseudo-metadonnée permettant aux gens de formuler un jugement de valeur négatif sur les documents qu'ils vont lier. Ce n'est sans doute pas sans intérêt... Mais pas sous cette forme totalement improvisée !
Jacques, le 09 juillet 2005
Un petit malin m'a un jour conseillé d'utiliser rel="nofollow" pour augmenter le PR d'une de mes pages centrales de la manière suivante: tous les liens sortant de ta page centrale (une sous-page centrale en fait) vers la page de chaque produit individuel du catalogue sont munis de rel="nofollow", sauf les liens de retour, qui recevront ainsi le plus gros des "votes" de ma sous-page.
Et pour que les robots découvrent quand même tes pages en fin de chaîne (celles qui décrivent chaque produit de manière individuelle), tu indexes ces pages sur un plan de site, accessible depuis la racine du site. Enfin, tu fais des liens de retour ordinaires (SANS le rel="nofollow") depuis tes pages en fin de chaîne vers la sous-page centrale que tu veux valoriser. Celle-ci recevra ainsi beaucoup de "votes" (des pages périphériques) sans avoir elle-même "voté" pour ces pages de fin de chaîne.
J'ai expérimenté cette "technique" sur mes pages en anglais (j'ai un site multilingue) entre le 2 juin et le 9 juillet 2005 (6 semaines, le temps en principe d'une Google-dance). Et j'ai perdu la moité de mes visiteurs anglophones ! Pas spécifiquement sur Google, sur tous les moteurs.
Il peut y avoir un facteur conjoncturel, les Anglais sont aujourd'hui moins clients de mes produits qu'au début de l'année, mais cette baisse de conjoncture n'explique pas toute la différence, et je vais retirer mes rel="nofollow". Je me demande si les robots ne dressent pas une liste des pages affectées d'un tel conseil pour les déclasser, même si d'autres liens "normaux" conduisent à elles sans entrave. En attendant je déconseille l'usage de rel="nofollow" dans un but d'optimisation.
Les commentaires pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.