- Lire le billet précédent - Lire le billet suivant -
Google et les Standards: un marché de dupe ?
Par Laurent Denis, le 27 septembre 2004.
La promotion des Standards (X)HTML, CSS et de l'accessibilité aux personnes handicapées met depuis longtemps Google au service de son argumentation :
- La séparation contenu/présentation améliorerait l'indexation des pages en augmentant la part de contenu significatif au yeux d'un moteur de recherche ;
- Les tags sémantiques (titres, emphase...) donneraient plus de poids aux mots-clés dont Google serait friand ;
- Les tags et attributs d'accessibilité (alt) seraient efficaces pour Google, puisque celui-ci ne serait jamais qu'une autre sorte d'utilisateur aveugle tirant profit des textes alternatifs des images, des menus sans javascript, etc.
De fait, l'expérience semble valider ces affirmations. Mais pour en estimer la portée réelle, il faut revenir à quelques simples constats :
- Google ne s'est pas élaboré au fil des années avec pour objectif d'indexer des documents conformes aux Standards du Web, mais bien au contraire, pour indexer le plus possible de documents ne tenant aucun compte de ceux-ci. Il a donc développé surtout des mécanismes donnant du sens en dehors des standards sémantiques auxquels nous tenons tant (preuve incidemment qu'on peut y parvenir, mais à quel prix et avec quelles perspectives de développements au-delà ?) ;
- Le fonctionnement de Google est volontairement et explicitement tenu secret, et il n'est apparemment pas dans l'intérêt commercial de cette entreprise d'adopter des techniques transparentes, ni d'autoriser l'utilisation de techniques aux résultats trop prévisibles. Google, en un sens, est un véritable archétype des technologies propriétaires dans toute leur splendeur, et de l'exploitation d'une clientèle tenue sous dépendance.
- La justification tautologique de cette politique pour Google est qu'il peut l'imposer puisqu'il se trouve en position dominante et qu'elle lui permet de s'y maintenir : la fuite en avant vers un web de plus en plus captif serait donc son attitude la plus prévisible.
Dans ces conditions :
- Dire comment fonctionnent les algorithmes de Google relève plus de la divination que de la démonstration crédible ;
- Dire ce qui est ou n'est pas dans l'intérêt de Google ne doit surtout pas oublier qu'il ne s'agit pas d'une entreprise philantropique ou tout simplement respectueuse d'on ne sait quelle "éthique".
En fait, on peut se demander si au-delà de ces quelques coïncidences factuelles et très limitées, la généralisation et le respect des Standards serait bien dans l'intérêt de Google (si tant est que ce sujet confidentiel le concerne réellement) :
- Certes, l'exploitation la plus simple du Web sémantique est supposée diminuer les coûts d'indexation, en définissant des mécanismes clairs et relativement précis d'interprétation des pages, dans des formats bien déterminés ;
- Mais en rendant du coup nettement plus transparents ces mécanismes d'indexation ;
- Et finalement au prix d'une perte de pouvoir de Google sur sa clientèle, et d'une moindre valeur de ses services marchands (liens sponsorisés et autres pratiques plus obscures).
En caricaturant un peu, je parierais volontiers sur Google comme candidat à la succession de Microsoft en tant que futur Grand Satan du Web, violeur de standards et abuseur de position dominante.
Trackbacks
Après Microsoft, Google : sujets «in»
Retour sur les débuts
Il fût un temps où Google était le vilain petit canard du monde des moteurs de recherche, parce qu'il ne fonctionnait pas comme les autres : discret, utilisant les logiciels libres, bref, une référence épatante du...
Une tyrannie googlique ?
Cette mutation à tellement modifiée google qu'aujourd'hui ses objectifs ne seraient plus les mêmes. Hier préoccupé par l'intérêt de l'internaute, aujourd'hui google se diversifie avec énergie et atteint de nouveaux débouchés a tel point qu'il en...
Les trackbacks pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.
Commentaires
Phi Entropie, le 27 septembre 2004
Bonjour,
Je ne suis pas tout à fait d'accord avec ton analyse. Même si Google s'efforce de répertorier le plus de sites possibles, il est aussi dans son intérêt de proposer les réponses les plus pertinentes aux requêtes des internautes. Pour cela, ses algorithmes doivent réussir une analyse sémantique des sites. Si Google et le W3C n'ont pas aujourd'hui la même définition de la sémantique, je pense tout de même qu'ils vont dans le même sens. Personnellement, je construis mes pages en suivant les recommandations du W3C et j'obtiens de très bons résultats dans Google. Cela me suffit, je n'ai nul besoin de connaître les algos de Google. Bien sûr, ma vie n'est pas suspendue aux bénéfices du positionnement de sites web, car je ne suis un webmaster professionnel. On peut comprendre que ceux-ci essaient de coller au plus près les méthodes de Google. C'est une attitude qui paye peut-être sur le court terme mais qui nécessite des ajustements permanents (du moins, à chaque correction d'algo). Pour moi, ce serait une perte de temps.
Bob Marcel, le 27 septembre 2004
Si google dévoilait ses algorithmes ce serait un retour à la case départ car il y aura toujours des petits malins à la recherche des bidouilles pas forcément éthiques pour mieux référencer leur site.
moala, le 27 septembre 2004
Bob, je pense que tu suis un peu les arguments de microsoft qui veulent rendre le net dépendat de certaines entreprises "pour la sécurité" : par exemple, faire payer les e-mails pour réduire le spam.
Il me semble qu'il y a d'autres solutions de sécurité que les solutions reposant sur le seul fait que l'algorithme est inconnu et propriétaire (la sécurité s'effondre dès qu'il y a des fuites, C.F. noyau Novell). Linux en est la preuve, par son côté open source, et c'est la STRUCTURE de l'algorithme qui en est garante, non son secret.
Il faudrait donc élaborer un algorithme de MEILLEURE structure (c'est-à-dire qui évite de se faire avoir par des petits malins), open source (plus de développeurs, plus de brainstorming etc)... voire un site de recherche LIBRE financé par des dons (et/ou quelques pubs)...
Les standards du net pourront ainsi être mis en avant !
Sim, le 27 septembre 2004
Quelle est la finalité de ce billet ?
Le seul réel constat que l’on puisse établir aujourd’hui c’est que Google encourage l’utilisation des standards et que c’est bon pour le Web en général.
Que les intentions de Google ne soient pas philanthropiques n’échappe à personne. Est-ce répréhensible ?
Le fait qu’ils ne divulguent pas leurs méthodes d’indexation leur à jusqu’à présent permis de préserver la pertinence des résultats. Pour l’utilisateur que je suis, c’est la chose la plus importante et je souhaite que ça continue. Je trouve donc ce billet qui tente de les diaboliser bien peu pertinent.
Gloom, le 27 septembre 2004
Concernant la pertinance de Google, il faut nuancer aussi. Certe il est pertinant, mais surtout par le nombre de site indexé, sur certaines recherche fort ciblée, on ne trouve rien d'interressant directement.
Puis, certain sont fort dans l'art divinatoire pour abuser de google sans connaître ces algoritmes (les sites porno par exemple).
Google mise plus sur la quantité plus que la qualité et profite du fait qu'il domine le marcher pour continuer à dominer le marcher. Google, c'est avant tout de très fins stratège en marketing avant d'être un bon algorithme.
Bref, je ne suis pas sûr que le fait d'être propriétaire protège tant que ça des profiteurs et que les résultats soit plus pertinant pour la cause.
Notez bien que je ne dis pas que google est mauvais, loin de là, je dis juste qu'il n'est pas le meilleur moteur de recherche comme on peu le croire.
Yan Morin, le 27 septembre 2004
Deux questions:
Pourquoi les pages mêmes de google n'utilisent pas les standards Web?
Pourquoi n'indexe-t-il pas les pages XHTML (application/xhtml+xml) comme les autres pages html (text/html)?
Denis, le 27 septembre 2004
Personnellement, j'ai plutôt tendance à rejoindre l'avis de Laurent sur la question. Google sert bien notre cause de promotion de l'accessibilité, des standards et de la sémantique certes, mais c'est tout à fait malgré lui qu'il le fait. Je demeure convaincu qu'à ce jour, les têtes dirigeantes de Google qui entendent parler de leur site web comme étant le plus réprésentatif des utilisateurs aveugles n'y pigent rien du tout. D'ailleurs, il est clair que s'ils avaient pigéé, ils auraient depuis longgtemps apporté les changements qui s'imposent à leur site... mais lorsqu'on est dans une position comme Google, a t-on besoin de faire des efforts pour accroître sa visibilité ? Là repose toute la question. Contrairement à certains d'entre vous toutefois, je ne remet pas en cause la pertinence du billet de Laurent. C'est un son de cloche nécessaire, ne serait-ce que pour nous rapeller que Google n'est définitivement pas notre ami lorsqu'il persiste à travailler à huis clos.
laurent bervas, le 27 septembre 2004
D'accord avec laurent et denis :
Je trouve cet article pertinent et c'est l'objet des blog que de lancer les débats.
je pense que le piège ds lequel se trouve Google est celui de toutes les sociétés en bourse.
Les actionnaires aiment les monopoles : c'est stable et rassurant.
Il est logique que les dirigeants de google essaient de préserver leur place.
L'esprit de google a été capté par l'appat du gain ?
Denis, le 28 septembre 2004
Question innocente peut-être mais n'ayant rien de trollesque :
Qu'est-ce qui pourrait bien nous laisser croire que le gain n'ait pas TOUJOURS été le but de Google ?
Quelle société importante ne travaille pas en ce sens ? Je ne crois pas que Google fasse partie de ces entreprises qui mettent les idéologies au-devant de leur propres intérêts pécuniers (parce que de telles entreprises ne peuvent exister à long terme)... À la rigueur, même la Fondation Mozilla n'en est pas à l'abri. N'eut été de la niche dans laquelle ils se trouvent et du fait que leur survie dépende de l'open source,la Fondation serait très certainement heureuse de vendre leurs produits et de les voir s'imposer partout.
Romain, le 29 septembre 2004
Le glissement de l'image de Google, d'une jeune entreprise sympatique à celle d'une société dominatrice est au goût du jour : www.romaindesplanques.com...
De là à comparer Microsoft et Google il y a un monde.
On ne peut pas, à l'heure actuelle, accuser Google de la moindre tentative commerciale abusive. Le web n'est pas captif de Google, il existe beaucoup d'autres solutions de recherche sur le web notamment Yahoo!.
David Latapie, le 30 septembre 2004
Cela me rappelle le glissement de Netscape et 3dFX (ce n est pas un reproche, juste une constation).
<p>J avais d ailleurs deja fait deux billets dans ce sens
<www.teaser.fr/~lcolombet/...
<www.teaser.fr/~lcolombet/...
D ailleurs je parle dans le premier du moteur de recherche libre mozdex <www.mozdex.org>, (qui est toujours en panne).
Eric Daspet, le 01 octobre 2004
Je ne suis pas d'accord avec les constats de base. Google est justement connu pour tenir plus compte de la sémantique que les autres.
Il comprend ce qu'est un <h1>, ce qu'est un <em>, ce qu'est un <th>, etc. C'est encore très limité mais c'est déjà beaucoup plus que les autres.
Laura Dove, le 01 octobre 2004
Ce qui fait le succès de Google à mon sens (en tout cas, ce qui fait que je l'utilise), ce n'est pas la pertinence de ses résultats mais son taux d'indexation du web et la vitesse de rafraîchissement: beaucoup de pages, contenu à jour, très peu de 404 (et le cache est bien utile dans ces cas-là). Pendant un certain temps mon site était le troisième résultat Google pour le mot-clef "laura" et le premier en français... J'ai la grosse tête, mais quand même, un peu de sérieux!
J'ai découvert récemment un nouveau moteur de recherche: www.gigablast.com/ Il souffre justement de ne pas indexer beaucoup de pages (en plus, le lien pour ajouter son URL est en panne), mais propose une syntaxe de recherche très puissante. A garder sous le coude, je dirais. Les habitudes sont fortes, mais j'essaye de penser à lancer mes recherches sur celui-là, quitte à élargir avec Google ensuite.
Laurent Denis, le 01 octobre 2004
Quelques éclaircissements, après ces commentaires intéressants :
- la pertinence des résultats de Google n'est pas en cause ici, et il ne s'agit pas de chercher des moteurs alternatifs.
- le constat de base n'est pas que Google n'exploiterait aucun élément sémantique, mais qu'il en exploite très peu.
- le problème est de savoir s'il est vraiment dans son intérêt de donner un poid plus important à cette sémantique HTML actuellement minimale.
Pour rebondir sur ce que disait Denis, le Web sémantique est une idéologie... que mettront en oeuvre des acteurs aux motivations aussi peu idéologiques que possible.
MaxV, le 01 octobre 2004
Excuse moi pour le double trackback, j'ai pas encore la "maîtrise" de DotClear... j'espere que tu pourra supprimer le double de ton coté.
Je partage sinon le même point de vue que l'auteur, à savoir que google à mal grandi.
Denis, le 03 octobre 2004
Précisément... quand nous verrons qui seront parmi les premiers à profiter de la "vibe" et du "hype" sémantique, on s'attendra naturellement à voir ces corporations que tant se plaisent à décrier... Il n'y a que les fourmios comme nous qui peuvent se permettre de mettre les idéologies au devant des profits... les géants sont justement géants parce que depuis longtemps déjà, ils ont appris à étouffer leurs rêves de jeunesse derrière leurs agendas corporatifs.
Eric Daspet, le 03 octobre 2004
En fait je reste dubitatif sur les moteurs de recherche qui tiennent compte de la sémantique.
Le gros problème n'est pas technique, il est humain : "l'homme ment".
On l'a vu dans les premières méta données HTML : les méta description et meta keywords. Les moteurs de recherche modernes en tiennent très peu compte voire les ignorent. Tout simplement parce que les gens les remplissaient de façon à avoir des visites au lieu de les remplir honnêtement comme le voudrait leur contenu (ah .. les meta avec "sex, mp3, porno" dedans ... un vrai classique)
Tant que l'homme pourra détourner la sémantique pour obtenir des effets techniques (si je met telle balise ça va m'apporter tel type de visite) au lieu de donner du sens au contenu ... ça ne pourra jamais marcher correctement. Resultat le maximum qu'on puisse faire 'est probablement se baser uniquement sur ce que "voit" l'utilisateur, puisque ça on peut difficilement le détourner (sinon on change de contenu). C'est finalement ce que font déjà Google et les autres.
Laurent Denis, le 03 octobre 2004
Un excellent article avait paru il y a peut-être deux ans, sur un site anglo-saxon, expliquant que le Web sémantique était une utopie en raison du caractère foncièrement malhonnête de la nature humaine
J'en ai malheureusement perdu la référence : quelqu'un s'en souviendrait-il ?
RebelBleu, le 20 octobre 2005
Oui, Google cherche le profit comme n'importe quelle autre société privée. Ce que je trouve amusant, c'est que cet appât du gain - basé dans son cas sur la recherche des meilleurs résultats possibles - l'a naturellement amené a lutter de façon énergique contre le spam.
Ses derniers perfectionnement dans ce domaine aboutissent à une conclusion radicale dans le milieu des webmasters : mort à la "sur-optimisation", la bonne astuce consiste aujourd'hui à réaliser des sites "propres" et de qualité pour séduire Google !
Google ayant pour objectif de séduire le plus grand nombre n'a d'autre choix que de promouvoir l'intérêt du plus grand nombre et d'adopter une stratégie "morale" qu'il imposent désormais aux webmasters.
Finir par défendre la morale, quelle merveilleuse ironie pour une société dont le seul objectif est de faire du profit !
Je suis tombé sur un site amusant et instructif concernant Google :
www.rankspirit.com/google...
On y trouve notamment la traduction de l'un de leur brevet qui fait réfléchir !
Thomas Mathey, le 30 mars 2006
Il est évident que Google n'a que faire de l'accessibilité (pour preuve leur propres pages) mais ceci dit il n'est pas totalement faux - à mon avis - de dire qu'en optimisant pour l'accessibilité on optimise pour le référencement. S'il est vrai que prétendre comprendre parfaitement l'algo de google est peu crédible, certains tests sérieux donnent des pistes qui se tiennent...
Les commentaires pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.