|
Les moyens les
plus répandus d'accéder à l'information sur
le réseau sont les moteurs de recherche et les annuaires.
Par ces moyens, on accède à l'information du web et
dans une moindre mesure des newsgroups. Pour le nouvel internaute,
le web est d'ailleurs la source presque exclusive d'information,
les
autres grands domaines d'Internet restant Terrae Incognitae.
Les annuaires
fonctionnent par catalogage de sites choisis et catégorisés,
et ont donc en principe des bases d'information plus réduites
que les moteurs de recherche. La plupart des annuaires ont d'ailleurs
ajouté un de moteur de recherche à leurs services
(comme Yahoo qui utilise Google).
Les moteurs
de recherche fonctionnent sur le principe d'index régulièrement
mis à jour, dans lequels des millions de pages sont répertoriées.
Faire une recherche sur un moteur, cela signifie faire une recherche
dans son index. La pertinence du contenu de cet index est donc cruciale.
Or aucun moteur
ne peut se targuer d'indexer l'ensemble du web, et aucun ne cherche
à le faire. Plusieurs articles ont d'ailleurs démontré
que les moteurs les plus performants ne pouvaient indexer guère
plus que le sixième du web, comme cet article
paru sur Nua, site portail pour tous les études portant
sur Internet.
Par contre,
les plus grands se livrent une guerre sans merci par communiqués
de presse interposés sur le petit jeu de "celui qui
a le plus gros index". Les moteurs de recherche ont un but
commercial : générer le plus de traffic possible sur
leur site pour maximiser leurs recettes publicitaires. Ce but commercial
avoué jette immédiatement un doute sur la qualité
des résultats fournis par les moteurs ; les rumeurs de démarchage
des sociétés de moteurs auprès des sociétés
voulant afficher leurs sites web en première place dans les
résultats ont longtemps courues le web. L'information fournie
par les sociétés de moteurs à propos de leur
qualité de résultats est certainement plus commerciale
que réaliste. Evidemment, plusieurs sociétés
ont songé à tirer profit de cette lutte des moteurs.
Des sites comme Search
Engine Watch se sont fait une spécialité de surveiller
les moteurs sous tous leurs aspects, à commencer par leur
fréquentation respective.
Dans les moteurs
de recherche, le processus de collecte est automatique : des robots
parcourent les pages présentes sur le web pour les ajouter
aux index. La qualité de l'information présente dans
les index dépend donc du soin apporté par les concepteurs
des sites visités à l'élaboration de la structure
de leurs pages (et de certaines informations cachées qu'elles
contiennent). Bien sûr, cette méthode est la porte
ouverte aux excès : et dans le web commercial, tous les coups
sont permis. Les "spécialistes" du référencement
ont donc mis au point des techniques qui permettent de renforcer
artificiellement la visibilité d'un site dans un moteur de
recherche. Et voilà comment tous les index se retrouvent
surchargés d'information parasite, et voilà pourquoi
la plupart des recherches trop rapidement formulées échouent,
provoquant lassitude et désintérêt chez les
nouveaux internautes.
Au final, ces
moteurs de recherche présentent au premier abord une image
déformée et biaisée d'internet. Cettte image
est de nature essentiellement commerciale que ce soit par les moteurs
eux-même, surchargés de publicité, que par les
résultats qu'ils renvoient. On est alors très loin
d'une bibliothèque universelle.
|