Moteurs et annuaires Retour à la page précédente Retour au sommaire de KaFkaïens Magazine
Ce document est un fragment de l'article intitulé l'Accès au savoir sur Internet.
 

Les moyens les plus répandus d'accéder à l'information sur le réseau sont les moteurs de recherche et les annuaires. Par ces moyens, on accède à l'information du web et dans une moindre mesure des newsgroups. Pour le nouvel internaute, le web est d'ailleurs la source presque exclusive d'information, les autres grands domaines d'Internet restant Terrae Incognitae.

Les annuaires fonctionnent par catalogage de sites choisis et catégorisés, et ont donc en principe des bases d'information plus réduites que les moteurs de recherche. La plupart des annuaires ont d'ailleurs ajouté un de moteur de recherche à leurs services (comme Yahoo qui utilise Google).

Les moteurs de recherche fonctionnent sur le principe d'index régulièrement mis à jour, dans lequels des millions de pages sont répertoriées. Faire une recherche sur un moteur, cela signifie faire une recherche dans son index. La pertinence du contenu de cet index est donc cruciale.

Or aucun moteur ne peut se targuer d'indexer l'ensemble du web, et aucun ne cherche à le faire. Plusieurs articles ont d'ailleurs démontré que les moteurs les plus performants ne pouvaient indexer guère plus que le sixième du web, comme cet article paru sur Nua, site portail pour tous les études portant sur Internet.

Par contre, les plus grands se livrent une guerre sans merci par communiqués de presse interposés sur le petit jeu de "celui qui a le plus gros index". Les moteurs de recherche ont un but commercial : générer le plus de traffic possible sur leur site pour maximiser leurs recettes publicitaires. Ce but commercial avoué jette immédiatement un doute sur la qualité des résultats fournis par les moteurs ; les rumeurs de démarchage des sociétés de moteurs auprès des sociétés voulant afficher leurs sites web en première place dans les résultats ont longtemps courues le web. L'information fournie par les sociétés de moteurs à propos de leur qualité de résultats est certainement plus commerciale que réaliste. Evidemment, plusieurs sociétés ont songé à tirer profit de cette lutte des moteurs. Des sites comme Search Engine Watch se sont fait une spécialité de surveiller les moteurs sous tous leurs aspects, à commencer par leur fréquentation respective.

Dans les moteurs de recherche, le processus de collecte est automatique : des robots parcourent les pages présentes sur le web pour les ajouter aux index. La qualité de l'information présente dans les index dépend donc du soin apporté par les concepteurs des sites visités à l'élaboration de la structure de leurs pages (et de certaines informations cachées qu'elles contiennent). Bien sûr, cette méthode est la porte ouverte aux excès : et dans le web commercial, tous les coups sont permis. Les "spécialistes" du référencement ont donc mis au point des techniques qui permettent de renforcer artificiellement la visibilité d'un site dans un moteur de recherche. Et voilà comment tous les index se retrouvent surchargés d'information parasite, et voilà pourquoi la plupart des recherches trop rapidement formulées échouent, provoquant lassitude et désintérêt chez les nouveaux internautes.

Au final, ces moteurs de recherche présentent au premier abord une image déformée et biaisée d'internet. Cettte image est de nature essentiellement commerciale que ce soit par les moteurs eux-même, surchargés de publicité, que par les résultats qu'ils renvoient. On est alors très loin d'une bibliothèque universelle.

 
Oh Oui ! vos réactions Ah Non !
Voir les autres textes de cet auteur - Envoyer ce texte à un ami
KaFkaïens Magazine - Tous droits réservés