Internet
Outils de recherche | Limites

L'exportateur peut organiser sa recherche d'informations sur le web en utilisant un certain nombre d'outils spécifiques, parmi lesquels :


Voici une liste de sites spécialisés dans l'identification et le recensement d'outils de recherche internationaux de différents types (annuaires, moteurs de recherche, bases de données, ...), classés par pays ou par catégorie :


Consultez également les deux sites suivants : Web Diggers  et  SearchEngineWatch. Il s'agit d'outils de formation en ligne consacrés à la recherche et à la veille via Internet. 



Annuaires

Les annuaires de recherche, également appelés index ou répertoires, sont des outils de recherche qui référencent les sites internet sur base de leur titre et du commentaire qui leur est associé (et non de leur contenu). Ces sites sont classés par catégories et sous-catégories.

Chaque annuaire se caractérise par une arborescence propre c'est-à-dire que les différentes catégories choisies, divisées ensuite en rubriques et sous-rubriques, sont organisées et hiérarchisées de façon différente pour chaque annuaire de recherche.

Pour effectuer une recherche, l'internaute doit généralement se déplacer de catégorie en catégorie. Cependant, la tendance étant à la diversification des services et à la centralisation d'outils complémentaires, de plus en plus d'annuaires (exemple : Yahoo, Excite, Lycos, ...) englobent également un moteur de recherche interne qui permet d'effectuer des recherches par mot clé. Sur Yahoo, par exemple, un moteur de recherche est lancé automatiquement lorsque la recherche par catégorie ne produit pas de résultats.

L'indexation des sites dans les annuaires de recherche s'effectue grâce à une intervention humaine et manuelle. Ceci explique que les annuaires référencent moins de 10% du web.

Evitez d'employer les annuaires pour des recherches spécifiques et précises car ils ne sont pas exhaustifs. Utilisez-les plutôt lors d'un recherche générale et thématique, lorsque vous voulez acquérir des connaissances de base dans un domaine que vous connaissez mal ou qui est très étendu. Leur intérêt principal est en effet de faire gagner du temps !

Voici quelques annuaires internationaux, parmi les plus connus :

Il s'agit de la référence en matière d'annuaires. Il comporte des versions locales. 


Un des principaux challengers de Yahoo !













Selon le principe du portail dont l'objectif est de fournir tous les outils dont l'internaute a besoin à partir d'un site unique, nombre d'anciens annuaires (ex : Advalvas) offrent des services annexes (actualités, météo, programmes télévision, services de chat, de SMS, de courrier électronique, ...) et deviennent de véritables lieux de séjour.



Moteurs de recherche

Les moteurs de recherche sont des robots qui indexent et stockent automatiquement le contenu d'Internet (à la fois des pages web et des forums de discussion).

L'utilisateur y recherchera une information en utilisant un ou des mots clés selon qu'il souhaite mener une recherche simple ou une recherche avancée (les mots clés sont alors séparés par des opérateurs booléens tels que AND, OR, NEAR, NOT).

Il existe une multitude de moteurs de recherche qui ont chacun leur propre système d'indexation. Ces moteurs ne réussissent pas à indexer 100% du contenu du web. Il en résulte qu'une même interrogation dans des moteurs différents mènera à des réponses différentes. Il est donc conseillé de combiner la recherche dans plusieurs moteurs pour s'assurer un résultat optimal.

Vous utiliserez les moteurs de recherche lorsque vous devez effectuer une recherche précise en vous basant sur des mots clés spécifiques.

Voici quelques moteurs de recherche internationaux, parmi les plus connus :

Moteur n°1 qui répertorie des pages web ainsi que des newsgroups.










La référence européenne, il est à la fois un moteur de recherche et un annuaire thématique









La tendance étant à la diversification des services et à la centralisation d'outils complémentaires, certains moteurs de recherche (ex : AltaVista, Infoseek, HotBot, ...) incluent aussi des annuaires ainsi que des fonctionnalités pour trouver des adresses e-mail, des forums de discussion, des images, des fichiers MP3, ... qui en font de véritables "pôles de recherche".



Metamoteurs

Face à la multiplication des outils de recherche sur internet (annuaires et moteurs), une nouvelle catégorie a été créée ayant pour but de faciliter les recherches : les metamoteurs. Ceux-ci permettent de gagner du temps en interrogeant simultanément plusieurs répertoires et moteurs de recherche à partir d'un seul formulaire de recherche.

Certains metamoteurs (par exemple : MetaCrawler) présentent les résultats en éliminant les répétitions de documents communs à plusieurs outils. D'autres regroupent les résultats dans des rubriques thématiques (ex : InferenceFind et MetaFind).

Les metamoteurs seront à privilégier par l'utilisateur qui souhaite obtenir un panorama général des documents disponibles autour d'un mot clé particulier en interrogeant un maximum d'outils et ce, en un minimum de temps. Ils permettent également d'identifier les moteurs qui semblent donner les meilleurs résultats.

Malgré le gain de temps qu'ils génèrent, ils présentent quelques inconvénients majeurs :

Voici une sélection des principaux metamoteurs :

















Outils de recherche sectoriels

Les outils sectoriels - annuaires, moteurs ou encore metamoteurs - sont des outils de recherche spécialisés dans un domaine d'activité précis (par exemple : exportation, finance, assurance, éducation, littérature, etc.).

Grâce à leur meilleure structuration sectorielle, ils permettent d'économiser beaucoup de temps dans la recherche, en offrant parfois une réponse de très bonne qualité. Cependant, les outils sectoriels sont encore dans une phase embryonnaire.

Il existe des portails thématiques ou verticaux que l'on nomme vortails et qui répertorient principalement d'autres portails spécialisés dans un secteur donné. Ces portails verticaux (ex. : Verticalnet) sont spécialisés dans différents domaines économiques et industriels ou encore dans certaines fonctions (indexation des images, par exemple). 

Voici une liste de sites qui vous permettront d'identifier des outils de recherche sectoriels  :

Ce site répertorie et évalue les ressources d'information disponibles sur Internet, classées par thèmes.


Ce répertoire des sites de recherche internationaux, classés par pays et par spécialisation, donne également accès à des bases de données sectorielles.


Ces deux sites constituent les versions en ligne de l'encyclopédie Britannica, l'une des meilleures références documentaires au monde. Il fournit toute une série d'informations sur n'importe quel thème mais également des compléments d'informations sur Internet associées à ces thèmes.


Cet annuaire indexe des sites contenant des bases de données sectorielles et qui ne sont pas recensés par les moteurs de recherche traditionnels.


Cet annuaire recense les sites contenant des données statistiques numériques, des catalogues et des bibliothèques de données, ... dans le domaine des sciences sociales. En anglais.


Ce moteur sectoriel donne accès à des bases de données sectorielles.



Outils de recherche de groupes de discussion

Lors de vos recherches, il peut également être intéressant d'identifier des forums de discussion (newsgroup) pour y poser vos questions ou pour y consulter les archives.

Certains moteurs de recherche et annuaires (AltaVista, HotBot, InfoSeek, Excite, ...) recensent également les forums de discussion, essentiellement dans un but de diversification. Cependant, si vous voulez que votre recherche soit efficace et exhaustive, vous devrez utiliser des outils de recherche spécialisés dans les forums de discussion tels que :




Agents intelligents

Les outils traditionnels de recherche (annuaire, moteurs de recherche, metamoteurs) sur Internet sont utiles pour des recherches d'informations ponctuelles. Lorsqu'elles deviennent plus complexes ou récurrentes, il est préférable de se tourner vers les agents intelligents (exemples : Agentware, Webseeker).

Un agent intelligent est un logiciel flexible et autonome qui est capable de communiquer, d'interagir avec l'utilisateur ou avec d'autres agents, mais aussi d'apprendre et de continuer la recherche hors connexion. La fonction d'un agent est d'agir en accomplissant des tâches préétablies.

Il existe différents types d'agent en fonction de la mission qu'ils accomplissent  :
Les agents intelligents peuvent être classés schématiquement entre ceux de type pull et de type push, malgré le fait que la frontière soit parfois très subtile entre les deux :

Malgré une phase de mise en place parfois un peu longue, les agents intelligents constituent probablement la meilleure solution pour être exhaustif en un minimum de temps.