|
François
Bourdoncle
"Le
chercheur des techniques de recherche"
|
François
Bourdoncle est l'inventeur du système
qui permet de visualiser graphiquement les résultats d'une requête
sur le moteur de recherche AltaVista.
Dans son laboratoire
de l'Ecole
des Mines, des vaches en peluche
trônent sur les ordinateurs. Certaines arborent une casquette au
logo d'AltaVista. Logique : il représente des alpages. Ces vaches
symbolisent son invention depuis que Digital
en a abandonné le nom initial, Live Topics, pour Cow 9, "la
neuvième vache". Le nom de code de l'application, au cours
de son développement, était Cloud 9 ("7è ciel").
Tous
les fichiers informatiques commençaient donc par "C9".
Au moment de renommer son invention, François Bourdoncle voulut
garder ces initiales pour éviter un surcroît de travail. On parlait
beaucoup de vache folle à l'époque. Joueur, il décida donc de rebaptiser
son système Cow 9. De quoi assurer sa réputation du Minnesota au
Kansas.
Il
revient pour nous sur les principes de fonctionnement de "la
vache" et sur les évolutions qu'elle esquisse pour l'avenir
des technologies de l'information.
Vous
avez inventé Cow 9, instrument intégré dans le moteur de
recherche AltaVista : en quoi consiste sa nouveauté et quel est
son intérêt ?
Cow
9 permet aux utilisateurs de naviguer de manière plus conceptuelle
sur l'Internet. Le moteur interagit avec l'utilisateur pour indiquer
ce qu'il possède dans sa base de données et lui permettre de naviguer
de façon thématique. Cela est très différent de ce que fait Yahoo
, où les thèmes sont pré-définis et de très haut niveau. L'indexation
est faite manuellement, par des êtres humains, et pour des sites
pris en entier. On ne peut pas ajouter une infinité de catégories,
pour ne pas perdre les utilisateurs. Dans Cow 9, les thèmes
ne sont pas définis par avance, ils sont extraits automatiquement
à partir des documents eux-mêmes. Par une analyse globale du contenu,
le moteur indique les thèmes prioritaires, ce qui permet à l'utilisateur
de retenir ou d'exclure certains termes pour affiner sa recherche.
L'approche de Topic (logiciel d'indexation développé par la société
Verity) est également
différente puisqu'elle n'est pas dynamique : la base de données
est pré-formatée à partir de certains thèmes pour permettre un ensemble
de requêtes. L'ensemble est un peu figé et ne répond pas toujours
aux besoins : les experts ne pensent pas forcément à tout. J'ai
travaillé récemment avec des psychanalystes. Ils ont effectué une
recherche à partir du terme "MPD" (multiple personality
disorder). Des tas d'associations sont apparues, dont certaines
leur paraissaient non pertinentes. En consultant les documents rapportés,
ils se sont accordés sur le fait que l'approche était recevable
mais qu'ils ne voyaient pas le problème comme cela. Le tout faisait
sens et remettait en question l'approche classique. Les experts
ont des a priori et classifient d'une façon qui diffère de
la vision d'autres utilisateurs. Quand la base produit du sens,
et elle en produit assez régulièrement, elle permet de découvrir
un domaine, ou de le redécouvrir sous un jour nouveau.
Y
a-t-il un processus de sélection naturelle au sein des moteurs de
recherche ?
Il
y a un processus de sélection naturelle et il a déjà causé pas mal
de dégâts puisque Alta Vista est aujourd'hui le numéro un, loin
devant les autres. Tout, sur l'Internet, répond à une distribution
de Ziff : pour chaque application, 20 % des acteurs occupent 80
% du marché. AltaVista est ainsi le leader incontesté des moteurs
de recherche. Il faut dailleurs ajouter à sa part de marché
les requêtes faites sur des moteurs qui ont recours à Alta Vista
(comme Yahoo lorsque les requêtes au sein de son annuaire sont insatisfaites).
La sélection naturelle se poursuit, et beaucoup de moteurs vont
disparaître. Un moteur comme Excite
se repositionne comme un site d'information et ne conserve son moteur
de recherche que pour assurer sa visibilité sur le réseau.
[Suite de l'interview]
Octobre 1997
|
|
|