Faut il avoir peur de la bibliothèque de Google ?
Moteurs de recherche, Veille IE Pas de commentaires »Ainsi titrait le Figaro vendredi dernier p.25, une page entière sur le sujet, assortie d’une colonne à la une et d’un édito page 13 … Jamais un moteur de recherche n’avait ainsi ‘fait la une’ de ce quotidien plus que respectable. Les temps changent ![]()
En France, on a toujours peur … d’Internet, des nouvelles technologies, des grosses machines américaines … du changement surtout ! à croire que le ciel va nous tomber sur la tête à chaque fois.
Google met simplement un pavé dans la mare des bibliothèques qui ne vont pas assez vite au goût des internautes dans leurs processus de digitalisation de leurs ressources documentaires et de mise à la disposition du plus grand nombre de celles-ci. C’est un fait.
Mais il ne faut pas se tromper de combat, et celui qu’il conviendrait de mener ‘contre’ Google ne doit pas être dicté par la peur … mais plutôt par l’opportunité de discuter (enfin) avec cette société de la façon dont ils comptent organiser et structurer cette information … si éloignée des pages web et des liens hypertextes
Voilà un terrain sur lequel Google risque d’être beaucoup moins à l’aise (reste encore à définir laquelle des dernières acquisitions technologiques de Google sera mise en avant pour réaliser ce(s) projet(s) titanesque(s)).
Effectivement, autant les algorihtmes originaux de Google ‘collent’ parfaitement aux besoins du web, autant leur incursion sur le marché de la recherche d’information en entreprise n’a pas été concluante. Tout simplement car leur approche ne correspondait pas à la structuration ‘classique’ des documents.
Scanner l’ensemble des volumes de bibliothèques, rendre leur contenu accessible à travers une recherche plein texte, rajouter qq mots clefs de définition, l’auteur, le titre, la date de parution, le nombre de volumes édités … OK, c’est réalisable.
Maintenant, expliquer les traitements qui seront rendus possibles par cette opération revient à répondre aux questions suivantes :
Comment allez-vous indexer ce fond documentaire ?
A quel niveau de détail d’accès aux contenus aurons nous le droit ? volume, paragraphe, phrases ???
Quels types de recherches seront proposés ?
Quelles informations connexes seront proposées ?
Quelle politique d’historisation des requêtes ?
Quelles seront les possibilités d’interfaçage de ces contenus avec d’autres applications ?
Si Google répond de manière satisfaisante à ces questions, leur démarche sera bonne, si les fonctionnalités de traitement et de recherche dans ce fond ne sont pas au rendez vous, alors ce sera un coup dans l’eau et beaucoup d’argent de dépensé pour … au final, pas grand chose !
Aussi, ma question serait : quel est le sens d’une indexation de ce niveau sans l’éventail complet des outils de traitement les plus sophistiqués existant aujourd’hui ?
Je ne crois pas que Google ai la ‘bonne réponse’, par contre, la BNF et d’autres entités l’ont, et, je l’espère, pourront faire peser de tout leur poids pour obtenir des acteurs économiques qui vont s’intéresser au sujet de ‘bien’ traiter leurs fonds documentaires.