Récupération d’informations scientifiques

La recherche d’informations scientifiques vise généralement à couvrir l’ensemble du problème de la récupération à partir des connaissances scientifiques et techniques enregistrées, des éléments d’information particuliers qui peuvent être nécessaires à des fins particulières à des moments particuliers. Dans ce contexte, il comprend généralement un large éventail de techniques et de dispositifs utilisés pour collecter, indexer, stocker, récupérer et diffuser des informations spécialisées résultant de la recherche et du développement scientifiques. Les informations scientifiques peuvent être basées sur du texte ou du multimédia (par exemple, du son, de la vidéo ou des images combinées avec du texte). Les systèmes de recherche d'informations scientifiques sont généralement automatisés par des ordinateurs et des réseaux informatiques.

Vannevar Bush est un pionnier dans le développement de systèmes de récupération automatisés. Dans son article fondateur, "As We May Think", publié dans le numéro de juillet 1945 du Atlantic mensuel, il a proposé le concept révolutionnaire d'un entrepôt de connaissances automatisé facilement accessible et configurable individuellement, qui fonctionnerait comme le cerveau humain. L'article de Bush a inspiré les générations suivantes de chercheurs en systèmes d'information, dont Ted Nelson et Doug Engelbart. À la fin des années 1950, Nelson a recherché des méthodes permettant aux ordinateurs de manipuler le texte. Cette recherche a été baptisée «Xanadu», et dans un article de 1965 sur Xanadu, il a inventé le terme «hyper-texte», une méthode qui permet aux utilisateurs d'ordinateurs de récupérer des informations contenues dans des documents texte séparés. Aujourd'hui, presque tous les documents trouvés sur le World Wide Web sont des hypertextes. La contribution d'Engelbart au domaine de la recherche d'informations a été le système oN-Line (NLS), qu'il a développé dans les années 1960 à l'Université de Stanford. NLS a été le premier système informatique à utiliser une souris. Engelbart a inventé la souris pour que les utilisateurs puissent pointer et cliquer sur des liens hypertextes affichés sur l'écran de l'ordinateur du système. Des années 1960 aux années 1990, les ordinateurs ne pouvaient stocker et récupérer des informations que sur des sites de recherche individuels. Les scientifiques avaient une capacité limitée d'accéder aux informations nécessaires stockées sur un autre ordinateur dans une installation différente ou à partir d'un autre dans un emplacement distinct dans la même installation. Le dépassement des limites de la capacité des scientifiques à accéder à toutes les informations pertinentes stockées sur des systèmes informatisés a conduit Tim Berners-Lee à inventer le World Wide Web. Au début des années 1980, Berners-Lee a été engagé comme consultant en informatique par le centre de recherche scientifique suisse Organisation européenne pour la recherche nucléaire (CERN). Pour aider les chercheurs à accéder à la vaste réserve d'informations du centre, il a d'abord inventé le système Inquire, qui utilisait l'hypertexte et pouvait accéder aux documents stockés dans tous les différents systèmes d'information du CERN.

Berners-Lee souhaitait élargir la portée des capacités d'Enquire afin qu'il puisse récupérer des informations stockées dans d'autres installations de recherche. Il était conscient de l'existence d'Internet et de la manière dont il permettait aux universités du monde entier d'échanger des informations de manière limitée par le biais de transferts de fichiers texte et de courrier électronique. En adaptant le système Inquire pour une utilisation sur Internet, Berners-Lee a inventé le World Wide Web, qui a révolutionné plus que le domaine de la recherche d'informations scientifiques.

Le World Wide Web utilise l'hypertexte, les hyperliens et le protocole de transfert hypertexte (HTTP) pour récupérer des informations, et des localisateurs d'enregistrements universels (URL) pour identifier de manière unique des éléments d'information. Ses capacités de recherche sont améliorées par les moteurs de recherche qui utilisent des mots clés et des index pour stocker, identifier et récupérer des informations.

Le World Wide Web est très efficace pour fournir de grandes quantités d'informations à ses utilisateurs. Cependant, il n'est pas aussi efficace pour récupérer les informations spécifiques demandées par les utilisateurs. Au début des années 2000, Berners-Lee et d'autres chercheurs du World Wide Web Consortium, dont le siège est au Massachusetts Institute of Technology, tentaient de résoudre ce problème en développant le Web sémantique, qui est une version améliorée du World Wide Web. Dans le Web sémantique, un utilisateur soumet une demande d'informations à un programme de recherche appelé agent intelligent. Les documents du Web sémantique donnent aux informations qu'ils contiennent une signification bien définie à partir de laquelle l'agent intelligent a la capacité de déterminer la pertinence des informations par rapport à la demande de l'utilisateur. Ainsi, le Web sémantique serait plus efficace pour récupérer le type spécifique d'informations dont un utilisateur peut avoir besoin.

Bibliographie

Berners-Lee, Tim et Mark Fischetti. Tisser le Web: la conception originale et le destin ultime du World Wide Web par son inventeur. San Francisco: Harper San Francisco, 1999.

Maybury, Mark T., éd. Récupération intelligente d'informations multimédias. Cambridge, Massachusetts: MIT Press, 1997.

Sparck-Jones, Karen et Peter Willets, éds. Lectures dans la recherche d'informations. San Francisco: Morgan-Kaufman, 1997.

JohnWyzalek