D'abord, les bibliothèques constituent des lieux où l'accumulation du papier est la plus importante. La documentation est riche et très variée, nécessitant une organisation tout à fait adaptée.
Ensuite, les bibliothèques étant au service des lecteurs, doivent rendre accessible leur fonds documentaire, faciliter son abord et surtout permettre de l'enrichir et le faire évoluer. Des règles strictes doivent être données pour garantir une uniformité minimale dans l'évolution des stocks.
Enfin, une bibliothèque ne peut pas se suffire à elle-même et limiter ses lecteurs au fonds interne. Elle doit s'ouvrir sur l'extérieur pour compléter sa collection, si possible de manière transparente au lecteur.
Un système d'analyse de documents dans ce contexte doit tenir compte de tous ces facteurs.
Les systèmes d'analyse de documents effectuent une conversion d'un format à un autre : d'un format électronique vers un autre format électronique, ou bien d'un format papier vers un format électronique. Ils sont utilisés pour mieux exploiter des documents (les archiver, y accéder, les modifier, etc.). Les documents à analyser sont de divers types : les adresses sur les enveloppes, les télécopies, les plans architecturaux, les dessins techniques, les articles scientifiques, les formulaires, etc.
Nous nous sommes limités dans cette thèse à la reconnaissance des éléments bibliographiques. En nous appuyant sur une expérience européenne pour la rétroconversion de catalogues anciens, nous proposons une nouvelle architecture de système pour la reconnaissance de références bibliographiques.
La reconnaissance de la bibliographie est un sujet de recherche relativement intéressant du point de vue de l'analyse de documents et ceci pour deux raisons :
Nous allons commencer par parler du monde des bibliothèques et de leur catalogues, puis nous parlerons des éléments bibliographiques eux-mêmes avant de présenter les standards qui les définissent. Enfin, nous synthétiserons des travaux qui ont eu lieu sur la rétroconversion d'anciens catalogues de notices bibliographiques pour montrer les avantages et les inconvénients de ces systèmes.