next up previous contents
Next: Projet facit Up: Projet de la Bibliothèque Previous: Analyse structurelle

Résultats et discussion

Nous passerons sous silence les problèmes dus à l'OCR, ce n'est pas notre propos, mais il est tout-de-même intéressant de savoir que l'OCR produit 2 à 3 erreurs par notice (en moyenne). Un des principaux problèmes rencontrés lors de la réalisation de cette application, a été la modélisation de la structure des catalogues de la bibliothèque. En effet, même si la bibliothèque avait fourni les règles suivies pour la construction des catalogues, il a fallu tenir compte des non-dits que les documentalistes ont appliqué lors de la rédaction des catalogues. Le modèle   utilisé a donc évolué au fur et à mesure de son utilisation et de la rencontre de problèmes nouveaux. Ces règles étaient d'ailleurs prévues pour la rédaction d'un catalogue, non pour sa rétroconversion, et cela a nécessité une adaptation des deux populations (des bibliothécaires et des chercheurs) pour harmoniser leur dialogue.

Un prototype industriel, issu de ce système, a été mis au point par la société Jouve. Le modèle a été étendu à tous les catalogues de l'année 1973. Sur 4548 notices traitées, une intervention manuelle a été nécessaire pour 33% d'entre elles, soit pour lever des ambiguïtés, soit pour restructurer complètement la notice. 5,4% des notices ont dû être retournées à la bibliothèque, à cause de leur non conformité avec les spécifications fournies. Les principaux problèmes rencontrés tant sur le mois de test que sur l'année complète proviennent des « titres et mentions de responsabilité », de la « zone d'adresse » et de la « zone de collection ». Ces erreurs ne sont pas issues uniquement de la structuration, mais également des défaillances de l'OCR qui, malgré son renforcement par association de plusieurs systèmes parmi les plus performants du commerce, produit des erreurs sur la ponctuation, le parenthésage, les tirets et le style qui sont les indices de base pour la structuration automatique.


next up previous contents
Next: Projet facit Up: Projet de la Bibliothèque Previous: Analyse structurelle
François Parmentier
6/19/1998