next up previous contents
Next: Conclusion Up: Analyse de références bibliographiques Previous: Reconnaissance

Comparaison notices - références

  Depuis 1976, les notices respectent des règles fixes (ISBD), alors que les références sont écrites par des non-professionnels, ce qui implique un foisonnement de « règles », même dans le cas, assez improbable, où un auteur suivrait les mêmes règles tout au long de sa carrière. En conséquence, un système général de reconnaissance de références bibliographiques ne peut se baser sur une grammaire, il lui faut plus de souplesse.

Les notices sont physiquement organisées en zones rectangulaires alors que les zones des références ne sont pas d'ordre physique. Elle suivent tout-de-même l'ordre logique de lecture, mais s'étendent sur plusieurs lignes physiques. Cela rend très difficile le découpage a priori des références en zones, alors qu'un algorithme de segmentation classique suffit à découper les zones des notices. La localisation de ces zones dans les références doit s'appuyer sur la compréhension de leur contenu plus que sur leur apparence. Elle peut aussi s'aider d'exemples contenus dans une base, en fonctionnant par analogie avec des références « proches ».



François Parmentier
6/19/1998