Lors de la conversion d'une référence bibliographique, quand on veut
repérer les champs dans une « image » contenant des informations
textuelles et typographiques, un certain nombre de difficultés
entravent le traitement. La plus banale est sans doute le fait qu'un
même séparateur physique peut séparer divers champs (deux
mots, un month et une year...).
La plus importante des autres difficultés, et accessoirement la plus
difficile à éradiquer, est la correction de la base servant à
constituer le modèle. Ensuite viennent des difficultés inhérentes à
l'aspect automatique du traitement : la présence d'abréviations dans
les champs, et la présence simultanée de termes dans plusieurs champs
différents.