Les séparateurs se définissent par différence entre leur version physique et leur version logique. Il suffit de rechercher dans la version physique le texte d'un champ pour le localiser. Une fois que tous les champs sont localisés, il ne reste que les séparateurs des champs.
Il est plus facile, pour cette opération, de ne disposer que des informations textuelles (caractères) et typographiques (essentiellement les noms des polices de caractères utilisées). Pour ce faire, on utilise un interpréteur PostScript dont on convertit la sortie en SGML.
La figure 2.6 donne le résultat de la conversion de la version PostScript de la référence en style plain de la figure 2.2.
<Times-Roman>S. H. Joseph and T. P. Pridmore. Knowledge-directed interpretation of mechanical engineering drawings. </Times-Roman><Times-Italic>IEEE Transactions on PAMI</Times-Italic><Times-Roman>, 14(9):211--222, September 1992.</Times-Roman> |
Le tableau 2.1 contient les séparateurs extraits de la version physique en se référant à sa version logique, joseph92a, visible à la figure 2.1 (les espaces sont remplacés par « _ » pour être plus visibles). C'est parce que les séparateurs entre deux champs sont toujours les mêmes lorsqu'ils sont générés par BIBTEX qu'il est possible d'envisager un algorithme de reconnaissance par propagation de contraintes. De plus, les séparateurs indiquent aussi l'ordre des champs.
Gauche | Droite | Séparateur |
author | <Times-Roman> | |
author | title | ._ |
title | journal | ._</Times-Roman><Times-Italic> |
journal | volume | </Times-Italic><Times-Roman>,_ |
volume | number | ( |
number | pages | ): |
pages | month | ,_ |
month | year | _ |
year | .</Times-Roman>< |