next up previous contents
Next: Contraintes locales Up: Construction du modèle Previous: Description

Extraction des séparateurs

 Pour disposer de tous les cas de figures parmi les choix de champs optionnels, une base fictive a été générée automatiquement. Dans cette base, les contenus des champs sont les noms des champs (cf. figure 2.8). Elle a servi de base à la construction du modèle. 


  
Figure 2.8 : Une référence de la base fictive.
@InProceedings{ordre1,
author       = "AUTHOR",
title        = "TITLE",
editor       = "EDITOR",
booktitle    = "BOOKTITLE",
volume       = "VOLUME",
number       = "NUMBER",
series       = "SERIES",
pages        = "PAGES",
address      = "ADDRESS",
month        = "MONTH",
year         = "YEAR",
organization = "ORGANIZATION",
publisher    = "PUBLISHER",
note         = "NOTE"
}

Chaque référence est ensuite formatée (en passant par BIBTEX/ LATEX) en PostScript, puis convertie en SGML, donnant pour l'exemple de la figure 2.8 le contenu de la figure 2.9.


  
Figure 2.9 : Version physique en SGML de la référence fictive de la figure 2.8.
<Times-Roman>AUTHOR. Title. In </Times-Roman><Times-Italic>BOOKTITLE</Times-Ita-
lic><Times-Roman>, volume VOLUME of </Times-Roman><Times-Italic>SERIES</Times-
Italic><Times-Roman>, pages PA-GES, ADDRESS, MONTH YEAR. ORGANIZATION,
PUBLISHER, NOTE.</Times-Roman>

Ensuite, il suffit de retrouver les contenus des champs (remarque : le contenu du champ title a été modifié) pour les localiser, puis de déduire les séparateurs.

À partir des séparateurs de toutes les références de la base fictive, on obtient un graphe dont celui de la figure 2.7 est un extrait (ce graphe est simplifié : on n'y a pas fait figurer les changements de polices de caractères, il ne prend pas certains champs en compte).

On peut remarquer que le séparateur précédant le champ pages varie en fonction de l'apparition du tiret. Si pages contient « 100--102 », le séparateur contiendra le mot pages, au pluriel, alors que si l'on ne met qu'une page, il sera au singulier. De plus, l'ordre des champs varie en fonction des champs qui se trouvent dans la référence. Par exemple, le séparateur gauche du champ number varie en fonction du champ le précédant : il peut être ,_n. quand il est précédé du champ volume, mais aussi ._Number (avec un point et une majuscule) derrière le champ title, alors que d'habitude, c'est ,_number, avec ou sans le passage de l'italique au roman (cela dépend si le champ précédent est en italique ou non).


next up previous contents
Next: Contraintes locales Up: Construction du modèle Previous: Description
François Parmentier
6/19/1998