next up previous contents
Next: Influence et co-occurrence Up: Reconnaissance des références bibliographiques Previous: Reconnaissance des références bibliographiques

Construction du Réseau de Concepts

  

Le Réseau de Concepts doit contenir un savoir sur la logique des références contenues dans la base, mais aussi sur la représentation physique de ces références. Ce modèle peut se découper selon la généricité de ses noeuds ou selon leur aspect logique ou physique.

Du point de vue généricité, le modèle contient deux grandes parties : la partie générique et la partie spécifique (contenant les termes correspondant à la base de références). La figure 4.1 montre ces deux parties et leurs liens. La partie générique contient la hiérarchie des champs et les séparateurs existant entre eux. La partie spécifique ne contient donc que des informations logiques [Parmentier et Belaïd1995], puisque les informations physiques sont censées être génériques (pour une référence d'un même type, les séparateurs de champs seront les mêmes).

Du point de vue physique / logique, la partition du modèle est représentée sur la figure 4.1 par l'aspect des noeuds du Réseau de Concepts: les noeuds au bord arrondi sont les noeuds physiques, ce sont les séparateurs ; les noeuds rectangulaires sont logiques, c'est-à-dire qu'ils appartiennent à la base.


  
Figure: Structure du Réseau de Concepts pour les références.
Structure du Réseau de Concepts pour les références.

 La construction automatique du Réseau de Concepts implique l'utilisation d'une base de connaissance et d'outils de conversion que nous allons décrire. La base de références bibliographiques au format BIBTEX est, pour des raisons de facilité de manipulation, convertie en sgml, grâce aux outils de la dilib (cf. Annexe C) .

La figure 4.2 montre le format que peut avoir une référence bibliographique de la base. La première étape est sa transformation, par un outil de la dilib, en sgml. La figure 4.3 donne le résultat de cette transformation.


  
Figure: Exemple de référence en BIBTEX, de type article.
@ARTICLE{joseph92a,
  AUTHOR = {S. H. Joseph and T. P. Pridmore},
  TITLE = {Knowledge-Directed Interpretation of Mechanical
           Engineering Drawings},
  JOURNAL = {IEEE Transactions on PAMI},
  YEAR = {1992},
  NUMBER = {9},
  VOLUME = {14},
  PAGES = {211--222},
  MONTH = {September},
  KEYWORDS = {segmentation, forms},
  ABSTRACT = {The approach is based on item extraction}
}


  
Figure: Référence BIBTEX transformée en sgml.
<doc>
     <ref>joseph92a</ref>
     <author><a>S. H. Joseph</a><a>T. P. Pridmore</a></author>
     <title><mot>Knowledge-Directed</mot><mot>Interpretation</mot><mot>of</mot>
            <mot>Mechanical</mot><mot>Engineering</mot><mot>Drawings</mot>
     </title>
     <journal>IEEE Transactions on PAMI</journal>
     <year>1992</year>
     <number>9</number>
     <volume>14</volume>
     <pages>211--222</pages>
     <month>September</month>
     <keywords><k>segmentation</k><k>forms</k></keywords>
</doc>

Un avantage de l'utilisation d'une base BIBTEX est la facilité d'obtention de sa version physique, en passant par les outils LATEX et dvips. Nous avons écrit le programme faisant la « soustraction » physique-logique, qui extrait automatiquement les séparateurs. Cette manière de faire permet une grande souplesse dans les styles bibliographiques qu'on peut traiter : on n'est pas obligé de connaître toutes les règles d'impression selon les styles, un style inconnu se traite de la même manière qu'un autre.

C'est ce que montre la figure 4.4 : il suffit de disposer de l'outil traduisant les références logiques en PostScript et des outils de traduction du format logique de départ vers le format sgml utilisé pour pouvoir générer un Réseau de Concepts adapté à la reconnaissance de références utilisant le même style bibliographique, le tout dans le format de la base de départ.


  
Figure: Construction du Réseau de Concepts pour les références.
Construction du Réseau de Concepts pour les références.



 
next up previous contents
Next: Influence et co-occurrence Up: Reconnaissance des références bibliographiques Previous: Reconnaissance des références bibliographiques
Francois Parmentier
6/19/1998