next up previous contents
Next: Exemple de recherche de Up: Recherche d'information Previous: Recherche d'information

Principe : le Réseau de Concepts

  Le Réseau de Concepts construit pour l'application de reconnaissance de références bibliographiques (cf. page [*]) utilise des connaissances génériques, qu'elles soient logiques (noms et hiérarchie des champs) ou physiques (texte inter-champs, changements de police de caractères), et des connaissances spécifiques, extraites d'une base de références. Parmi les connaissances spécifiques se trouvent les clés des références dans la base, liées aux termes qu'on trouve dans les références.

C'est cette partie spécifique que nous utilisons « à l'envers » : jusqu'ici, elle servait à reconnaître de façon plus sûre des instances de champs, et à chercher des termes qui seraient conceptuellement proches des termes déjà reconnus. C'est cette proximité conceptuelle entre termes que nous exploitons ici. Il faut savoir que nous avons conservé le champ clé de la référence dans le Réseau de Concepts. C'est un identifiant de référence, il n'apparaît donc qu'une fois dans la base. Après avoir activé un noeud correspondant à un terme d'une référence, le noeud clé de la référence sera tôt ou tard, par le jeu des propagations d'activation, activé. Plus important : il sera activé relativement rapidement. En tout cas, plus rapidement que les autres noeuds-clés. Et c'est là le principe fondateur de cette application : retrouver les clés des références correspondant le plus à des termes qui semblent intéressants.


  
Figure: Exemple de référence en BIBTEX.
@ARTICLE{schurmann92a,
        AUTHOR             = {J. Schürmann and N. Bartneck and T. Bayer and
                              J. Franke and E. Mandler and M. Oberlander},
        JOURNAL            = {Proceedings of the IEEE},
        VOLUME             = {80},
        NUMBER             = {7},
        MONTH              = {July},
        PAGES              = {1101--1119},
        TITLE              = {{Document Analysis - From Pixels to Contents}},
        KEYWORDS           = {document, analyse, image, contenu},
        YEAR               = {1992}
}
	   

Les termes correspondant à la référence de la figure 5.1 sont par exemple ici, les auteurs (J. Schürmann, N. Bartneck, T. Bayer, J. Franke, E. Mandler, et M. Oberlander), les mots du nom du journal (Proceedings, of, et IEEE), le volume, le numéro (7), le mois, les pages, les mots du titres, les mots-clés, l'année, et la clé (schurmann92a) qui est censée être unique dans la base servant à la construction du Réseau de Concepts.

Tous ces termes se retrouvent dans le Réseau de Concepts, et ils sont liés par un lien de co-occurrence dans la même référence. L'influence d'un terme sur l'autre dépend du nombre de co-occurrences de chacun des termes dans les références de la base (pour plus de détails, voir 4.1).

Si l'on active un terme, les termes activés après la propagation de cette activation sont ceux qui occurrent le plus souvent dans les mêmes références. Donc, si on active un certain nombre de termes, on est susceptible d'activer aussi les clés de références d'un domaine proche. Cela bien sûr s'apparente à une recherche par mots-clés (en partant ici de n'importe quel terme...), mais on peut en obtenir plus. En effet, si on laisse l'activation se propager encore, on va activer des termes conceptuellement proches des termes recherchés, mais auxquels on n'a pas forcément pensé. Et si on continue, on va arriver à des thèmes proches, ce qui peut être utile si on veut trouver des articles dans lesquels on peut trouver des idées proches mais qu'on n'aurait pas forcément pensé à rapprocher (articles d'un domaine différent, par exemple).


next up previous contents
Next: Exemple de recherche de Up: Recherche d'information Previous: Recherche d'information
Francois Parmentier
6/19/1998