next up previous contents
Next: Description des agents Up: Construction du Réseau de Previous: Construction de la partie

Conclusion

 

Nous avons développé un système qui construit automatiquement un Réseau de Concepts à partir d'une base de données en BIBTEX et d'un style bibliographique. Du point de vue logique, le Réseau de Concepts est séparé en deux parties : la partie générique, contenant la hiérarchie des champs, et la partie spécifique qui contient les liens entre les instances des feuilles de la hiérarchie des champs. L'aspect physique du réseau est concentré dans sa partie générique car il est censé être général pour un style bibliographique : il consiste uniquement en des noeuds « séparateurs » liant deux champs de même niveau dans la hiérarchie et contenus par des noeuds hiérarchiquement supérieurs. Aucun noeud de la partie spécifique ne renseigne sur l'aspect physique d'une référence (du moins sur sa typographie, ou sa ponctuation).

Comme le calcul des attributs des noeuds et surtout des liens de co-occurrence entre les noeuds spécifiques dépend uniquement de comptages d'occurrences et de co-occurrence, on peut envisager de construire un système qui « apprend » au fur et à mesure de ses découvertes. C'est-à-dire qu'il pourrait intégrer une référence reconnue (éventuellement validée par un opérateur humain) au réseau de concepts, simplement en incrémentant des compteurs situés dans les liens (compteurs de co-occurrence) et dans les noeuds (compteurs d'occurrence). Nonobstant le fait qu'il faudrait plutôt retenir les compteurs dans le Réseau de Conceptsque les pondérations, cela soulève quelques problèmes : qui nous dit que la référence en question n'a pas déjà été intégrée au Réseau de Concepts? Cette référence existe peut-être déjà dans le Réseau de Concepts sous une forme légèrement différente ? Dans ce cas, il vaut mieux ne pas fausser les statistiques en ajoutant des co-occurrences qui y sont déjà. C'est un problème complexe d'unicité des données dans une base, de distance entre deux enregistrements... Heureusement, dès que le nombre de références est suffisant, l'importance relative de l'ajout de doublons diminue. En effet, tous les poids susceptibles d'être modifié sont locaux, c'est-à-dire qu'ils dépendent du nombre d'occurrences des noeuds dont ils partent. On peut donc affirmer que l'ajout de doublons dans le Réseau de Concepts est négligeable dès que le nombre de références connues est déjà important.


next up previous contents
Next: Description des agents Up: Construction du Réseau de Previous: Construction de la partie
Francois Parmentier
6/19/1998