Next: Copycat Up: Architecture émergente Previous: Architecture émergente

Justification

Les systèmes que nous avons étudiés, aussi bien pour les notices que pour les références, nous ont permis de constater que le problème reste malgré tout difficile à traiter par des méthodes classiques (de type syntaxique). En effet, ces difficultés sont de plusieurs ordres :

caractérisation des champs : la syntaxe n'est pas fixe, il n'y a pas de structure verbale, le texte comporte beaucoup d'abréviations et un mélange de langues. Enfin, il est difficile de trouver à la fois des termes et des attributs pour qualifier le contenu ;
séparateurs : ils sont variables, non uniques et il n'existe pas de norme pour les représenter ;
champs optionnels : il n'y a aucune indication sur la présence ou l'absence des champs.

Toutes ces difficultés ne jouent pas en faveur d'une analyse syntaxique classique nécessitant une terminologie claire, finie et des règles de production stables. Les éléments à traiter sont imprécis, incomplets, extrêmement variables et ambigus. Pour toutes ces raisons, nous avons opté pour un système de raisonnement capable de gérer l'incertain. Contrairement aux analyses syntaxiques où les choix sont déterministes, le système ne cherche pas la solution idéale parmi un lot de possibilités existantes (déterminisme), mais propose une solution cohérente émergeant à partir de plusieurs solutions « proches ». Ces solutions proches sont stockées dans un modèle dynamique et mises au jour par analogie avec le problème posé.

Ce système est adapté aux traitement des références bibliographiques, car il permet de traiter des problèmes somme toute similaires mais assez différents dans la forme. Il permet à la fois de traiter les séparateurs et de se détacher de cette partie physique en considérant le sens de chaque champ.

Nous présentons tout d'abord le système et son application première : l'analogie entre chaînes de caractères (COPYCAT). Puis nous définissons l'architecture telle que nous l'avons utilisée sur les références bibliographiques, mais seulement au niveau général (elle peut être appliquée à bien d'autres domaines).

Next: Copycat Up: Architecture émergente Previous: Architecture émergente

François Parmentier
6/19/1998