Toutes ces difficultés ne jouent pas en faveur d'une analyse syntaxique classique nécessitant une terminologie claire, finie et des règles de production stables. Les éléments à traiter sont imprécis, incomplets, extrêmement variables et ambigus. Pour toutes ces raisons, nous avons opté pour un système de raisonnement capable de gérer l'incertain. Contrairement aux analyses syntaxiques où les choix sont déterministes, le système ne cherche pas la solution idéale parmi un lot de possibilités existantes (déterminisme), mais propose une solution cohérente émergeant à partir de plusieurs solutions « proches ». Ces solutions proches sont stockées dans un modèle dynamique et mises au jour par analogie avec le problème posé.
Ce système est adapté aux traitement des références bibliographiques, car il permet de traiter des problèmes somme toute similaires mais assez différents dans la forme. Il permet à la fois de traiter les séparateurs et de se détacher de cette partie physique en considérant le sens de chaque champ.
Nous présentons tout d'abord le système et son application première : l'analogie entre chaînes de caractères (COPYCAT). Puis nous définissons l'architecture telle que nous l'avons utilisée sur les références bibliographiques, mais seulement au niveau général (elle peut être appliquée à bien d'autres domaines).