Nous n'avons utilisé ici que des agents ayant des connaissances
génériques, c'est-à-dire adaptables directement à d'autres structures
physiques (pour peu que la représentation du problème dans le Blackboard
respecte le même format SGML).
Nous avons vu aussi que certains champs étaient souvent confondus avec
d'autres champs, et que des connaissances spécifiques suffiraient à
éliminer ces confusions. Nous n'avons pas utilisé de telles
connaissances car cela aurait éliminé aussi le caractère totalement
automatique de la construction du modèle : de telles connaissances
spécifiques ne sont pas, dans l'état actuel de nos propres
connaissances, extractibles automatiquement.
Ces connaissances, dans le cas des références bibliographiques, sont
pour les différents champs :
author : la grammaire de ce champ (assez complexe à
écrire) ;
editor : une grammaire similaire à celle des auteurs ;
volume : ce champ contient exclusivement des chiffres,
des lettres majuscules et des tirets ;
title : ce champ est une suite de mots séparés par des
espaces et parfois par des caractères de ponctuation (ce ne sera
jamais, par exemple, un seul « mot » ne contenant que des chiffres)
;
year : un nombre supérieur à 1900 (à de très rares
exceptions près, mais cela dépend du domaine), ou au moins un nombre
à quatre ou deux chiffres ;
pages : ce champ est composé de deux nombres croissants
séparés par un tiret, ou bien un seul nombre ;
organization, series : ces champs sont des listes de
mot souvent séparés par des espaces ou des virgules, des
parenthèses. Ils ne comportent en général pas de chiffres ;
booktitle : on peut utiliser, comme nous l'avons dit à
la page , les positions relatives entre les mots
de huit classes (association, pays, type, nature, adjectif,
intitulé, sigle et périodicité) ;