Présentation de la base de test

Pour éviter de tirer des conclusions sur un trop petit nombre d'exécutions du système, nous avons utilisé les références d'une base différente comportant 1117 références (BT). La plupart des champs de ces références ne sont pas contenus dans la base de construction du Réseau de Concepts(BRC). Certains auteurs, par exemple, y sont déjà contenus. Mais cette base est représentative des références que l'on aimerait reconnaître : d'un domaine proche de la base BRC, mais pas trop (BRC est du domaine de la reconnaissance de documents, alors que la base de test est du domaine de l'informatique en général), dans un style bibliographique proche (nous générons automatiquement les versions physiques des références), avec des opérateurs (les utilisateurs qui ont entré ces références dans la base) différents, ce qui fait que certains champs sont rarement fournis, alors que d'autres qui le sont, ne sont pas exploités par le système.

Table: Répartition des types de références dans la base BT.
Type Occurrence

inproceedings 513 46%

misc 288 26%

techreport 157 14%

article 105 9%

incollection 29 3%

book 18 2%

manual 5 0%

proceedings 2 0%

**Table:** Répartition des types de références dans la base BT.
Type	Occurrence
inproceedings	513	46%
misc	288	26%
techreport	157	14%
article	105	9%
incollection	29	3%
book	18	2%
manual	5	0%
proceedings	2	0%

Cette base contient toutes les publications des chercheurs de notre centre de recherche, et la répartition des types de références (cf. tableau 4.20) y est différente de celle de la base BRC (voir le tableau 4.1, page

). Malgré tout, les articles dans des actes de conférences (inproceedings) sont toujours les plus nombreux : 46% ici contre 43% dans la BRC. Le type misc est très représenté, cela reflète un manque d'information lors de la saisie des références (normalement, il existe un type adéquat à chaque référence, différent de misc). Les rapports techniques y sont les troisièmes, cela s'explique par la nature de la base (on a accès aux rapports locaux). article est beaucoup moins présent, cela tient au fait que la base BRC est une base de consultation (on s'en sert pour citer des travaux extérieurs, donc très visibles), alors que BT est une base de publication (on s'en sert pour stocker toutes les publications des chercheurs locaux). Sachant qu'il est plus courant de publier dans des conférences que dans des revues, cet équilibre inproceedings / article était prévisible.