Le système du Réseau de Concepts et de sa construction à partir de co-occurrences
pourrait être réutilisé dans le cadre d'un système d'acquisition de
connaissances à partir de données textuelles. Moyennant l'utilisation
d'outils linguistiques, il devrait être assez facile de construire un
réseau contenant des mots étiquetés grammaticalement, et des liens
entre ces mots. Il faudrait alors décider dans quelle mesure on compte
les co-occurrences entre mots : entre les mots d'un document, d'une
section, d'un paragraphe, d'une même phrase, d'une même proposition,
entre les mots éloignés de moins de deux mots ? Peut-être pour toutes
ces portées à la fois, mais en appliquant une pondération selon
l'étendue (par exemple, pondération 1 pour le même document, 10 pour
la même section, 100 pour le même paragraphe, 1000 pour la phrase,
2000 pour la proposition et 5000 pour les mots proches).
Ce Réseau de Concepts pourrait être aussi utilisé pour comprendre des données en
langage naturel : en activant les mots employés, puis en propageant
ces activations, on activerait en priorité les concepts correspondant
aux données, ce qui contribue à une désambiguïsation (dans la mesure
de l'étendue des connaissances contenues dans le Réseau de Concepts). L'inconvénient
majeur de ce modèle reste son occupation mémoire, contrepartie de
l'exhaustivité de ses connaissances (en l'état, il conserve une trace
de tout ce qu'on lui soumet). Cette perspective est passionnante et
reste en grande partie inexplorée.