next up previous contents
Next: Conclusion Up: Perspectives Previous: Extraction des références

Compréhension de la langue

  Le système du Réseau de Concepts et de sa construction à partir de co-occurrences pourrait être réutilisé dans le cadre d'un système d'acquisition de connaissances à partir de données textuelles. Moyennant l'utilisation d'outils linguistiques, il devrait être assez facile de construire un réseau contenant des mots étiquetés grammaticalement, et des liens entre ces mots. Il faudrait alors décider dans quelle mesure on compte les co-occurrences entre mots : entre les mots d'un document, d'une section, d'un paragraphe, d'une même phrase, d'une même proposition, entre les mots éloignés de moins de deux mots ? Peut-être pour toutes ces portées à la fois, mais en appliquant une pondération selon l'étendue (par exemple, pondération 1 pour le même document, 10 pour la même section, 100 pour le même paragraphe, 1000 pour la phrase, 2000 pour la proposition et 5000 pour les mots proches).

Ce Réseau de Concepts pourrait être aussi utilisé pour comprendre des données en langage naturel : en activant les mots employés, puis en propageant ces activations, on activerait en priorité les concepts correspondant aux données, ce qui contribue à une désambiguïsation (dans la mesure de l'étendue des connaissances contenues dans le Réseau de Concepts). L'inconvénient majeur de ce modèle reste son occupation mémoire, contrepartie de l'exhaustivité de ses connaissances (en l'état, il conserve une trace de tout ce qu'on lui soumet). Cette perspective est passionnante et reste en grande partie inexplorée.


next up previous contents
Next: Conclusion Up: Perspectives Previous: Extraction des références
Francois Parmentier
6/19/1998