REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés - CentraleSupélec Accéder directement au contenu
Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Année : 2014

REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés

Résumé

Many annotation tools have been proposed for the automatic annotation of documents but the annotation of semantic relations between concept instances remains a challenging task when structures and vocabularies are heterogeneous. We propose an approach, called REISA, which allows to enrich knowledge bases with property instances using semistructured documents annotated with concept instances. The approach relies on a neighborhood distance between annotated domain entities in the document and perform a semantic control of the extracted facts using axioms and facts of the knowledge bases. The experiments show that REISA allows to extract property instances with interesting precision values reaching 76.5%.
Les sources de données RDF mises à disposition sur le web sont de plus en plus nombreuses. Cependant, ces sources contiennent relativement peu d’information en comparaison du volume des informations décrites dans le web visible. De nombreux outils ont pour objectif d’annoter sémantiquement les documents mais l’annotation d’instances de propriétés reste une tâche difficile quand leurs structures et leurs vocabulaires sont hétérogènes. Nous proposons une approche appelée REISA qui exploite un ensemble de documents annotés par des instances de concepts pour enrichir des bases de connaissances par des instances de propriétés. L’approche se base sur la proximité structurelle des annotations d’instances de concepts et contrôle la cohérence des faits extraits en se basant sur les axiomes des ontologies, et sur les faits déjà présents dans les bases de connaissances. Les expérimentations menées sur deux ensembles de documents HTML montrent que la précision peut atteindre 76,5%.
Fichier non déposé

Dates et versions

hal-01061253 , version 1 (05-09-2014)

Identifiants

Citer

Nacéra Bennacer Seghouani, Nathalie Pernelle, Yassine Mrabet. REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2014, 28 (2-3), ⟨10.3166/ria.28.297-320⟩. ⟨hal-01061253⟩
89 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More