REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés - Archive ouverte HAL Access content directly
Journal Articles Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Year : 2014

REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés

Abstract

Many annotation tools have been proposed for the automatic annotation of documents but the annotation of semantic relations between concept instances remains a challenging task when structures and vocabularies are heterogeneous. We propose an approach, called REISA, which allows to enrich knowledge bases with property instances using semistructured documents annotated with concept instances. The approach relies on a neighborhood distance between annotated domain entities in the document and perform a semantic control of the extracted facts using axioms and facts of the knowledge bases. The experiments show that REISA allows to extract property instances with interesting precision values reaching 76.5%.
Les sources de données RDF mises à disposition sur le web sont de plus en plus nombreuses. Cependant, ces sources contiennent relativement peu d’information en comparaison du volume des informations décrites dans le web visible. De nombreux outils ont pour objectif d’annoter sémantiquement les documents mais l’annotation d’instances de propriétés reste une tâche difficile quand leurs structures et leurs vocabulaires sont hétérogènes. Nous proposons une approche appelée REISA qui exploite un ensemble de documents annotés par des instances de concepts pour enrichir des bases de connaissances par des instances de propriétés. L’approche se base sur la proximité structurelle des annotations d’instances de concepts et contrôle la cohérence des faits extraits en se basant sur les axiomes des ontologies, et sur les faits déjà présents dans les bases de connaissances. Les expérimentations menées sur deux ensembles de documents HTML montrent que la précision peut atteindre 76,5%.
Not file

Dates and versions

hal-01061253 , version 1 (05-09-2014)

Identifiers

Cite

Nacéra Bennacer Seghouani, Nathalie Pernelle, Yassine Mrabet. REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2014, 28 (2-3), ⟨10.3166/ria.28.297-320⟩. ⟨hal-01061253⟩
80 View
0 Download

Altmetric

Share

Gmail Facebook Twitter LinkedIn More