Semantic similarity between controled vocabularies. Evaluation of alignment quality on in vitro diagnostic standard data - Archive ouverte HAL Access content directly
Journal Articles Ingéniérie des Systèmes d'Information Year : 2016

Semantic similarity between controled vocabularies. Evaluation of alignment quality on in vitro diagnostic standard data

Interopérabilité sémantique entre vocabulaires contrôlés. évaluation de la qualité des alignements sur des données de standards du diagnostic in vitro

(1, 2, 3) , (1, 2) , (3)
1
2
3

Abstract

Medical data numerization raises syntactic but also semantic interoperability challenges between information systems and knowledge organisation systems. Knowledge integration was largely studied into general purposes as in specific domain such as clinical and biology. As in vitro diagnostics is transdisciplinary domain it should answer to the same knowledge integration issues, which are encountered in clinical and biological field, using tools adapted to its multidisciplinary knowledge. In this article we propose a literature review about knowledge integration and linked data state of art with a specific focused on IVD data. We present an evaluation of concepts alignment extracted from two standards used in DIV and available on line. Methods we propose are based on three lexical semantic similarity measures and one heuristic algorithm. Results we obtained illustrates that lexical measures are not enough efficient to be used into laboratory domain. However, alignments obtained with the heuristic approach and filtered with a semantic dimension comply with our performance criteria. This strategy is under improvement process by the integration of semantic similarity and the refinement of lexical parameter into the heuristic approach.
L’informatisation des données de santé doit relever le défi de l’interopérabilité syntaxique, mais surtout sémantique, entre les systèmes d’information ainsi que et les systèmes d’organisation des connaissances (SOC) sur lesquels ils reposent. L’intégration des connaissances entre SOC est une problématique largement étudiée notamment dans des domaines de la biologie ou la santé. Le diagnostic in vitro (DIV) à l’interface de la médecine et de la biologie, doit répondre aux mêmes problématiques d’interopérabilité avec des outils adaptés à la nature multi et transdisciplinaire de ses données. Dans cet article, nous proposons une revue de littérature des algorithmes existants pour le liage des données. À partir de cette revue nous proposons une évaluation d’alignement de concepts issus du DIV présents dans les SOC de référence disponibles en ligne. Les méthodes que nous proposons reposent sur trois mesures de similarité syntaxique et un algorithme heuristique. Les résultats que nous obtenons dans cette étude montrent que les métriques de similarité syntaxique ne se révèlent pas suffisamment probantes pour se voir appliquer de manière systématique au domaine des tests de laboratoire. En revanche, la qualité des alignements obtenus via l’algorithme heuristique, filtré a posteriori en fonction d’une dimension sémantique, permet de conforter les critères de performance que nous avions établis. Cet algorithme est notre piste privilégiée pour obtenir des alignements de qualité dans le domaine du DIV. Une seconde version de cet algorithme, en cours de développement, intègre l’ensemble des métriques syntaxiques et sémantiques étudiées dans l’article.
Not file

Dates and versions

hal-02100413 , version 1 (15-04-2019)

Identifiers

Cite

Mary Mélissa, Lina F. Soualmia, Gansel Xavier. Interopérabilité sémantique entre vocabulaires contrôlés. évaluation de la qualité des alignements sur des données de standards du diagnostic in vitro. Ingéniérie des Systèmes d'Information, 2016, 21 (5-6), pp.55-83. ⟨10.3166/isi.21.5-6.55-83⟩. ⟨hal-02100413⟩
43 View
0 Download

Altmetric

Share

Gmail Facebook Twitter LinkedIn More