A Multistream Model for Continuous Recognition of Lexical Units in French Sign Language

Sign languages are the primary means of communication for deaf people, yet they remain poorly endowed from a natural language processing perspective, thus linguistic tools (translators, concordancers) dedicated to them are rare. In this paper, starting from a corpus limited size, we propose a very first learning model for the recognition of lexical signs in French Sign Language (LSF). Signers are represented by sequences of 3D pose, which are decoded into sign sequences thanks to a bidirectionnal recurrent neural network trained with a CTC loss (Connectionist Temporal Classification). Different strategies for combining the different articulators of LSF within the neural decoder (single vs. multistream architecture), as well as the contribution of main articulators to the overall performance of the system, are investigated.

Les langues des signes constituent le premier moyen de communication des personnes sourdes, pourtant elles restent peu dotées du point de vue du traitement automatique des langues, et les outils linguistiques (traducteurs, concordanciers) qui leur sont dédiés sont rares. Dans ce papier, partant d'un corpus de dialogues en LSF de taille limitée, nous proposons un tout premier modèle d'apprentissage pour la reconnaissance de signes lexicaux en Langue des Signes Française (LSF). Les signeurs sont représentés par leur pose 3D, qui est fournie à un réseau de neurone récurrent bi-directionnel, entrainé à l'aide de l'approche CTC (Connectionist Temporal Classification). L'apport des principaux articulateurs est évalué dans la reconnaissance de la LSF et des approches mono et multiflux (un modèle par articulateur) sont comparées.

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV] Informatique et langage [cs.CL] Traitement du signal et de l'image [eess.SP]

Fichier principal

ouakrim_etal_gretsi2023_ctc.pdf (7.18 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Yanis OUAKRIM : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04141925

Soumis le : lundi 26 juin 2023-15:07:06

Dernière modification le : jeudi 4 avril 2024-21:07:51

Archivage à long terme le : mercredi 27 septembre 2023-20:25:28

Dates et versions

hal-04141925 , version 1 (26-06-2023)

Identifiants

HAL Id : hal-04141925 , version 1

Citer

Yanis Ouakrim, Denis Beautemps, Michèle Gouiffès, Thomas Hueber, Frédéric Berthommier, et al.. A Multistream Model for Continuous Recognition of Lexical Units in French Sign Language. GRETSI 2023 - XXIXème Colloque Francophone de Traitement du Signal et des Images, GRETSI - Groupe de Recherche en Traitement du Signal et des Images, Aug 2023, Grenoble, France. ⟨hal-04141925⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS INRIA GIPSA GIPSA-PCMD LIMSI GIPSA-CRISSP CENTRALESUPELEC UNIV-PARIS-SACLAY GIPSA-PPC LISN GS-COMPUTER-SCIENCE LISN-AMI

361 Consultations

24 Téléchargements