Directeur de thèse : Pascal PERRIER
Co-directeur de thèse : Maëva GARNIER
École doctorale : Ingénierie pour la santé, la cognition et l''environnement (EDISCE)
Spécialité : Sciences Cognitives, psychologie et Neurocognition
Structure de rattachement : CNRS
Établissement d'origine : INPG - ENSE3
Financement(s) : Contrat doctoral ; contrat à durée déterminée ; Sans financement
Date d'entrée en thèse : 01/10/2015
Date de soutenance : 24/06/2019
Composition du jury :
M. Yves LAPRIE
DR CNRS, LORIA Nancy, Rapporteur
Mme. Véronique DELVAUX
Chercheuse FNRS, Université de Mons (Belgique), Rapporteuse
M. Rafaël LABOISSIÈRE
CR CNRS, LPNC Grenoble, Examinateur et Président du Jury
M. Alain GHIO
IR CNRS, LPL Aix-en-Provence, Examinateur
M. Pierre BADIN
DR CNRS, GIPSA-lab Grenoble, Examinateur
M. Pascal PERRIER
Professeur Université Grenoble Alpes, Directeur de thèse
Mme. Maëva GARNIER
CR CNRS, GIPSA-lab Grenoble, Co-Directrice de thèse
Résumé :
L'étude de la production des consonnes occlusives (/p/, /b/, etc) a un intérêt
particulier pour la compréhension du contrôle moteur de la production de la parole. En
effet, la production de ces consonnes requiert une coordination fine des 3 niveaux de
production : respiration, vibration des cordes vocales, articulation.
L'objectif de mes travaux de thèse est d'étudier la coordination des gestes
respiratoires, laryngés et articulatoires permettant de contrôler la variation de certains
traits acoustiques des consonnes occlusives, plus spécifiquement les caractéristiques
acoustiques de leurs bruits de plosion (intensité, durée, spectre, cruciaux pour
l'intelligibilité des consonnes occlusives). Une partie importante de mes travaux de thèse
s'intéresse également au contrôle musculaire de cette coordination gestuelle.
Ces objectifs demandent un travail méthodologique préliminaire pour comparer,
développer et implémenter différentes techniques de mesure et d'estimation des efforts
articulatoires de production de parole, à différents points de vue, physiologiques et
mécaniques (cinématique du mouvement labial, capteurs de force, électromyographie
orofaciale). L'exploration de ces questions a donné lieu à l'acquisition d'une large base de
données (acoustiques et physiologiques) de production de consonnes occlusives du français
chez une vingtaine de locuteurs adultes sains, incluant 2 modes de phonation (modal et
chuchoté), 2 débits de parole (normal et rapide) et plusieurs niveaux d'effort articulatoire.
L'analyse de cette base de données a permis de confirmer certaines relations déjà établies
en parole conversationnelle entre l'intensité acoustique du bruit de plosion et le maximum
de Pression Intra-Orale (ou la vitesse d'ouverture des lèvres pour les consonnes labiales), et
entre les paramètres spectraux du bruit de plosion (skewness et kurtosis) et les paramètres
articulatoires de déplacement de la langue pour les consonnes alvéolaires et vélaires.
D'autres relations (non décrites dans la littérature) ont été observées en parole
conversationnelle : 1- l'intensité acoustique du bruit de plosion augmente lorsque le degré
de compression labial et la vitesse de fermeture des lèvres augmentent pour les consonnes
labiales ; 2- l'intensité acoustique du bruit de plosion augmente lorsque la vitesse
tangentielle du mouvement d'élévation de la langue augmente pour les consonnes
palatales ; 3- le degré de compression labial, les vitesses de fermeture et d'ouverture des
lèvres augmentent significativement lorsque les activités des muscles Orbicularis Oris
Supérieur (OOS) et Dépresseur de la Lèvre Inférieure (DLI) augmentent (dans les phases du
mouvement où ils sont agonistes). Ces relations évoluent en fonction du mode de phonation
(l'accent est mis en qualité chuchotée sur l'utilisation de paramètres cinématiques au
détriment des paramètres aérodynamiques, articulatoires et temporels) et du débit de
parole (la plupart des paramètres physiologiques et articulatoires perdent avec le débit leur
efficacité de contrôle des caractéristiques acoustiques).
ABSTRACT
Stop consonants (/p/, /b/, etc) are of particular interest for the understanding of
speech motor control. Indeed, the production of these stop consonant requires the
2
coordination of the 3 production levels: breathing, vocal folds vibration and articulation.
The main goal of my thesis is to study how respiratory, laryngeal and articulatory
gestures coordinate to control the variation of acoustic features of stop consonants,
especially of their burts (intensity, duration, spectrum), which are crucial for stop
consonant intelligibility. An important part of my thesis work also focuses on the muscular
control of lip gestures in the production of bilabial stops.
These goals needed a preliminary methodological work to compare, develop and
implement different techniques, in order to measure and estimate articulatory efforts of
speech production, physiologically and mechanically (lip movement kinematics, force
sensors, orofacial electromyography). This methodological exploration has given rise to the
acquisition of a large database (acoustic and physiological data) of French stop consonant
productions, for twenty healthy speakers, including 2 phonation modes (modal and
whispered), 2 speech rates (normal and fast) and several levels of articulatory effort.
The analysis of this database has confirmed relationships already established in
conversational speech between burst intensity and the maximum of intra-oral pressure (or
opening velocity of lips for labial stops), and between spectral features of the burst and
articulatory parameters of tongue movements for alveolar and velar stops. New other
relationships have been observed in conversational : 1- the burst acoustic intensity increase
when the lips compression and opening velocity increase (for labial stop consonants) ; 2-
the burst acoustic intensity increase when the elevation tangential velocity of the tongue
increase (for palatal stop consonants) ; 3- the lips compression, lips opening and closing
velocities significantly increase when the activities of the OOS (Superior Orbicularis Oris)
and DLI (Depressor of the Inferior Lip) muscles increase (during the movement phasis
where muscles are agonists). These relationships depend on phonation quality (in
whispered speech the accent is made on using kinematic parameters at the cost of
aerodynamic, articulatory and temporal ones) and speech rate (most of physiological and
articulatory parameters lost efficacies for acoustic control when speech rate increase).