Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
BOCQUELET Florent

Vers le développement d'une interface cerveau-machine pour la restauration de la parole (Toward a brain-computer interface for speech rehabilitation)

 

Directeur de thèse :     Laurent GIRIN

Co-directeur de thèse :     Laurent GIRIN

École doctorale : Ingénierie pour la santé, la cognition et l''environnement (EDISCE)

Spécialité : Traitement du Signal et Télécom

Structure de rattachement : Autre

Établissement d'origine : CEA LETI

Financement(s) : autres financements

 

Date d'entrée en thèse : 01/10/2013

Date de soutenance : 24/04/2017

 

Composition du jury :
CHABARDES Stéphan - Professeur (CHUG)
GUENTHER Frank - Professeur (Boston University)
HUEBER Thomas - Chargé de recherche (CNRS)
MÜLLER Oliver - Professeur (Université de Freiburg)
SCHULTZ Tanja - Professeur (Karlsruhe Institute of Technology)
TREBUCHON Agnès - Maitre de conférences et praticien hospitalier (APHM)

 

Résumé : Restorer la faculté de parler chez des personnes paralysées et aphasiques pourrait être envisagée via l'utilisation d'une interface cerveau-machine permettant de contrôler un synthétiseur de parole en temps réel. L'objectif de cette thèse était de développer trois aspects nécessaires à la mise au point d'une telle preuve de concept. Premièrement, un synthétiseur permettant de produire en temps-réel de la parole intelligible et controlé par un nombre raisonable de paramètres est nécessaire. Nous avons choisi de synthétiser de la parole à partir des mouvements des articulateurs du conduit vocal. En effet, des études récentes ont suggéré que l'activité neuronale du cortex moteur de la parole pourrait contenir suffisamment d'information pour décoder la parole, et particulièrement ses propriété articulatoire (ex. l'ouverture des lèvres). Nous avons donc développé un synthétiseur produisant de la parole intelligible à partir de données articulatoires. Dans un premier temps, nous avons enregistré un large corpus de données articulatoire et acoustiques synchrones chez un locuteur. Ensuite, nous avons utilisé des techniques d'apprentissage automatique, en particulier des réseaux de neurones profonds, pour construire un modèle permettant de convertir des données articulatoires en parole. Ce synthétisuer a été construit pour fonctionner en temps réel. Enfin, comme première étape vers un contrôle neuronal de ce synthétiseur, nous avons testé qu'il pouvait être contrôlé en temps réel par plusieurs locuteurs, pour produire de la parole inetlligible à partir de leurs mouvements articulatoires dans un paradigme de boucle fermée. Deuxièmement, nous avons étudié le décodage de la parole et de ses propriétés articulatoires à partir d'activités neuronales essentiellement enregistrées dans le cortex moteur de la parole. Nous avons construit un outil permettant de localiser les aires corticales actives, en ligne pendant des chirurgies éveillées à l'hôpital de Grenoble, et nous avons testé ce système chez deux patients atteints d'un cancer du cerveau. Les résultats ont montré que le cortex moteur exhibe une activité spécifique pendant la production de parole dans les bandes beta et gamma du signal, y compris lors de l'imagination de la parole. Les données enregistrées ont ensuite pu être analysées pour décoder l'intention de parler du sujet (réelle ou imaginée), ainsi que la vibration des cordes vocales et les trajectoires des articulateurs principaux du conduit vocal significativement au dessus du niveau de la chance. Enfin, nous nous sommes intéressés aux questions éthiques qui accompagnent le développement et l'usage des interfaces cerveau-machine. Nous avons en particulier considéré trois niveaux de réflexion éthique concernant respectivement l'animal, l'humain et l'humanité. Summary: Restoring natural speech in paralyzed and aphasic people could be achieved using a brain-computer interface controlling a speech synthesizer in real-time. The aim of this thesis was thus to develop three main steps toward such proof of concept. First, a prerequisite was to develop a speech synthesizer producing intelligible speech in real-time with a reasonable number of control parameters. Here we chose to synthesize speech from movements of the speech articulators since recent studies suggested that neural activity from the speech motor cortex contains relevant information to decode speech, and especially articulatory features of speech. We thus developed a speech synthesizer that produced intelligible speech from articulatory data. This was achieved by first recording a large dataset of synchronous articulatory and acoustic data in a single speaker. Then, we used machine learning techniques, especially deep neural networks, to build a model able to convert articulatory data into speech. This synthesizer was built to run in real time. Finally, as a first step toward future brain control of this synthesizer, we tested that it could be controlled in real-time by several speakers to produce intelligible speech from articulatory movements in a closed-loop paradigm. Second, we investigated the feasibility of decoding speech and articulatory features from neural activity essentially recorded in the speech motor cortex. We built a tool that allowed to localize active cortical speech areas online during awake brain surgery at the Grenoble Hospital and tested this system in two patients with brain cancer. Results show that the motor cortex exhibits specific activity during speech production in the beta and gamma bands, which are also present during speech imagination. The recorded data could be successfully analyzed to decode speech intention, voicing activity and the trajectories of the main articulators of the vocal tract above chance. Finally, we addressed ethical issues that arise with the development and use of brain-computer interfaces. We considered three levels of ethical questionings, dealing respectively with the animal, the human being, and the human species.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31