Lieu :Bâtiment IMAG, salle Auditorium
Ecole Doctorale :Ingénierie pour la santé, la cognition et l''environnement (EDISCE)
Structure de rattachement :
Directeur de thèse :
Financement(s) :
-Contrat doctoral
-contrat à durée déterminée
-Sans financement
-contrat à durée déterminée
-Sans financement
-contrat à durée déterminée
-Sans financement
Date d'entrée en thèse: 02/01/2017
Date de soutenance: 23/03/2021
Composition du jury :
- M. Matteo Rivoira
Professeur, Istituto per l'Atlante Linguistico Italiano, Università degli Studi di Torino, Rapporteur
- M. Christian Sallaberry
Maître de Conférence, HDR, Université de Pau, Rapporteur
- Mme Ana-Maria Olteanu-Raimond
Chargée de Recherche HDR, Laboratoire LASTIG, IGN
- M. Francois Portet
Professeur, Laboratoire d''Informatique de Grenoble, Université Grenoble Alpes
- Mme Anika Falkert
Professeur, Université d''Avignon et des Pays du Vaucluse
- Mme Paule-Annick Davoine
Professeure, Pacte, LIG, Directrice de thèse
- Mme Elisabetta Carpitelli
Professeure, Gipsa-Lab, Co-Directrice de thèse
- M. Philippe Garat
Maître de Conférence, LJK, Co-Encadrant de thèse
Membre invitée : Mme Guylaine Brun
Résumé:
Les données manipulées par les géolinguistes sont issues d'enquêtes réalisées a partir du XIXe siècle. Depuis près d'un siècle, les géolinguistes utilisent la cartographie pour visualiser
leurs données et comprendre les structures spatiales des aires de diffusions des dialectes. Ces productions cartographiques se distinguent en trois grandes catégories : les cartes des atlas linguistiques
avec des données brutes en transcription phonétique; les cartes interprétatives résultant d'un travail d'interprétation des données brutes afin d'identifier la répartition spatiale des phénomènes linguistiques ;
les cartes de synthèse réalisées a partir d'études transversales mettant en relation les données de plusieurs cartes interprétatives. Aujourd'hui, force est de constater que l'outillage logiciel destiné au traitement cartographique des données géolinguistiques est très en retard et les systèmes d'information géographique (SIG) sont peu adaptés. Nous proposons donc des méthodes et des outils géomatiques pour produire automatiquement des cartes interprétatives et de synthèse permettant l'analyse spatiale exploratoire de données géolinguistiques. Les frontières linguistiques ou isoglosses
sont actuellement construites avec des approches manuelles ce qui rend la production de cartes interprétatives fastidieuse et non reproductible. Nous proposons des méthodes d'automatisation
du calcul d'isoglosses qui mobilisent des méthodes d'interpolation spatiale et en les adaptant aux données qualitatives spatialisées. Nous essayons aussi de comprendre comment certains traits dialectaux se sont diffuses spatialement et proposons une procedure d'analyse statistique multidimensionnelle couplant des méthodes de projection et de classification pour identifier des ensembles cohérents au sein d'un corpus
d'entités géographiques. L'implémentation des méthodes proposées dans deux environnements logiciels, ShinyDialect et ShinyClass, intègre un
environnement pour l'analyse exploratoire des résultats, ce qui contribue aussi a faciliter l'appropriation des méthodes par les géolinguistes. Ces travaux se situent dans le contexte du projet ANR ECLATS dont l'objectif est de valoriser les données de l'Atlas Linguistique de la France . Nos propositions s'inscrivent dans une volonté de transfert de connaissances issues de l'informatique, de l'analyse spatiale et de la géographie vers la géolinguistique. Ces recherches se placent donc dans le paradigme des humanités numériques spatialisées et présentent des enjeux transdisciplinaires.