Antonio Balvet
Axes de recherche
Linguistique de Corpus et Traitement Automatique des Langues
J'aborde la description et la formalisation des propriétés de construction des unités prédicatives en exploitant des données linguistiques issues de collections structurées et contrôlées (corpus). Mes principaux thèmes de recherche sont:
- les propriétés de structure argumentale des unités prédicatives: comment les verbes, mais également les noms et les adjectifs se lient à d'autres constituants de la phrase. Comment identifier les constituants essentiels à la construction d'un verbe, d'un adjectif ou d'un nom? Par exemple, "fier" peut se construire avec un Syntagme Prépositionnel comme "de son travail", mais également avec une proposition subordonnée complétive comme "qu'il sache bien travailler". Tous les adjectifs ont-ils ces propriétés de construction? Une fois les propriétés de construction établies, comment les représenter dans des ressources linguistiques au format électronique, exploitables pour des analyses linguistiques automatiques? Comment les représenter dans des ressources lexicographiques destinées à des lecteurs humains?
- les propriétés de structure argumentale à travers les langues: toutes les langues autorisent-elles les mêmes structures pour les unités prédicatives? Combien de compléments les unités prédicatives peuvent-elles accepter. Par ex., en français, 3 compléments semble être un maximum (ex: X parle de Y à Z). Que faire de cas où le nombre de compléments semble dépasser 3, ex.: X transporte Y de Z à W? Cette limite vaut-elle pour toutes les langues? Si oui, les compléments s'expriment-ils tous selon les mêmes formes syntaxiques? J'aborde cette thématique au travers de corpus parallèles: français, anglais, serbe, ainsi que espagnol.
- la description et la formalisation des propriétés de construction des phrases dans les langues signées: ces langues utilisant la modalité visuo-gestuelle sont encore relativement mal connues, alors que le nombre de locuteurs de ces langues s'accroît. Dans le même temps, notamment pour la Langue des Signes Française, les besoins en ressources didactiques et documents exploitables pour l'enseignement de la langue augmentent de façon considérable (Capes LSF, loi de 2005 sur l'accessibilité). J'aborde cette thématique en collaboration avec le groupe Langues Signées et Gestualité (UMR SFL, Paris 8). Plus précisément, je m'intéresse aux différents modes de réalisation de la prédication en LSF, aussi bien par des signes lexicalisés (signes standards) que dans des structures émergentes (néologismes) ou non totalement lexicalisées (unités de transfert).
Participation à projets de recherches
2017-...: Projet d'échange ECOS-SUD "Induction automatique de taxonomies pour l'espagnol et le français moyennant des techniques quantitatives et statistiques de corpus", (R. Marín, I. Renau, R. Nazar), Université de Lille / Université de Valparaíso
2016–...: Projet bilatéral Campus France “ Corpus parallèles et lexicographie bilingue : recherche et application”, projet franco-serbe P. Savic (UMR CLLE-ERSS, UMR STL 8163, Univ. de Belgrade), sous la direction de D. Stosic (Université Toulouse 2 & CLLE-ERSS) et V. Stanojevic (Université de Belgrade)
2015: EQU (Éthique, Qualité, Urgence), projet BQR Université Lille 3 (UMR 8163 STL, EA 4073 Geriico, SAMU 62), Étude de la communication en situations d’urgence (centres d’appel SAMU)
2013 et 2014: Co-coordinateur scientifique du projet SaNOM, projet BQR Université Lille 3, Description formalisée de la Structure Argumentale des noms prédicatifs
2014–... PICS , Projet PICS CNRS, Université Lille 3-Université de Tromsø, Description formalisée de la Structure Argumentale des adjectifs prédicatifs
2012–2013 Coordinateur scientifique du projet LEX-VAN, Lexique Électronique pour les Verbes, Adjectifs et Noms prédicatifs, projet émergent MESHS Lille Nord de France
2012 Coordinateur scientifique de la Prestation Réseaux Technologie Sémoteur, UMR STL/SAS Ergonotics, juin-septembre 2012
2008–2010 ANR MDCO CRoTAL (XCRF pour le TAL), Université Lille 3, Université Paris 11, Université d’Orléans
2007–2010 ANR JC Nomage, Université Lille 3, Université Pompeu Fabra, Université d’Osnabrück, Université d’Orléans
2007–2012 ANR Corpus Creagest, Université Paris 8, Université Paris 5, Université Lille 3
2006 Projet PAI Ontoref (Natural Language Ontology for Reference to Facts and Eventualities), Université Lille 3, Université Pompéu Fabra, Université d’Osnabrück