Eric Kergosien
Axes de recherche
- Analyse des pratiques informationnelles (communication scientifique, usage de l’information dans les organisations…)
- Appropriation des dispositifs numériques (systèmes de recherche d’information, analyse de contenu (Intelligence artificielle et Fouille de textes), outils de veille, livre numérique…)
- Organisation des connaissances (architecture de l’information, classification et catégorisation du savoir, Web sémantique, visualisation et cartographie des connaissances…)
- Domaines d'études : Valorisation du patrimoine, Représentations du territoire, Information Scientifique et Technique, Santé
Projets
Science avec et pour la Société (SAPS) : 2022 - 2025 (en cours)
Carnet de recherche : https://science4all.hypotheses.org
Description
Le projet porté par l’Université de Lille en concertation avec ses partenaires repose sur un partenariat exclusif avec «l’Esprit sorcier TV», une chaîne lancée sur les box Orange et Free à l’automne 2022 et proposée par Fred, ancien acolyte de Jamy dans la production culte «C’est pas sorcier». Ce programme financé à hauteur de 168 000 € la première année va permettre de proposer deux fois par an un rendez-vous de médiation scientifique dénommé «La grande enquête !» et bénéciera de l’appui d’Ombelliscience. Réalisées en co-production, ces émissions émaillées de reportages vont explorer les thèmes socles de la stratégie du site lillois articulée autour de ses quatre hubs scientifiques : Santé de précision, Innovation au service d’une planète en mutation, Monde numérique au service de l’humain, Cultures, sociétés, pratiques en mutation. Elles proposeront également deux rendez-vous dédiés aux projets interdisciplinaires.
Observation jeunesse (INJEP - DRAJES) : 2024 - 2027 (en cours).
Description
Le projet Observation Jeunesse a pour objectif d’initier et de soutenir des travaux d’observation et d’études à dimension territoriale sur les champs jeunesse, sport et engagement portés par les DRAJES (partenariat Centre Régional de l'Infomation Jeunesse CRIJ) . Disposer d’une information locale de qualité concourt en effet à mieux piloter au niveau régional et départemental le déploiement des politiques jeunesse, engagement et sport.
Plus d'information : https://geriico.univ-lille.fr/detail-actu/projet-observation-jeunesse
TERECA (ARS Pays de la Loire, MESHS) : 2021 - 2026 (en cours).
Carnet de recherche : https://tereca.hypotheses.org
Description
Le projet TERECA (TErritoire / RÉseaux / Conduites Addictives) a pour objectif d'accompagner et d'analyser les dynamiques en cours lors de la création de réseaux de santé autour de l'addiction sur des territoires. Grâce à un outil de travail collaboratif interactif, la cartographie est l'outil choisi qui va permettre d’identifier les acteurs mobilisés contre les conduites addictives. En complément, un travail ethnographique et d'entretiens permet de donner à voir les enjeux interinstitutionnels autour des collaborations.
Il s’agit d'une extension d'une première collaboration avec Oppelia-Le Triangle et la ville de Nantes entre 2019 et 2020 (projet ADDICTO) pour une première cartographie du réseau d'acteurs travaillant sur le territoire Nantes-Nord, et d'une seconde collaboration avec l’association Hauts-de-France Addictions, acteur spécialisé sur les conduites addictives et fortement ancré sur le territoire Hauts-de-France depuis de nombreuses années.
TERECA propose également une meilleure prise en compte des publics cibles en intégrant au projet des collègues enseignants-chercheurs psychologues et spécialités des conduites addictives du laboratoire le CREN (Nantes Université).
#OpenDataEtPatrimoine (MESHS) : 2020-2024
Carnet de recherche : https://odep.hypotheses.org
Description
Au carrefour du mouvement de l’open data et des sciences du patrimoine, le projet #OpenDataEtPatrimoine coordonné par le laboratoire GERiiCO (Université de Lille) permet de dresser un état des travaux sur l’ouverture des données, de la science, et traite également les sujets liés à la modélisation des données patrimoniales.
Crobora (ANR Jeune Chercheur porté par Matteo Treleani) : 2021 - 2024
CROBORA studies the circulation of historical stock shots in the media space. Digitization facilitates the flow of content across countries, cultural and technical contexts. These mediations act as borders in the migratory movement of content: they allow circulation but impose reshapings. CROBORA will trace and analyze the re-use of audiovisual archives on television and on the web, focusing on content that speaks about European integration. The objective is to understand how circulation contributes to forging visual memories.
Le projet Crossing Borders Archives vise à analyser les migrations des images du passé de l'Union Européenne.
Plus d'information : https://geriico.univ-lille.fr/detail-actu/projet-crobora/
Memo-mines (ANR) : 2017-2023
Carnet de recherche : https://memomines.hypotheses.org
Description
Le projet ANR Mémo-Mines porte sur la conservation et la médiation numérique de la mémoire de la mine des Hauts-de-France. Il vise la sauvegarde des mémoires individuelles par leur conversion en traces mémorielles et leur mise à disposition sous forme de corpus d’archives numériques accessibles à tous.
Descriptif détaillé : https://geriico.univ-lille.fr/detail-actu/projet-memo-mines-anr/
PIA Jeunesse (ANRU - Métropole Européenne de Lille) : 2017-2021
Description
Le projet "Investir dans les jeunesses de la Métropole Européenne de Lille" est lauréat du dispositif PIA Jeunesse. Dans ce cadre, la MEL accompagne le déploiement de plus de 35 actions à destination des jeunes métropolitains de 13 à 30 ans. Villes, associations, missions locales, maisons de quartiers, coopératives, centres sociaux, fondations, etc. travaillent en réseau à l'amélioration de l'accompagnement des jeunes métropolitains.
Lien vers le descriptif détaillé : https://geriico.univ-lille.fr/detail-actu/projet-pia-jeunesse/
HAL/LO (GIS URFIST) : 2019 - 2021
Description
Projet visant à analyser la valorisation sur HAL de la production des laboratoires dans l’environnement de la science ouverte.
Plus d'information : https://geriico.univ-lille.fr/detail-actu/projet-hallo-gis-urfist/
Crobora (ANR Jeune Chercheur porté par Matteo Treleani) : 2021 - 2024
Description
Le projet Crossing Borders Archives vise à analyser les migrations des images du passé de l'Union Européenne.
Plus d'information : https://geriico.univ-lille.fr/detail-actu/projet-crobora/
DENIM (PEPS, financement CNRS/inter MSH, Ministère de la culture, Université de Lille) : 2014-2018 (co-animation avec Mathilde Wybo, laboratoire IRHIS)
Lien vers le site par ici, https://reccits.hypotheses.org/1036
Description
Le projet DENIM étudie les dispositifs numériques mis en place pour diffuser et échanger les informations relatives au patrimoine naturel et culturel du territoire, ainsi que leurs usages par les différents acteurs impliqués (citoyens, entreprises, scientifiques, collectivités, etc.). Il se décompose en deux axes. Le premier consiste à dresser un état du patrimoine valorisé dans les contenus numériques. Cela implique une première étape visant à cartographier les dispositifs existants sur le territoire, puis à récolter les données numériques patrimoniales diffusées. Une seconde étape vise, d’une part, à extraire les informations patrimoniales à partir du gros volume de données hétérogènes identifié et, d’autre part, à mettre en œuvre leur agrégation et structuration dans un objectif de découverte de nouvelles connaissances. Le second axe s’attache à analyser les usages de ces informations patrimoniales par les différents acteurs. L’originalité du projet proposé est de s’inscrire dans une démarche pluridisciplinaire visant à fournir aux acteurs une aide à la découverte de connaissances propres à leur territoire, ceci grâce à l'extraction, agglomération et visualisation de ces connaissances.
TERRE-ISTEX (Projet chantiers d'avenir Equipex ISTEX) : 2016-2018 (en cours)
Lien vers le site par ici, https://www.istex.fr/terre-istex
Description
Le projet interdisciplinaire TERRE‐ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus d’ISTEX et dans un corpus de thèses électroniques. Le projet se décompose en trois actions principales : (1) identifier les périodes et les lieux qui ont fait l’objet d’études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les approches (méthodes et concepts) mobilisées pour la réalisation de ces études et enfin (3) développer un démonstrateur Web de recherche d’information géographique (RIG). Les deux premières actions feront intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires, selon quelles approches et à quel moment.
Mots-clés : Fouille de textes, Traitement Automatique du Langage Naturel, information géographique, territoire, multidisciplinarité, veille, fronts de recherche.
LivreEtLecture (Projet Métropole Européenne de Lille) : 2016-2020
Lien vers le site par ici, https://bibliomel.hypotheses.org
Description
Le projet LivreEtLecture la place de la bibliothèque dans les pratiques culturelles des habitants d’un territoire métropolitain aujourd’hui a pour objectif général d’analyser les pratiques des usagers des bibliothèques et plus généralement de mieux comprendre la place et le rôle que jouent ces établissements dans l’espace culturel métropolitain.
Mots-clés : Fouille de textes, Traitement Automatique du Langage Naturel, information géographique, territoire, multidisciplinarité, veille, fronts de recherche.
DRTD-SHS (financement MSH) : 2014-2015 (en cours)
Description
Universités et organismes de recherche s'engagent dans la gestion et valorisation des données de la recherche en open access. Leur objectif : accélérer la communication directe, faciliter l'accès aux résultats, augmenter la visibilité et l'impact de leur recherche, et améliorer l'information du grand public. Avec le développement de l'eScience, l'accès aux données de la recherche devient un enjeu important pour les dispositifs de la communication et veille scientifique. Tandis que les projets d'infrastructure portent avant tout sur de grands réservoirs de données (big data), d'autres résultats de la recherche restent moins accessibles. Objet Nous nous intéressons aux petits ensembles de données (small data), produits par des doctorants et diffusés avec les thèses de doctorat : des annexes, du matériel audio-visuel, des tableaux et bases de données, résultats bruts d'enquêtes etc. Hier déposé comme matériel complémentaire avec un exemplaire de la thèse dans les bibliothèques universitaires, aujourd'hui, avec la mise en place des dispositifs de thèses électroniques, ce matériel est diffusé sur des serveurs et plateformes documentaires. Source potentiellement riche d'information dans tous les domaines scientifiques, ce matériel est pourtant peu exploité à ce jour. Un intérêt particulier est la nature non commerciale et publique de la plupart de ces résultats. Notre travail consiste à faire un état des lieux et à contribuer à une meilleure diffusion, valorisation et exploitation de ces données de la recherche.
EQU (Université Lille 3) : 2015 - 2017
Description
Les objectifs de notre travail sont organisés autour des problématiques de recherche identifiées. Tout d'abord, il s'agit d'étudier quelles stratégies mettent en oeuvre les opérateurs et les médecins du SAMU afin de comprendre les appelants et surtout de faire le bon diagnostic et prendre la bonne décision quant au « patient » à « soigner ». Pour ceci, grâce à l'analyse des conversations du centre d'appels et de forums de discussions médicales, plusieurs points méthodologiques devront être abordés :
- interopérabilité sémantique : les mots utilisés par les appelants (il n'est pas comme d'habitude, le visage de mon père est bizarre, ma mère est essoufflée) et leur signification contextuelle (par exemple, essoufflé peut être indicatif d'une dyspnée, le visage bizarre peut être indicatif d'une paralysie faciale et donc d'un AVC) afin d'améliorer l'intercompréhension entre ces deux catégories de personnes ;
- émotivité : l'emprise des émotions dans la communication surtout lorsqu'elles empêchent de communiquer les informations principales et nécessaires afin de contrer l'expression excessive des émotions et d'améliorer la qualité de la communication ;
- rhétorique et stratégies : les stratégies mises en place par le personnel des SAMU pour orienter les appelants, les rassurer et leur faire dire les informations nécessaires et suffisantes ;
- soigner avec les paroles : sans aucune intervention directe, mais uniquement par la parole, aider les appelants à faire les premiers gestes de secours nécessaires avant l'arrivée du SAMU.
De manière plus globale, grâce à une collaboration multidisciplinaire et l'analyse des données diverses (e.g., appels téléphoniques, discussions avec le personnel du SAMU et informations des réseaux sociaux), nous voulons modéliser le métier du SAMU du point de vue linguistique et éthique, pour faire mieux connaître ce métier auprès des populations et pour créer un guide qui pourrait aider les nouveaux arrivants à maîtriser mieux et plus rapidement leur métier.
ANIMITEX (Mastodons, CNRS) : 2013-2014 (en cours)
Description
La mise à disposition des données satellites à haute et très haute résolution avec une forte répétitivité temporelle pose le problème d'une analyse efficace et rapide de la multitude d'informations qu'elles contiennent. Celle-ci demande un investissement humain conséquent et nécessite de recourir à des méthodes complémentaires de celles de télédétection pour répondre aux enjeux sociétaux associés. Le projet ANIMITEX, ambitieux et exploratoire, s'inscrit dans ce contexte et a pour objectif d'exploiter des données textuelles massives et hétérogènes afin d'apporter des informations cruciales permettant de compléter l'analyse des images satellites. Le consortium proposé repose sur des compétences fortes en fouille de texte et télédétection des laboratoires impliqués afin de mettre en place une synergie d'excellence permettant de répondre à la problématique posée.
PEPS HuMaIn (CNRS) : 2013-2014 (en cours)
Description
Les recherches fédérées autour des trois projets PEPS, vise à produire des connaissances nouvelles à travers une analyse fine des interactions et des sentiments véhiculés dans les publications issues des réseaux sociaux, en particulier Twitter. Pour mener à bien ces travaux, des chaînes de traitements ont été produites et une analyse pluridisciplinaire des résultats a été menée (linguistique, socio-linguistique, politique, communication et informatique). Une confrontation de différentes approches/algorithmes et une analyse contrastive a été menée à partir d'un même jeu de données de tweets issus du projet POLOP (http://www.lirmm.fr/~bouillot/polop/polop.html). Le corpus mis en commun était constitué de tweets échangés durant trois débats politiques précédant les premier et second tours des élections présidentielles 2012.
SENTERRITOIRE : 2012-2014 (en cours)
Description
Le projet SENTERRITOIRE a pour objectif de proposer un environnement décisionnel basé sur une analyse automatique des textes liés à l’aménagement du territoire. Le projet se décompose en deux axes de recherche :
- l’extraction de descripteurs géospatiaux dans les textes. Ces derniers nécessitent ensuite d’être enrichis par des informations caractérisant plus largement le concept de « territoire » afin d’analyser automatiquement l’utilisation de ces concepts dans les textes, et les perceptions qu’ils véhiculent.
- l’analyse du sentiment lié à ces entités spatiales. L’objectif est de proposer une méthode automatisée et non supervisée permettant de (1) identifier un vocabulaire d’opinions propre au domaine de l’aménagement du territoire et (2) identifier des relations entre les opinions et les descripteurs géospatiaux marquées dans les textes.
L’extraction d’informations spatiales au sein des documents est un premier pas pour définir une méthode de découverte semi-automatique de la perception des territoires. Ceci reste un enjeu majeur dans le contexte de l’aménagement et des débats publics associés. L’originalité du projet proposé est de s’inscrire dans une démarche pluridisciplinaire initiée à partir d’une méthode automatique visant à fournir aux géographes et, aux environnementalistes, … une aide à la découverte de connaissances. Des verrous sont associés à l’hétérogénéité des documents manipulés aussi bien dans leur structure que dans leur contenu (rapports techniques, compte-rendu de réunions publiques, cahiers d’acteurs, articles de journaux, blogs, interviews retranscrits).
ANR Geonto : 2008-2011
Description
Ce projet vise l'interopérabilité de diverses données géographiques hétérogènes. Deux objectifs applicatifs sont tout particulièrement visés. Le premier est l’intégration de bases de données géographiques hétérogènes, opération qui est nécessaire pour faciliter leur gestion (saisie, maintenance, mise à jour) et pour permettre des analyses combinant ces différentes bases. Cette tâche passe par la mise en correspondance des schémas des bases qui est complexe du fait que chaque base a été conçue indépendamment des autres et que les choix de modélisation effectués sont fonction des besoins de chaque concepteur. Il en résulte une grande hétérogénéité des schémas, tant du point de vue de leur structure, que des noms des entités, des attributs, des domaines de définition associés aux valeurs des attributs. Le deuxième objectif applicatif est l'interrogation d'une collection importante de documents textuels plus variés et destinés à un plus grand public que les bases de données précédemment mentionnées. Ces documents font référence à divers lieux nommés qui, s'ils sont identifiés, sont un point d'entrée essentiel sur lequel peuvent se baser de nombreuses requêtes. Ces documents s'appuient aussi sur un vocabulaire géographique qui, s’il est explicité et formalisé, peut servir à produire de puissants index sur lesquels peuvent s'appuyer des langages d'interrogations expressifs.
Actions :
- Construire des ontologies associées à des bases de données par exploitation de leurs spécifications (documents textuels), ou associés à un corpus de documents géographiques moins techniques ;
- Aligner les ontologies obtenues et étudier leurs différences ;
- Apparier les schémas des bases de données via les ontologies, et développer un moteur de Appel à projets ANR-07-MDCO 3 annexe technique recherche d'information dans une base de documents via ces mêmes ontologies.