Can AI Bridge the Health Literacy Gap? An Analysis of Requirements and Opportunities

L’un des facteurs les plus déterminants pour la santé des patients est la littératie en santé (LS), définie comme la capacité à obtenir, comprendre et utiliser l’information médicale. Malgré l’abondance des ressources numériques en santé, des disparités persistent en raison de la complexité du langage médical, du manque de personnalisation et de l’insuffisance du support multilingue. En mobilisant des sources de données variées — dossiers médicaux électroniques (EHR), communautés de santé en ligne (comme Reddit) et ontologies médicales (UMLS, SNOMED-CT) — cette étude analyse comment l’intelligence artificielle (IA) peut contribuer à réduire les écarts de LS.

Dans ce papier publié dans la conférence SERA 2025 , Nous examinons des approches de pointe telles que les grands modèles de langage (LLM) pour la simplification textuelle (ex. adaptation du niveau de lecture avec GPT-4) et le traitement automatique du langage naturel (TAL) pour la classification de la LS (ex. profilage linguistique dans l’étude ECLIPPSE). Plusieurs enjeux sont identifiés : biais culturels dans l’évaluation de la LS, risques de sur-simplification de l’information médicale, et défis liés à l’intégration de données hétérogènes.

Pour personnaliser la diffusion de l’information en santé, le cadre méthodologique proposé intègre des techniques pilotées par IA, notamment l’identification automatique du niveau de LS, le mappage conceptuel et l’enrichissement sémantique. En combinant données structurées (EHR) et non structurées (réseaux sociaux), cette approche vise à améliorer l’accessibilité tout en préservant la précision clinique. Les perspectives futures incluent l’adaptation multilingue et la validation en conditions réelles afin de garantir une communication en santé plus équitable.

Index — littératie en santé, information médicale multilingue, diversité linguistique, connaissances médicales multilingues, littératie communicationnelle en santé, lisibilité, contenu non structuré, médias sociaux, analyse de lisibilité au niveau de la phrase, méta-clustering, cohérence, organisation logique, communication en santé, dialogue numérique en santé, Reddit, e-accessibilité, interventions personnalisées de lisibilité, profils textuels.