Publié le 29 avril 2022 Mis à jour le 29 avril 2022

Cette séance des Lundis de l'Ined est animée par Monica Becue (Universitat Politècnica de Catalunya) ; Discutante : Elisabeth Morand (Ined, Service méthodes statistiques).

Date(s)

le 30 mai 2022

de 11h30 à 12h30

Les lundis de l'Ined Logo
Les lundis de l'Ined Logo
L’usage d’enquêtes internationales se développe, ce qui pose la question du traitement de réponses libres formulées en différentes langues. Dans le cadre de la statistique textuelle, il devient nécessaire de disposer de méthodes permettant d’analyser conjointement l’ensemble des réponses. En général, les répondants ont aussi répondu à de nombreuses questions fermées, les mêmes dans toutes les langues.

Pour traiter ce type de données, nous avons proposé d’appliquer l’analyse factorielle multiple pour tableaux de contingence (AFMTC). Pour cela, on construit dans chacun des échantillons (=des langues) un tableau lexical agrégé croisant les mots et les catégories d’une variable qualitative, issue des réponses aux questions fermées. Les tableaux lexicaux (=un par échantillon) sont ensuite concaténés pour former le tableau de contingence multiple à analyser par l’AFMTC, méthode qui offre les résultats très riches de l’AFM.

Nous avons élargi cette approche de façon à tenir compte de plusieurs variables, quantitatives ou qualitatives. Dans chaque échantillon, un tableau lexical agrégé généralisé (TALG), croisant variables et mots, est construit. Les mots sont positionnés sur les variables en fonction des valeurs prises par les répondants qui les ont prononcés. Ces tableaux sont ensuite concaténés. Une extension de l’AFM, appelée AFM pour TALG (AFM-TLAG), permet d’analyser ce tableau multiple.  On obtient des résultats de même nature que ceux offerts par l’AFMTC qui est un cas particulier de cette nouvelle méthode.

Nous présenterons ces méthodes en les appliquant à une enquête internationale multilingue. Les résultats sont obtenus au moyen du package Xplortext de R.