Rethinking Higher Education/fr/Chapter 5
L'apprentissage des langues étrangères avec et sans IA : une étude comparative empirique
Martin Woesler
Université normale du Hunan
Résumé
Cette étude compare les résultats d'apprentissage auto-déclarés, les motivations et les attitudes de 133 étudiants universitaires chinois apprenant une langue étrangère — 85 dans un groupe assisté par l'IA et 48 dans un groupe traditionnel avec enseignant humain — sur une période d'environ un mois. S'appuyant sur un instrument d'enquête exhaustif comportant 126 variables couvrant la démographie, les méthodes d'apprentissage, les préférences de modalités sensorielles, les attitudes envers l'IA dans l'éducation et l'auto-évaluation de l'amélioration dans dix domaines de compétences linguistiques, l'étude dresse un tableau complexe qui remet en question tant les discours techno-optimistes que techno-pessimistes. Le groupe avec enseignant humain a rapporté une amélioration globale plus élevée (63,2 % contre 51,9 %), mais le groupe IA a signalé des progrès plus importants en expression orale et en compréhension orale — précisément les compétences interactives que les chatbots d'IA sont conçus pour exercer. Les deux groupes ont exprimé une forte préférence pour les enseignants humains, mais le groupe IA valorisait simultanément la disponibilité, la rapidité et l'environnement sans pression de l'IA. Les attitudes envers l'autonomie de l'IA étaient prudentes dans les deux groupes : plus de 70 % ont convenu que l'IA nécessite un contrôle éthique, et moins de 20 % ont approuvé la domination de l'IA sur les humains. Ces résultats contribuent à la littérature croissante sur l'IA dans l'enseignement des langues et sont discutés en relation avec les conclusions qualitatives de Fang Lu (dans ce volume) et le cadre philosophique d'Ole Döring (dans ce volume).
Mots-clés : apprentissage des langues assisté par l'IA, étude comparative, enseignement des langues étrangères, interaction humain-IA, éducation numérique, modalités sensorielles, attitudes des étudiants, Chine, Union européenne, thèse de complémentarité
1. Introduction
L'intégration de l'intelligence artificielle dans l'enseignement des langues est passée du futurisme spéculatif à la pratique quotidienne avec une rapidité remarquable. Les étudiants universitaires chinois en 2025 utilisent couramment des chatbots d'IA — ChatGPT, Kimi, DeepSeek, Doubao — comme partenaires de conversation, coaches de prononciation, correcteurs de grammaire et tuteurs de vocabulaire. Pourtant, les preuves empiriques quant à savoir si l'apprentissage des langues assisté par l'IA produit de meilleurs résultats que l'enseignement humain traditionnel restent étonnamment minces. La plupart des études existantes sont à petite échelle, se concentrent sur un seul outil d'IA ou mesurent les résultats sur des périodes très courtes. Ce qui manque, c'est une étude comparative qui examine non seulement les résultats d'apprentissage, mais aussi les dimensions motivationnelles, attitudinales et perceptuelles de l'apprentissage des langues assisté par l'IA par rapport à l'enseignement humain.
Cette étude comble cette lacune. Nous avons interrogé 133 étudiants universitaires chinois — 85 qui ont choisi ou ont été affectés à l'apprentissage d'une langue étrangère avec l'assistance de l'IA, et 48 qui ont appris avec des enseignants humains — après environ un mois d'étude. L'instrument d'enquête, comprenant 126 variables, saisit la démographie, les connaissances linguistiques antérieures, le temps d'étude quotidien, les raisons du choix de groupe, les méthodes d'utilisation de l'IA, les perceptions de la qualité du feedback, l'auto-évaluation de l'amélioration dans dix domaines de compétences spécifiques, l'importance de douze modalités sensorielles et sociales dans l'apprentissage, et les attitudes envers quatorze aspects de l'IA dans l'éducation et la société.
Nos résultats s'inscrivent dans un corpus croissant de travaux sur l'éducation numérique en Chine et en Europe, notamment les études de cas qualitatives de Fang Lu (dans ce volume), qui a examiné les effets de l'IA sur la pensée critique dans les cours de langue chinoise au Boston College, et l'analyse philosophique d'Ole Döring (dans ce volume), qui interroge les fondements conceptuels de l'« intelligence artificielle » dans les contextes pédagogiques. Là où Fang Lu apporte de la profondeur à travers des cas individuels et Döring apporte une largeur philosophique, nous contribuons par une largeur quantitative à travers une comparaison d'un échantillon substantiel de participants.
2. Revue de la littérature
2.1 L'IA dans l'enseignement des langues : état de l'art
L'application de la technologie à l'apprentissage des langues a une longue histoire, depuis les laboratoires de langues des années 1960, en passant par l'Apprentissage des Langues Assisté par Ordinateur (ALAO) dans les années 1990, jusqu'à la génération actuelle d'outils alimentés par l'IA. Chapelle (2001) a fourni un cadre précoce pour évaluer la technologie dans l'acquisition d'une langue seconde, soulignant l'importance du potentiel d'apprentissage linguistique, de l'adéquation à l'apprenant et des considérations pratiques. Golonka et al. (2014) ont passé en revue 350 études sur les types de technologies dans l'apprentissage des langues étrangères et ont constaté que, bien que la technologie soit prometteuse pour l'acquisition du vocabulaire et la compréhension en lecture, les preuves d'amélioration en expression orale et en écriture étaient limitées.
L'émergence des grands modèles de langage (LLM) — ChatGPT, Claude et leurs homologues chinois Kimi, DeepSeek et Doubao — a fondamentalement changé le paysage. Contrairement aux chatbots antérieurs qui reposaient sur des dialogues scriptés et la reconnaissance de mots-clés, les chatbots basés sur les LLM peuvent soutenir des conversations ouvertes et contextuellement appropriées sur pratiquement n'importe quel sujet. Huang, Hew et Fryer (2022) ont réalisé une revue systématique de l'apprentissage des langues assisté par chatbot et ont constaté des effets positifs sur l'acquisition du vocabulaire et la confiance en expression orale, mais ont noté que la plupart des études souffraient de petits échantillons, de durées courtes et d'un manque de groupes témoins.
Jeon (2022) a exploré les affordances des chatbots d'IA avec de jeunes apprenants coréens d'anglais langue étrangère et a constaté que les étudiants appréciaient la patience, la disponibilité et la nature non jugeante du chatbot — des résultats que nos données corroborent fortement. Kim (2019) a rapporté que l'interaction avec un chatbot d'IA améliorait les compétences grammaticales en anglais chez les étudiants universitaires coréens, un résultat que nos données ne soutiennent que partiellement (l'amélioration grammaticale était en fait plus faible dans notre groupe IA).
2.2 L'anxiété en langue étrangère
La dimension psychologique de l'apprentissage des langues a été largement étudiée depuis que Horwitz, Horwitz et Cope (1986) ont développé l'Échelle d'Anxiété en Classe de Langue Étrangère (FLCAS). MacIntyre et Gardner (1994) ont démontré que l'anxiété linguistique a des effets mesurables sur le traitement cognitif dans la langue seconde : les apprenants anxieux traitent l'information plus lentement, mémorisent moins de vocabulaire et produisent des énoncés moins complexes. L'hypothèse du « filtre affectif » de Krashen (1982) postule que les états émotionnels négatifs — anxiété, doute de soi, ennui — créent une barrière mentale qui entrave l'acquisition linguistique.
La pertinence pour l'apprentissage assisté par l'IA est directe. Si les chatbots d'IA peuvent abaisser le filtre affectif en fournissant un environnement de pratique exempt de jugement, ils peuvent permettre aux apprenants de traiter et de produire le langage plus efficacement qu'ils ne le feraient dans le contexte anxiogène d'une classe avec un enseignant humain. Nos données suggèrent que ce mécanisme est opérant : l'avantage le plus apprécié du groupe IA était « pas de peur de faire des erreurs » (76,6 %), et le groupe IA a rapporté une amélioration plus importante précisément dans les compétences — expression orale, compréhension orale, confiance communicative — qui sont les plus inhibées par l'anxiété.
2.3 Le contexte chinois
Le paysage de l'IA éducative en Chine est distinctif. Le « Plan de développement de l'intelligence artificielle de nouvelle génération » du gouvernement chinois (2017) et le plan « Modernisation de l'éducation 2035 » identifient tous deux l'IA comme une priorité stratégique pour la réforme éducative. Les étudiants chinois ont accès à une gamme d'outils d'IA développés nationalement — notamment Kimi (Moonshot AI), DeepSeek, Doubao (ByteDance) et Ernie (Baidu) — en plus des outils internationaux comme ChatGPT (accessible via VPN). Le contexte culturel est également pertinent : la culture de classe chinoise met traditionnellement l'accent sur l'autorité de l'enseignant, la déférence de l'étudiant et les comportements de préservation de la face qui peuvent inhiber la participation orale — précisément les conditions dans lesquelles l'environnement exempt de jugement de l'IA peut offrir le plus grand bénéfice.
3. Conception de l'étude et méthodologie
2.1 Participants
Au total, 133 étudiants universitaires chinois ont participé à l'étude. Le groupe IA comprenait 85 participants (74 % de femmes, 26 % d'hommes ; âge moyen 23,8 ans, intervalle 19-38). Le groupe enseignant humain comprenait 48 participants (89 % de femmes, 11 % d'hommes ; âge moyen 23,1 ans, intervalle 20-32). Tous les participants étaient inscrits dans des universités chinoises, étudiant principalement l'anglais (IA : 38 %, Humain : 29 %) ou l'allemand (IA : 16 %, Humain : 25 %) comme langue étrangère majeure. Le déséquilibre de genre — plus prononcé dans le groupe humain — reflète la démographie générale des départements de langues étrangères dans les universités chinoises.
Les participants n'ont pas été assignés de manière aléatoire. Certains ont choisi leur groupe ; d'autres ont été affectés (44,7 % du groupe humain ont signalé une affectation passive). Cette auto-sélection introduit un facteur de confusion potentiel : les étudiants qui ont choisi le groupe IA pouvaient être plus curieux sur le plan technologique ou plus insatisfaits de l'enseignement traditionnel. Nous abordons cette limitation dans la Section 5.
2.2 Instrument d'enquête
L'enquête a été administrée en chinois via une plateforme de questionnaire en ligne (问卷星) le 28 mars 2025. Elle comprenait les sections suivantes :
(a) Démographie : nom (anonymisé avant l'analyse), date de naissance, genre (5 items). (b) Compétence linguistique antérieure : niveaux CECRL auto-évalués pour le chinois, l'anglais, l'allemand, le français, le japonais, le coréen et jusqu'à trois langues supplémentaires (9 items). (c) Langue d'étude et niveau de départ : même structure que (b) mais pour la langue étudiée dans l'expérience (9 items). (d) Habitudes d'étude : temps d'étude quotidien en minutes, affectation de groupe, temps d'utilisation quotidienne de l'IA en minutes (3 items). (e) Raisons du choix de groupe : 5-6 raisons évaluées par importance relative (pourcentage, totalisant environ 100 %) (6-10 items selon le groupe). (f) Méthodes d'apprentissage par IA (groupe IA uniquement) : conversation avec l'IA, réalisation de tâches, classe en RV, enseignant IA — chacune évaluée par part d'utilisation (5 items). (g) Raisons de l'intérêt pour la méthode d'apprentissage actuelle : 9-10 raisons évaluées par importance (10 items). (h) Qualité du feedback de l'IA et traitement (groupe IA uniquement) : évaluation catégorielle et réponse oui/non (2 items). (i) Amélioration globale auto-déclarée : estimation en pourcentage (1 item). (j) Importance des modalités sensorielles : 21 items couvrant les modalités visuelle, auditive, textuelle, gestuelle, spatiale, tactile, olfactive, gustative, sociale (3 sous-items), émotionnelle (2 sous-items), immersion en RV (2 sous-items) et immersion IA (2 sous-items), chacune évaluée de 0 à 100 %. (k) Capacité des modalités sensorielles : mêmes 21 items, évalués en termes de capacité personnelle (0-100 %). (l) Satisfaction du groupe et volonté de changer (4 items). (m) Attitudes envers l'IA : 14 énoncés évalués de 0 à 100 % d'accord. (n) Domaines d'amélioration : 10 domaines de compétences linguistiques évalués par amélioration relative (pourcentage, totalisant environ 100 %) (11 items).
2.3 Traitement des données
Les réponses ont été enregistrées sur une échelle de 0 à 100 %, avec 0 % indiquant « pas du tout » et 100 % « complètement » ou « exclusivement ». Pour les items nécessitant une répartition en pourcentage sur plusieurs options (par exemple, raisons du choix de groupe, domaines d'amélioration), les répondants ont reçu l'instruction que leurs évaluations devaient totaliser environ 100 %. Tous les répondants n'ont pas atteint une somme exacte ; nous rapportons les pourcentages bruts sans normalisation. Les valeurs manquantes ont été exclues par paires. Toutes les analyses statistiques ont été réalisées avec Python (statistiques descriptives, pas de tests inférentiels étant donné la nature exploratoire et la conception par auto-sélection).
3. Résultats
3.1 Temps d'étude quotidien et utilisation de l'IA
Les deux groupes ont rapporté des temps d'étude quotidiens similaires : moyenne du groupe IA 106 minutes (médiane 60, écart-type 103), moyenne du groupe humain 96 minutes (médiane 60, écart-type 90). Les écarts-types élevés reflètent une grande variation : certains étudiants étudiaient 10 minutes par jour, d'autres 360 minutes. Au sein du groupe IA, l'utilisation quotidienne moyenne de l'IA était de 32 minutes (médiane 15), suggérant que l'IA constituait environ 30 % du temps d'étude total, le reste étant consacré aux manuels, exercices ou autres méthodes non-IA.
3.2 Amélioration globale auto-déclarée
Le groupe avec enseignant humain a rapporté une amélioration globale plus élevée après un mois : moyenne 63,2 % (médiane 70 %, écart-type 27,5 %, n=42) contre une moyenne de 51,9 % pour le groupe IA (médiane 50 %, écart-type 18,1 %, n=82). Ce résultat est notable : malgré des temps d'étude similaires, les étudiants apprenant avec des enseignants humains ont perçu des progrès plus importants. Cependant, l'écart-type plus élevé du groupe humain (27,5 % contre 18,1 %) indique des expériences plus hétérogènes — certains étudiants du groupe humain ont rapporté une amélioration très élevée (jusqu'à 100 %), tandis que d'autres n'ont rapporté qu'un minimum de 5 %.
3.3 Qualité du feedback de l'IA
Parmi les participants du groupe IA, les perceptions de la qualité du feedback de l'IA étaient généralement positives : 38 % l'ont évaluée comme « très pertinente » (75-100 points), 54 % comme « acceptable » (50-74 points), et seulement 4 % comme « moyenne » (25-49 points). Aucun ne l'a évaluée comme médiocre. Trois quarts (76 %) ont déclaré traiter le feedback de l'IA rapidement, tandis que 18 % ne le faisaient pas.
3.4 Méthodes d'apprentissage par IA
Les méthodes d'apprentissage par IA les plus populaires étaient la conversation avec un logiciel d'IA (part d'utilisation moyenne de 68,6 %) et la demande à l'IA d'accomplir des tâches (66,3 %). La fonctionnalité d'enseignant IA a reçu une utilisation modérée (51,3 %), tandis que la classe en RV était la moins utilisée (31,9 %). Ce schéma suggère que l'IA conversationnelle — l'interaction libre avec un chatbot — domine l'apprentissage des langues assisté par l'IA actuel, les outils pédagogiques structurés d'IA jouant un rôle secondaire.
3.5 Motivations
Raisons du choix du groupe IA (évaluées par importance) :
1. Nouveauté / essayer de nouvelles choses : 75,4 %
2. Apprendre n'importe quand, n'importe où : 72,5 %
3. Expérience d'apprentissage immersive : 66,9 %
4. Lassitude des méthodes traditionnelles : 60,8 %
5. Moins cher que les enseignants humains : 59,9 %
Les deux principales motivations — la nouveauté et la flexibilité — suggèrent que les premiers adopteurs de l'IA sont davantage motivés par la curiosité et la commodité que par l'insatisfaction envers l'enseignement traditionnel.
Ce qui rend l'apprentissage par IA attractif (évalué par importance) :
1. Pas de peur de faire des erreurs / pression réduite : 76,6 %
2. Grande base de connaissances / sujets diversifiés : 74,7 %
3. Apprendre n'importe quand, n'importe où : 71,9 %
4. Rapidité de réponse : 70,4 %
5. Adaptation du niveau de difficulté : 67,8 %
6. Vitesse, volume et voix ajustables : 65,3 %
7. Plus d'encouragement : 64,5 %
8. Beaucoup moins cher : 59,4 %
9. Correction de prononciation plus précise : 58,5 %
L'avantage le mieux noté — « pas de peur de faire des erreurs » à 76,6 % — s'aligne sur un corpus substantiel de recherches sur l'anxiété en langue étrangère. Le chatbot d'IA crée ce que les enseignants de langues appellent un « environnement de pratique à faible anxiété » dans lequel les apprenants peuvent expérimenter sans gêne sociale.
Raisons du choix du groupe humain :
1. Préférence pour l'apprentissage avec de vraies personnes : 65,7 %
2. Stimule une réflexion plus approfondie : 63,8 %
3. Meilleur pour détecter les problèmes d'apprentissage : 63,6 %
4. Évaluation du niveau plus précise : 61,2 %
5. Méthodes de feedback plus diversifiées : 60,5 %
6. Communication émotionnelle dans le feedback : 58,2 %
7. Confiance dans l'enseignement traditionnel : 52,4 %
8. Ne pas vouloir changer de méthode : 52,3 %
9. L'IA n'est pas encore mature : 45,3 %
10. Affectation passive : 44,7 %
Les principales raisons du groupe humain sont centrées sur la profondeur relationnelle et cognitive : les enseignants humains offrent une connexion personnelle, une réflexion plus approfondie et une évaluation plus nuancée. Cela contraste avec l'accent mis par le groupe IA sur la commodité et le confort psychologique.
3.6 Domaines d'amélioration
Les étudiants ont évalué leur amélioration dans dix domaines de compétences linguistiques spécifiques. Les résultats révèlent une complémentarité frappante :
Domaines dans lesquels le groupe IA a rapporté une amélioration plus importante : - Expression orale : +12,6 points de pourcentage (IA 58,4 %, Humain 45,8 %) - Compréhension orale : +10,2 pp (IA 53,6 %, Humain 43,5 %) - Confiance en communication : +8,3 pp (IA 55,2 %, Humain 46,9 %) - Synonymes/expressions variées : +5,6 pp (IA 56,8 %, Humain 51,2 %)
Domaines dans lesquels le groupe humain a rapporté une amélioration plus importante : - Lecture : +14,0 pp (Humain 63,7 %, IA 49,8 %) - Grammaire : +10,1 pp (Humain 57,0 %, IA 46,9 %) - Syntaxe : +9,3 pp (Humain 57,1 %, IA 47,8 %) - Vocabulaire : +5,2 pp (Humain 60,7 %, IA 55,5 %) - Expression écrite : +5,0 pp (Humain 51,5 %, IA 46,5 %)
Le schéma est clair : l'apprentissage assisté par l'IA semble renforcer les compétences orales et interactives (expression orale, compréhension orale, confiance communicative), tandis que l'enseignement humain produit des gains plus importants dans les compétences structurelles et analytiques (lecture, grammaire, syntaxe). Ce résultat a des implications pédagogiques directes : l'IA et l'enseignement humain peuvent être plus efficaces non pas en tant que substituts mais en tant que compléments, chacun abordant différents aspects de la compétence linguistique.
3.7 Préférences de modalités sensorielles et sociales
Les participants ont évalué l'importance de douze modalités sensorielles et sociales pour leur apprentissage des langues. Plusieurs différences importantes sont apparues entre les groupes :
Modalités mieux notées par le groupe IA : - Perception auditive : +40,7 pp (IA 79,6 %, Humain 38,9 %) - Texte écrit : +37,4 pp (IA 74,5 %, Humain 37,1 %) - Motivation intrinsèque : +35,1 pp (IA 77,5 %, Humain 42,4 %) - Motivation extrinsèque : +30,0 pp (IA 69,1 %, Humain 39,1 %) - Perception visuelle : +29,3 pp (IA 74,6 %, Humain 45,2 %) - Émotions/motivation : +29,0 pp (IA 72,6 %, Humain 43,6 %) - Immersion environnementale : +20,6 pp (IA 69,9 %, Humain 49,3 %) - Dynamique de groupe : +17,7 pp (IA 64,6 %, Humain 46,9 %)
Modalités mieux notées par le groupe humain : - Goût : +32,1 pp (Humain 76,3 %, IA 44,2 %) - Immersion enseignant IA : +31,7 pp (Humain 83,9 %, IA 52,2 %) - Immersion en RV : +29,3 pp (Humain 83,0 %, IA 53,7 %) - Éthique de la RV : +29,3 pp (Humain 81,3 %, IA 52,0 %) - Immersion chatbot IA : +27,2 pp (Humain 79,4 %, IA 52,2 %) - Impressions sociales : +21,5 pp (Humain 81,5 %, IA 59,9 %) - Odorat : +16,0 pp (Humain 59,8 %, IA 43,8 %)
Ces résultats nécessitent une interprétation attentive. Le groupe IA a accordé une importance significativement plus grande aux modalités primaires d'apprentissage linguistique — visuelle, auditive et textuelle — ainsi qu'aux facteurs motivationnels. Le groupe humain, paradoxalement, a évalué l'immersion IA et RV comme plus importante que ne l'a fait le groupe IA. Une interprétation est que les étudiants du groupe humain, n'ayant pas directement expérimenté l'immersion IA, peuvent l'idéaliser, tandis que les étudiants du groupe IA, ayant utilisé les outils d'IA quotidiennement, sont plus mesurés dans leur évaluation.
L'évaluation plus élevée par le groupe humain des impressions sociales (81,5 % contre 59,9 %) est cohérente avec leur préférence déclarée pour l'apprentissage avec de vraies personnes et reflète l'importance de la présence sociale dans l'enseignement des langues — un facteur que les outils d'IA actuels, malgré des avancées rapides, ne peuvent pas pleinement reproduire.
3.8 Attitudes envers l'IA dans l'éducation et la société
Quatorze énoncés attitudinaux ont été évalués sur une échelle d'accord de 0 à 100 %. Les résultats révèlent un tableau nuancé :
Les deux groupes aiment fortement les enseignants humains : groupe IA 77,7 %, groupe humain 83,6 %. Même après un mois d'apprentissage assisté par l'IA, les étudiants du groupe IA conservent une forte appréciation de l'enseignement humain.
Le groupe IA est plus positif envers l'enseignement par l'IA : l'approbation de l'enseignant IA actuel était de 57,3 % (contre 38,2 % dans le groupe humain), et l'approbation d'un futur enseignant IA avancé était de 66,4 % (contre 53,3 %). Cependant, même dans le groupe IA, l'approbation de l'enseignant IA actuel (57,3 %) est nettement inférieure à l'approbation de l'enseignant humain (77,7 %).
Les deux groupes expriment la peur de la dépendance à l'IA : - « Peur que l'IA remplace la capacité de réflexion » : IA 60,1 %, Humain 61,0 % - « Peur du déclin des connaissances/compétences » : IA 60,6 %, Humain 66,5 % - « Peur de perdre l'indépendance / addiction à l'IA » : IA 59,6 %, Humain 71,6 %
Le groupe humain rapporte systématiquement une peur plus élevée de la dépendance à l'IA, avec l'écart le plus important sur l'addiction (71,6 % contre 59,6 %). Le groupe IA, peut-être grâce à l'expérience directe, a développé une vision plus modérée mais toujours prudente.
Les deux groupes approuvent fortement l'éthique de l'IA : « Besoin de contrôler l'IA avec l'éthique » a reçu 72,8 % (IA) et 68,7 % (Humain) d'accord.
Les deux groupes rejettent la domination de l'IA : « Laisser l'IA contrôler les humains » n'a reçu que 14,4 % (IA) et 21,5 % (Humain) d'accord. « Seulement des robots IA, pas d'humains, ça suffit » a reçu 15,2 % et 19,3 %. Ces résultats suggèrent que les étudiants universitaires chinois en 2025 maintiennent une orientation fermement humaniste : ils accueillent l'IA comme un outil mais la rejettent comme maître.
L'attachement romantique à l'IA ou aux enseignants est minimal : « Suis tombé amoureux d'une IA » a atteint environ 20 % dans les deux groupes, et « suis tombé amoureux d'un enseignant humain » a atteint 20-33 %. Ces chiffres bas suggèrent que l'interaction immersive avec l'IA n'a pas, pour cette cohorte, produit la dépendance émotionnelle que certains commentateurs avaient prédite. Le contexte culturel chinois peut être pertinent ici : l'orientation pragmatique envers l'IA comme outil plutôt que comme compagnon, combinée à des normes sociales claires concernant les relations humaines, peut fournir un tampon culturel contre l'attachement parasocial qui a été rapporté dans certaines études occidentales sur l'interaction humain-IA.
La volonté d'utiliser l'IA comme un dispositif d'économie de travail était modérée (environ 39 % dans les deux groupes), suggérant que la plupart des étudiants ne considèrent pas l'IA principalement comme un raccourci. Combiné avec le fort soutien au contrôle éthique de l'IA, ce schéma indique une cohorte qui considère l'IA comme utile mais limitée — une position sophistiquée qui contredit les stéréotypes sur les étudiants chinois comme adopteurs non critiques de la technologie.
3.9 Analyse détaillée des attitudes
Pour comprendre les attitudes nuancées plus clairement, nous pouvons regrouper les quatorze items attitudinaux en groupes thématiques :
Groupe A — Préférence d'enseignement : - « J'aime que l'enseignant humain m'enseigne » : IA 77,7 %, Humain 83,6 % - « J'aime que l'enseignant IA actuel m'enseigne » : IA 57,3 %, Humain 38,2 % - « J'aimerais un futur enseignant IA avancé » : IA 66,4 %, Humain 53,3 %
Les deux groupes préfèrent les enseignants humains, mais le groupe IA montre une ouverture significativement plus grande à l'enseignement par l'IA, tant actuel que futur. L'écart de 20 points entre l'approbation de l'enseignant humain (77,7 %) et celle de l'enseignant IA actuel (57,3 %) dans le groupe IA — après une expérience directe avec les outils d'IA — suggère que la familiarité engendre une appréciation qualifiée plutôt que de l'enthousiasme.
Groupe B — Peur de l'IA : - « Peur : l'IA remplace la capacité de réflexion » : IA 60,1 %, Humain 61,0 % - « Peur : déclin des connaissances/compétences » : IA 60,6 %, Humain 66,5 % - « Peur : perte d'indépendance, addiction à l'IA » : IA 59,6 %, Humain 71,6 % - « Pas peur : se concentrer sur d'autres domaines » : IA 55,7 %, Humain 53,4 %
Les deux groupes éprouvent une anxiété substantielle face à l'atrophie cognitive — une préoccupation que les données qualitatives de Fang Lu rendent vivante. La peur plus élevée de l'addiction dans le groupe humain (71,6 % contre 59,6 %) peut refléter une compréhension moins différenciée de ce qu'implique réellement l'interaction avec l'IA : l'inconnu est souvent plus effrayant que le connu.
Groupe C — Gouvernance de l'IA : - « Besoin de contrôler l'IA avec l'éthique » : IA 72,8 %, Humain 68,7 % - « Donner à l'IA la liberté de développer la prochaine génération » : IA 47,5 %, Humain 50,0 % - « Laisser l'IA contrôler les humains » : IA 14,4 %, Humain 21,5 % - « Seulement des robots IA, pas d'humains, ça suffit » : IA 15,2 %, Humain 19,3 %
Les attitudes de gouvernance révèlent une hiérarchie claire : fort soutien au contrôle éthique, ambivalence face à l'autonomie de l'IA et rejet ferme de la suprématie de l'IA. La cohérence entre les deux groupes suggère que ces attitudes reflètent un consensus générationnel plus large plutôt que des effets spécifiques au groupe.
3.10 Satisfaction du groupe et volonté de changer
Les deux groupes ont rapporté une satisfaction élevée envers leur affectation : groupe IA 80,9 % (médiane 80 %), groupe humain 76,7 % (médiane 85 %). Cependant, la volonté de changer de groupe raconte une autre histoire : 47 % du groupe IA et un remarquable 68 % du groupe humain ont exprimé leur volonté de changer. Le taux élevé de changement du groupe humain suggère que de nombreux étudiants du groupe humain sont curieux de l'apprentissage assisté par l'IA tout en étant satisfaits de leur expérience actuelle — cohérent avec le moment culturel plus large où l'IA est perçue comme nouvelle et attractive.
Parmi les répondants du groupe IA qui ont décrit leur préférence de changement, la réponse la plus courante était « Groupe IA : pratique » (便利), suggérant que ceux qui resteraient valorisaient l'accessibilité pratique par-dessus tout. Parmi les répondants du groupe humain, plusieurs ont articulé des positions réfléchies : « L'IA n'est pas encore mature » (AI不完善), « les méthodes d'enseignement humain me conviennent mieux » (human组的教学方法比较适合我), et notamment : « Je préfère explorer par moi-même. Les humains ne seront jamais remplacés par l'IA » (我更喜欢自己探索。人类永远不会被AI取代) — une déclaration qui résume la position humaniste partagée par la majorité des répondants.
4. Discussion
Les résultats dressent un tableau nuancé qui résiste aux conclusions simples. Nous organisons notre discussion autour de cinq thèmes : la complémentarité de l'IA et de l'enseignement humain, le dialogue avec les essais compagnons dans ce volume, le mécanisme de réduction de l'anxiété, les différences de modalités et les implications pour l'éducation comparative Europe-Chine.
4.1 La thèse de la complémentarité
Notre résultat central — que l'apprentissage assisté par l'IA renforce les compétences orales interactives tandis que l'enseignement humain renforce les compétences analytiques structurelles — soutient ce que nous appelons la Thèse de la Complémentarité : l'IA et l'enseignement humain ne sont pas des substituts mais des compléments, chacun étant mieux adapté à différentes dimensions de la compétence linguistique. Ce résultat remet en question tant la position techno-optimiste (selon laquelle l'IA remplacera les enseignants humains) que la position techno-pessimiste (selon laquelle l'IA ne peut pas enseigner efficacement).
Le mécanisme est plausible et ancré dans la théorie établie de l'acquisition des langues secondes. Les chatbots d'IA fournissent une pratique conversationnelle illimitée, patiente et exempte de jugement — précisément les conditions qui favorisent la fluidité en expression orale et la compréhension orale. Cela s'aligne avec l'Hypothèse de l'Interaction de Long (1996), qui postule que l'interaction conversationnelle — incluant la négociation du sens, les reformulations et les vérifications de compréhension — favorise l'acquisition linguistique. Les chatbots d'IA fournissent une interaction abondante, quoique sans les mouvements interactionnels humains que Long soulignait. Les enseignants humains fournissent un enseignement structuré, une analyse des erreurs et une explication métalinguistique — précisément les conditions qui favorisent la précision grammaticale, la compréhension en lecture et la conscience syntaxique. Cela s'aligne avec l'Hypothèse de la Production de Swain (2000), qui soutient que les apprenants ont besoin non seulement d'un input compréhensible mais aussi d'occasions de produire la langue et de recevoir un feedback correctif qui les pousse au-delà de leur compétence actuelle.
La Thèse de la Complémentarité a des implications pratiques : plutôt que de débattre si l'IA devrait remplacer les enseignants humains (une question à laquelle nos données répondent clairement : non), les éducateurs devraient se demander comment l'IA et l'enseignement humain peuvent être orchestrés pour servir différents objectifs d'apprentissage au sein d'un curriculum unifié.
4.2 Dialogue avec Fang Lu
L'étude qualitative de Fang Lu (dans ce volume) identifie un risque critique de l'apprentissage des langues assisté par l'IA : l'érosion potentielle de la pensée critique, de la créativité et du jugement indépendant. Ses études de cas — un étudiant élémentaire dont l'écriture assistée par l'IA était structurellement parfaite mais intellectuellement superficielle, et un étudiant avancé dont la traduction assistée par l'IA était fluide mais manquait de nuance culturelle — illustrent le phénomène de « tirer sur les pousses pour les faire pousser plus vite » (拔苗助长) : l'IA accélère la performance de surface tout en sapant le développement cognitif plus profond.
Nos données quantitatives soutiennent et complexifient à la fois les résultats de Fang Lu. L'amélioration plus importante du groupe humain en grammaire et en syntaxe — des compétences nécessitant un raisonnement analytique plutôt qu'une reproduction de modèles — est cohérente avec sa préoccupation que l'IA puisse contourner plutôt que développer les compétences cognitives. Cependant, l'amélioration plus importante du groupe IA en confiance communicative suggère que l'IA remplit une fonction authentique et importante que l'enseignement humain échoue souvent à fournir : créer un espace psychologiquement sûr pour la pratique orale.
L'implication n'est pas que l'IA devrait être évitée mais que son rôle devrait être soigneusement défini. L'IA semble plus bénéfique pour le développement de la fluidité et la réduction de l'anxiété ; l'enseignement humain semble plus bénéfique pour le développement de la précision et la pensée analytique. Un curriculum bien conçu déploierait les deux.
4.3 Dialogue avec Ole Döring
L'article philosophique de Döring (dans ce volume) remet en question le concept même d'« intelligence artificielle » appliqué à l'enseignement, arguant que la distinction de la tradition philosophique allemande entre Vernunft (raison, jugement) et Verstand (entendement, calcul) révèle une erreur de catégorie fondamentale dans les affirmations selon lesquelles les machines peuvent « enseigner ». Ce que font les machines, selon Döring, c'est traiter — et non comprendre, juger ou se soucier.
Nos données attitudinales résonnent avec l'analyse de Döring. Lorsque les étudiants disent qu'ils « aiment » les enseignants humains à 78-84 % mais n'« aiment » les enseignants IA qu'à 38-57 %, ils répondent peut-être précisément à la distinction que Döring identifie : l'enseignant humain offre la Vernunft — jugement, attention, compréhension de l'apprenant individuel — tandis que l'IA offre le Verstand — calcul, reconnaissance de motifs, recherche d'informations. Les deux sont utiles, mais ils ne sont pas équivalents.
Le fort soutien des étudiants au contrôle éthique de l'IA (70 %+) et leur fort rejet de la domination de l'IA (<20 %) soutiennent davantage la position humaniste de Döring. Ces 133 étudiants universitaires chinois, tout en utilisant les outils d'IA avec enthousiasme, maintiennent une frontière conceptuelle claire entre l'agentivité humaine et celle de la machine.
4.4 L'environnement sans pression
L'avantage le mieux noté de l'apprentissage par IA — « pas de peur de faire des erreurs » à 76,6 % — mérite une attention particulière. L'anxiété en langue étrangère est l'une des barrières les plus largement documentées à l'acquisition linguistique. Les environnements de classe traditionnels, avec leurs dynamiques sociales inhérentes de performance, de jugement et de face, créent une anxiété qui inhibe la pratique, en particulier la pratique orale. Le chatbot d'IA contourne entièrement cela : il n'y a pas de public, pas de jugement, pas de perte de face.
Ce résultat suggère que la principale contribution éducative de l'IA pourrait ne pas être en tant qu'enseignant mais en tant que partenaire de pratique — un interlocuteur infatigable, patient, qui ne juge jamais, ne perd jamais patience et ne génère jamais d'anxiété sociale. Si cela est correct, le modèle éducatif optimal n'est pas « l'IA au lieu des enseignants humains » mais « l'IA en complément des enseignants humains », spécifiquement pour la composante de pratique de l'apprentissage des langues où l'anxiété inhibe le plus la performance.
4.5 Différences de modalités et leurs implications
Les grandes différences dans les préférences de modalités sensorielles entre les groupes — les étudiants IA valorisant davantage les inputs visuels, auditifs et textuels, les étudiants humains valorisant davantage les impressions sociales, l'immersion en RV et les sens physiques — suggèrent que les deux groupes peuvent avoir des orientations d'apprentissage fondamentalement différentes. Les étudiants du groupe IA semblent être des apprenants à orientation cognitive qui privilégient les canaux d'input informationnels. Les étudiants du groupe humain semblent être des apprenants à orientation sociale et physique qui privilégient l'expérience relationnelle et incarnée.
Que ces différences soient des causes ou des conséquences du choix de groupe reste incertain. Les étudiants qui préfèrent les canaux d'input cognitifs ont pu sélectionner le groupe IA parce que les outils d'IA fournissent précisément ces canaux. Alternativement, un mois d'apprentissage assisté par l'IA peut avoir habitué les étudiants à valoriser l'input cognitif par rapport à l'expérience sociale. Une recherche longitudinale serait nécessaire pour démêler ces possibilités.
5.6 Implications pour l'éducation comparative Europe-Chine
Nos résultats ont une pertinence spécifique pour le dialogue éducatif européen-chinois que ce volume aborde. L'enseignement européen des langues, façonné par le Cadre européen commun de référence pour les langues (CECRL) et l'approche communicative, a traditionnellement mis l'accent sur la compétence orale, l'interaction et l'apprentissage par tâches. L'enseignement chinois des langues, façonné par une culture axée sur les examens et la pédagogie grammaticale-traductive, a traditionnellement mis l'accent sur la lecture, l'écriture, la grammaire et le vocabulaire. L'émergence de l'IA comme partenaire de pratique peut aider à combler cet écart : les étudiants chinois qui manquent d'occasions de pratique orale authentique avec des locuteurs humains peuvent utiliser l'IA pour développer les compétences communicatives que les approches pédagogiques européennes privilégient.
En même temps, l'accent européen sur la pensée critique, l'autonomie de l'apprenant et la pratique réflexive — des valeurs articulées dans le Plan d'action de l'UE pour l'éducation numérique (2021-2027) — fournit un contrepoids nécessaire au risque que la pratique par l'IA puisse développer la fluidité sans la profondeur. Les études de cas de Fang Lu illustrent ce risque concrètement : l'étudiant dont l'écriture assistée par l'IA était fluide mais intellectuellement vide avait développé une compétence de surface sans l'engagement cognitif plus profond que l'interaction humaine favorise.
Un modèle européen-chinois d'enseignement des langues intégrant l'IA pourrait donc combiner l'adoption enthousiaste des outils d'IA par les étudiants chinois avec les cadres pédagogiques européens qui insistent sur la pensée critique et la pratique réflexive. La technologie fournit le médium ; la pédagogie fournit la finalité.
5.7 Recommandations pour la pratique
Sur la base de nos résultats, nous offrons quatre recommandations aux éducateurs envisageant l'intégration de l'IA dans l'enseignement des langues étrangères :
Premièrement, utiliser l'IA pour la pratique orale, non comme remplacement de l'enseignement. Les données suggèrent que la plus grande contribution de l'IA est dans le développement de la fluidité en expression orale et de la confiance communicative grâce à une pratique conversationnelle à faible anxiété. Cette fonction complète plutôt qu'elle ne remplace l'enseignement humain.
Deuxièmement, maintenir l'enseignement humain pour les compétences analytiques. La grammaire, la syntaxe, la compréhension en lecture et l'écriture — les compétences qui ont montré une amélioration plus importante dans le groupe humain — semblent bénéficier de l'enseignement structuré, explicatif et correctif que fournissent les enseignants humains.
Troisièmement, aborder l'anxiété des étudiants face à l'IA de manière proactive. Plus de 60 % des étudiants dans les deux groupes ont exprimé la peur que l'IA remplace leur capacité de réflexion ou érode leurs compétences. Ces préoccupations sont légitimes et devraient être abordées par une discussion explicite des limites de l'IA, des cadres éthiques pour l'utilisation de l'IA et des devoirs qui exigent une pensée critique indépendante.
Quatrièmement, concevoir des évaluations que l'IA ne peut pas contourner. Comme l'illustrent les cas de Fang Lu, l'IA peut produire des résultats soignés qui masquent une compréhension superficielle. Les évaluations devraient inclure des examens oraux, des réponses spontanées et des tâches qui nécessitent un véritable raisonnement analytique — des domaines où l'assistance de l'IA est soit indisponible soit visiblement artificielle.
6. Limites
Plusieurs limites restreignent l'interprétation de ces résultats :
Premièrement, l'étude repose entièrement sur des données auto-déclarées. Les perceptions des étudiants quant à leur amélioration peuvent ne pas correspondre à leur amélioration réelle telle que mesurée par des tests standardisés. Un design de recherche avec pré-test et post-test fournirait des preuves plus robustes.
Deuxièmement, l'affectation non aléatoire des groupes introduit un biais d'auto-sélection. Les étudiants qui ont choisi le groupe IA peuvent différer systématiquement de ceux qui ont choisi ou ont été affectés au groupe humain — en termes de littératie technologique, de motivation d'apprentissage, de personnalité ou d'autres variables non mesurées. Le pourcentage plus élevé d'hommes dans le groupe IA (26 % contre 11 %) et la plage d'âge plus large suggèrent certaines différences démographiques, bien que la signification pratique de ces différences pour les résultats d'apprentissage linguistique soit incertaine.
Troisièmement, la période d'observation d'un mois est courte. L'apprentissage des langues est un processus à long terme, et les avantages relatifs de l'IA par rapport à l'enseignement humain peuvent évoluer sur des périodes plus longues. L'avantage du groupe IA en expression orale peut être un gain de fluidité initial qui plafonne, tandis que l'avantage du groupe humain en grammaire peut se cumuler au fil du temps.
Quatrièmement, l'échantillon est entièrement composé d'étudiants universitaires chinois, majoritairement féminins, étudiant l'anglais ou l'allemand. La généralisabilité à d'autres contextes culturels, groupes d'âge, genres ou langues cibles est incertaine. La spécificité culturelle de nos résultats devrait être soulignée : l'accent de la culture de classe chinoise sur la préservation de la face et l'autorité de l'enseignant peut amplifier les bénéfices de réduction de l'anxiété de l'IA d'une manière qui serait moins prononcée dans des cultures avec des relations enseignant-étudiant plus informelles.
Cinquièmement, toutes les mesures sont auto-déclarées. Les données sur les « domaines d'amélioration » (Section 4.6) représentent les perceptions des étudiants quant à leurs domaines d'amélioration, et non des gains mesurés objectivement. Les étudiants peuvent surestimer l'amélioration dans les domaines qu'ils ont le plus pratiqués (confondant pratique et progrès) ou sous-estimer l'amélioration dans les domaines où les gains sont moins consciemment perçus.
Sixièmement, l'enquête a été menée à un seul moment. Des données longitudinales — suivant la motivation, les attitudes et les résultats sur un semestre ou une année complète — fourniraient un tableau plus riche. Une étude de suivi avec les mêmes participants après six mois ou un an d'étude continue serait particulièrement précieuse pour tester si la Thèse de la Complémentarité se maintient sur des périodes d'apprentissage plus longues.
Malgré ces limites, l'étude offre l'une des investigations comparatives à plus grand échantillon de l'apprentissage des langues assisté par l'IA par rapport à l'enseignement humain disponibles à ce jour, et la largeur de l'instrument d'enquête — couvrant la motivation, les préférences de modalités, les attitudes et l'amélioration par compétences spécifiques — fournit un tableau multidimensionnel que la plupart des études existantes ne présentent pas.
6. Conclusion
Cette étude portant sur 133 étudiants universitaires chinois apprenant des langues étrangères avec l'assistance de l'IA (n=85) et avec des enseignants humains (n=48) produit quatre résultats principaux :
Premièrement, les étudiants enseignés par des humains ont rapporté une amélioration globale plus élevée (63,2 % contre 51,9 %), mais le schéma est spécifique aux compétences : les étudiants assistés par l'IA se sont davantage améliorés en expression orale (+12,6 pp), en compréhension orale (+10,2 pp) et en confiance communicative (+8,3 pp), tandis que les étudiants enseignés par des humains se sont davantage améliorés en lecture (+14,0 pp), en grammaire (+10,1 pp) et en syntaxe (+9,3 pp). Cela soutient une Thèse de la Complémentarité : l'IA et l'enseignement humain remplissent des fonctions différentes et complémentaires dans l'enseignement des langues.
Deuxièmement, l'avantage principal perçu de l'apprentissage par IA n'est pas informationnel mais psychologique : « pas de peur de faire des erreurs » a été noté le plus haut à 76,6 %. La plus grande contribution de l'IA à l'enseignement des langues pourrait être la création d'un environnement sans pression pour la pratique orale — répondant à l'une des barrières les plus persistantes à l'acquisition linguistique.
Troisièmement, les deux groupes maintiennent des attitudes fortement humanistes. Même après un mois d'apprentissage assisté par l'IA, les étudiants du groupe IA évaluent les enseignants humains plus haut que les enseignants IA (77,7 % contre 57,3 %). Les deux groupes approuvent le contrôle éthique de l'IA (>68 %) et rejettent la domination de l'IA sur les humains (<22 %).
Quatrièmement, la valorisation paradoxalement plus élevée de l'immersion IA et RV par le groupe humain suggère une curiosité envers des technologies qu'ils n'ont pas expérimentées, tandis que l'évaluation plus mesurée du groupe IA reflète l'effet modérateur de l'utilisation réelle.
Ces résultats ont des implications claires pour la conception éducative. Les preuves ne soutiennent ni le remplacement des enseignants humains par l'IA, ni l'exclusion de l'IA de l'enseignement des langues. Au contraire, elles pointent vers un modèle intégré dans lequel l'IA sert de partenaire de pratique complémentaire — fournissant la pratique conversationnelle illimitée et exempte de jugement qui développe la fluidité orale et la confiance communicative — tandis que les enseignants humains fournissent l'enseignement structuré, l'orientation analytique et la présence sociale qui développent la compétence grammaticale, la compréhension en lecture et la pensée critique. Un tel modèle honorerait à la fois les possibilités technologiques documentées dans nos données et les préoccupations philosophiques articulées par Döring et les mises en garde pédagogiques articulées par Fang Lu.
Ces résultats ont des implications claires pour la conception éducative. Les preuves ne soutiennent ni le remplacement des enseignants humains par l'IA, ni l'exclusion de l'IA de l'enseignement des langues. Au contraire, elles pointent vers un modèle intégré qui exploite les forces complémentaires des deux : l'IA pour le développement de la fluidité et la réduction de l'anxiété, les enseignants humains pour le développement de la précision et la pensée critique. À mesure que les capacités de l'IA continuent de progresser, la question ne sera pas de savoir si l'on doit utiliser l'IA dans l'enseignement des langues, mais comment l'utiliser judicieusement — une question qui nécessite une recherche empirique continue, une réflexion philosophique et une innovation pédagogique.
Remerciements
Cofinancé par l'Union européenne. Les points de vue et opinions exprimés sont toutefois ceux de l'auteur uniquement et ne reflètent pas nécessairement ceux de l'Union européenne [101126782].
Nous remercions les étudiants participants pour leurs réponses franches et les collègues qui ont administré l'enquête.
Références
Chapelle, C. A. (2001). Computer Applications in Second Language Acquisition. Cambridge University Press.
Döring, O. (dans ce volume). AI and pedagogy: Between artificial intelligence and human understanding.
Garrett, N. (2009). Computer-assisted language learning trends and issues revisited: Integrating innovation. The Modern Language Journal, 93(s1), 719–740.
Godwin-Jones, R. (2015). Contributing, creating, curating: Digital literacies for language learners. Language Learning & Technology, 19(3), 8–20.
Golonka, E. M., Bowles, A. R., Frank, V. M., Richardson, D. L., & Freynik, S. (2014). Technologies for foreign language learning: A review of technology types and their effectiveness. Computer Assisted Language Learning, 27(1), 70–105.
Horwitz, E. K., Horwitz, M. B., & Cope, J. (1986). Foreign language classroom anxiety. The Modern Language Journal, 70(2), 125–132.
Huang, W., Hew, K. F., & Fryer, L. K. (2022). Chatbots for language learning — Are they really useful? A systematic review of chatbot-supported language learning. Journal of Computer Assisted Learning, 38(1), 237–257.
Jeon, J. (2022). Exploring AI chatbot affordances in the EFL classroom: Young learners' experiences and perspectives. Computer Assisted Language Learning, 37(1–2), 1–26.
Kim, N. Y. (2019). A study on the use of artificial intelligence chatbots for improving English grammar skills. Journal of Digital Convergence, 17(8), 37–46.
Krashen, S. D. (1982). Principles and Practice in Second Language Acquisition. Pergamon Press.
Lai, C., & Zheng, D. (2018). Self-directed use of mobile devices for language learning beyond the classroom. ReCALL, 30(3), 299–318.
Long, M. H. (1996). The role of the linguistic environment in second language acquisition. In W. C. Ritchie & T. K. Bhatia (Eds.), Handbook of Second Language Acquisition (pp. 413–468). Academic Press.
Lu, F. (dans ce volume). AI in Chinese teaching: Opportunities and challenges from the perspective of critical thinking.
MacIntyre, P. D., & Gardner, R. C. (1994). The subtle effects of language anxiety on cognitive processing in the second language. Language Learning, 44(2), 283–305.
Swain, M. (2000). The output hypothesis and beyond: Mediating acquisition through collaborative dialogue. In J. P. Lantolf (Ed.), Sociocultural Theory and Second Language Learning (pp. 97–114). Oxford University Press.
World Economic Forum. (2025). The Future of Jobs Report 2025. Geneva: WEF.