Difference between revisions of "Rethinking Higher Education/es/Chapter 5"
(Spanish translation) |
(Sentence-by-sentence review: full expansion to match English original) |
||
| Line 22: | Line 22: | ||
Este estudio aborda esa laguna. Encuestamos a 133 estudiantes universitarios chinos —85 que eligieron o fueron asignados a aprender una lengua extranjera con asistencia de IA, y 48 que aprendieron con profesores humanos— después de aproximadamente un mes de estudio. El instrumento de encuesta, que comprende 126 variables, captura datos demográficos, conocimiento lingüístico previo, tiempo de estudio diario, razones para la elección del grupo, métodos de uso de la IA, percepciones de calidad de la retroalimentación, autoevaluación de la mejora en diez áreas específicas de competencia, la importancia de doce modalidades sensoriales y sociales en el aprendizaje, y actitudes hacia catorce aspectos de la IA en la educación y la sociedad. | Este estudio aborda esa laguna. Encuestamos a 133 estudiantes universitarios chinos —85 que eligieron o fueron asignados a aprender una lengua extranjera con asistencia de IA, y 48 que aprendieron con profesores humanos— después de aproximadamente un mes de estudio. El instrumento de encuesta, que comprende 126 variables, captura datos demográficos, conocimiento lingüístico previo, tiempo de estudio diario, razones para la elección del grupo, métodos de uso de la IA, percepciones de calidad de la retroalimentación, autoevaluación de la mejora en diez áreas específicas de competencia, la importancia de doce modalidades sensoriales y sociales en el aprendizaje, y actitudes hacia catorce aspectos de la IA en la educación y la sociedad. | ||
| + | |||
| + | Nuestros hallazgos se sitúan dentro de un creciente corpus de trabajo sobre educación digital en China y Europa, incluyendo los estudios de caso cualitativos de Fang Lu (en este volumen), que examinó los efectos de la IA en el pensamiento crítico en cursos de lengua china en Boston College, y el análisis filosófico de Ole Döring (en este volumen), que interroga los fundamentos conceptuales de la «inteligencia artificial» en contextos pedagógicos. Donde Fang Lu proporciona profundidad a través de casos individuales y Döring ofrece amplitud filosófica, nosotros contribuimos con amplitud a través de la comparación cuantitativa en un grupo sustancial de participantes. | ||
'''2. Revisión de la literatura''' | '''2. Revisión de la literatura''' | ||
| Line 30: | Line 32: | ||
La aparición de los modelos de lenguaje de gran tamaño (LLM) —ChatGPT, Claude y sus equivalentes chinos Kimi, DeepSeek y Doubao— ha cambiado fundamentalmente el panorama. A diferencia de los chatbots anteriores que dependían de diálogos programados y coincidencia de palabras clave, los chatbots basados en LLM pueden sostener conversaciones abiertas y contextualmente apropiadas sobre prácticamente cualquier tema. Huang, Hew y Fryer (2022) realizaron una revisión sistemática del aprendizaje de lenguas con apoyo de chatbots y encontraron efectos positivos en la adquisición de vocabulario y la confianza en la expresión oral, pero señalaron que la mayoría de los estudios tenían muestras pequeñas, duraciones cortas y carecían de grupos de control. | La aparición de los modelos de lenguaje de gran tamaño (LLM) —ChatGPT, Claude y sus equivalentes chinos Kimi, DeepSeek y Doubao— ha cambiado fundamentalmente el panorama. A diferencia de los chatbots anteriores que dependían de diálogos programados y coincidencia de palabras clave, los chatbots basados en LLM pueden sostener conversaciones abiertas y contextualmente apropiadas sobre prácticamente cualquier tema. Huang, Hew y Fryer (2022) realizaron una revisión sistemática del aprendizaje de lenguas con apoyo de chatbots y encontraron efectos positivos en la adquisición de vocabulario y la confianza en la expresión oral, pero señalaron que la mayoría de los estudios tenían muestras pequeñas, duraciones cortas y carecían de grupos de control. | ||
| + | |||
| + | Jeon (2022) exploró las posibilidades de los chatbots de IA con jóvenes aprendices coreanos de inglés como lengua extranjera y encontró que los estudiantes apreciaban la paciencia, la disponibilidad y la naturaleza no enjuiciadora del chatbot —hallazgos que nuestros datos corroboran firmemente—. Kim (2019) informó de que la interacción con chatbots de IA mejoró las competencias gramaticales del inglés entre los estudiantes universitarios coreanos, un hallazgo que nuestros datos solo respaldan parcialmente (la mejora gramatical fue en realidad menor en nuestro grupo con IA). | ||
'''2.2 Ansiedad ante las lenguas extranjeras''' | '''2.2 Ansiedad ante las lenguas extranjeras''' | ||
| Line 36: | Line 40: | ||
La relevancia para el aprendizaje asistido por IA es directa. Si los chatbots de IA pueden reducir el filtro afectivo proporcionando un entorno de práctica libre de juicios, pueden permitir a los aprendices procesar y producir lengua más eficazmente de lo que lo harían en el contexto generador de ansiedad de un aula humana. Nuestros datos sugieren que este mecanismo está operando: la ventaja mejor valorada del grupo con IA fue «sin miedo a cometer errores» (76,6 %), y el grupo con IA informó una mayor mejora precisamente en aquellas competencias —expresión oral, comprensión auditiva, confianza comunicativa— que más se ven inhibidas por la ansiedad. | La relevancia para el aprendizaje asistido por IA es directa. Si los chatbots de IA pueden reducir el filtro afectivo proporcionando un entorno de práctica libre de juicios, pueden permitir a los aprendices procesar y producir lengua más eficazmente de lo que lo harían en el contexto generador de ansiedad de un aula humana. Nuestros datos sugieren que este mecanismo está operando: la ventaja mejor valorada del grupo con IA fue «sin miedo a cometer errores» (76,6 %), y el grupo con IA informó una mayor mejora precisamente en aquellas competencias —expresión oral, comprensión auditiva, confianza comunicativa— que más se ven inhibidas por la ansiedad. | ||
| + | |||
| + | '''2.3 El contexto chino''' | ||
| + | |||
| + | El panorama de la IA educativa en China es distintivo. El «Plan de Desarrollo de la Inteligencia Artificial de Nueva Generación» del gobierno chino (2017) y el plan «Modernización de la Educación 2035» identifican la IA como una prioridad estratégica para la reforma educativa. Los estudiantes chinos tienen acceso a una gama de herramientas de IA de desarrollo nacional —incluyendo Kimi (Moonshot AI), DeepSeek, Doubao (ByteDance) y Ernie (Baidu)— además de herramientas internacionales como ChatGPT (accesible a través de VPN). El contexto cultural también es relevante: la cultura del aula china tradicionalmente enfatiza la autoridad del profesor, la deferencia del estudiante y los comportamientos de preservación de la imagen que pueden inhibir la participación oral —precisamente las condiciones bajo las cuales el entorno libre de juicios de la IA puede ofrecer el mayor beneficio—. | ||
'''3. Diseño del estudio y metodología''' | '''3. Diseño del estudio y metodología''' | ||
| Line 41: | Line 49: | ||
'''3.1 Participantes''' | '''3.1 Participantes''' | ||
| − | Un total de 133 estudiantes universitarios chinos participaron en el estudio. El grupo con IA comprendió 85 participantes (74 % mujeres, 26 % hombres; edad media 23,8 años, rango 19-38). El grupo con profesor humano comprendió 48 participantes (89 % mujeres, 11 % hombres; edad media 23,1 años, rango 20-32). Todos los participantes estaban matriculados en universidades chinas, estudiando predominantemente inglés (IA: 38 %, Humano: 29 %) o alemán (IA: 16 %, Humano: 25 %) como especialidad de lengua extranjera. | + | Un total de 133 estudiantes universitarios chinos participaron en el estudio. El grupo con IA comprendió 85 participantes (74 % mujeres, 26 % hombres; edad media 23,8 años, rango 19-38). El grupo con profesor humano comprendió 48 participantes (89 % mujeres, 11 % hombres; edad media 23,1 años, rango 20-32). Todos los participantes estaban matriculados en universidades chinas, estudiando predominantemente inglés (IA: 38 %, Humano: 29 %) o alemán (IA: 16 %, Humano: 25 %) como especialidad de lengua extranjera. El desequilibrio de género —más pronunciado en el grupo humano— refleja la demografía general de los departamentos de lenguas extranjeras en las universidades chinas. |
| − | Los participantes no fueron asignados aleatoriamente. Algunos eligieron su grupo; otros fueron asignados (el 44,7 % del grupo humano informó asignación pasiva). Esta autoselección introduce un factor de confusión potencial: los estudiantes que eligieron el grupo con IA pueden haber sido más curiosos tecnológicamente o más insatisfechos con la instrucción tradicional. Abordamos esta limitación en la Sección | + | Los participantes no fueron asignados aleatoriamente. Algunos eligieron su grupo; otros fueron asignados (el 44,7 % del grupo humano informó asignación pasiva). Esta autoselección introduce un factor de confusión potencial: los estudiantes que eligieron el grupo con IA pueden haber sido más curiosos tecnológicamente o más insatisfechos con la instrucción tradicional. Abordamos esta limitación en la Sección 6. |
'''3.2 Instrumento de encuesta''' | '''3.2 Instrumento de encuesta''' | ||
| Line 49: | Line 57: | ||
La encuesta se administró en chino a través de una plataforma de cuestionarios en línea (问卷星) el 28 de marzo de 2025. Comprendió las siguientes secciones: | La encuesta se administró en chino a través de una plataforma de cuestionarios en línea (问卷星) el 28 de marzo de 2025. Comprendió las siguientes secciones: | ||
| − | (a) Datos demográficos: nombre (anonimizado antes del análisis), fecha de nacimiento, género (5 ítems). (b) Competencia lingüística previa: niveles MCER autoevaluados para chino, inglés, alemán, francés, japonés, coreano y hasta tres idiomas adicionales (9 ítems). (c) Lengua de estudio y nivel inicial: misma estructura que (b) pero para la lengua estudiada en el experimento (9 ítems). (d) Hábitos de estudio: tiempo diario de estudio en minutos, asignación de grupo, tiempo diario de uso de IA en minutos (3 ítems). (e) Razones para la elección del grupo: 5-6 razones valoradas por importancia relativa (porcentaje, sumando aproximadamente 100 %) (6-10 ítems según el grupo). (f) Métodos de aprendizaje con IA (solo grupo con IA): chatear con IA, completar tareas, aula VR, profesor IA — cada uno valorado por cuota de uso (5 ítems). (g) Razones de interés en el método actual: 9-10 razones valoradas por importancia (10 ítems). (h) Calidad y manejo de la retroalimentación de la IA (solo grupo con IA): valoración categórica y respuesta sí/no (2 ítems). (i) Mejora general autoinformada: estimación porcentual (1 ítem). (j) Importancia de la modalidad sensorial: 21 ítems. (k) Capacidad de modalidad sensorial: mismos 21 ítems (0-100 %). (l) Satisfacción con el grupo y disposición a cambiar (4 ítems). (m) Actitudes hacia la IA: 14 afirmaciones valoradas 0-100 % de acuerdo. (n) Áreas de mejora: 10 áreas de competencia lingüística valoradas por mejora relativa (porcentaje, sumando aproximadamente 100 %) (11 ítems). | + | (a) Datos demográficos: nombre (anonimizado antes del análisis), fecha de nacimiento, género (5 ítems). (b) Competencia lingüística previa: niveles MCER autoevaluados para chino, inglés, alemán, francés, japonés, coreano y hasta tres idiomas adicionales (9 ítems). (c) Lengua de estudio y nivel inicial: misma estructura que (b) pero para la lengua estudiada en el experimento (9 ítems). (d) Hábitos de estudio: tiempo diario de estudio en minutos, asignación de grupo, tiempo diario de uso de IA en minutos (3 ítems). (e) Razones para la elección del grupo: 5-6 razones valoradas por importancia relativa (porcentaje, sumando aproximadamente 100 %) (6-10 ítems según el grupo). (f) Métodos de aprendizaje con IA (solo grupo con IA): chatear con IA, completar tareas, aula VR, profesor IA — cada uno valorado por cuota de uso (5 ítems). (g) Razones de interés en el método actual: 9-10 razones valoradas por importancia (10 ítems). (h) Calidad y manejo de la retroalimentación de la IA (solo grupo con IA): valoración categórica y respuesta sí/no (2 ítems). (i) Mejora general autoinformada: estimación porcentual (1 ítem). (j) Importancia de la modalidad sensorial: 21 ítems que cubren percepción visual, auditiva, textual, gestual, espacial, táctil, olfativa, gustativa, social (3 subítems), emocional (2 subítems), inmersión RV (2 subítems) e inmersión IA (2 subítems), cada uno valorado 0-100 %. (k) Capacidad de modalidad sensorial: mismos 21 ítems, valorados por capacidad personal (0-100 %). (l) Satisfacción con el grupo y disposición a cambiar (4 ítems). (m) Actitudes hacia la IA: 14 afirmaciones valoradas 0-100 % de acuerdo. (n) Áreas de mejora: 10 áreas de competencia lingüística valoradas por mejora relativa (porcentaje, sumando aproximadamente 100 %) (11 ítems). |
| + | |||
| + | '''3.3 Procesamiento de datos''' | ||
| + | |||
| + | Las respuestas se registraron en una escala de 0-100 %, donde 0 % indica «nada en absoluto» y 100 % «completamente» o «exclusivamente». Para los ítems que requerían asignación porcentual entre múltiples opciones (p. ej., razones para la elección del grupo, áreas de mejora), se indicó a los encuestados que sus valoraciones debían sumar aproximadamente 100 %. No todos los encuestados lograron una suma exacta; informamos de los porcentajes brutos sin normalización. Los valores faltantes se excluyeron por pares. Todos los análisis estadísticos se realizaron utilizando Python (estadística descriptiva, sin pruebas inferenciales dado el carácter exploratorio y el diseño de autoselección). | ||
'''4. Resultados''' | '''4. Resultados''' | ||
| Line 55: | Line 67: | ||
'''4.1 Tiempo de estudio diario y uso de la IA''' | '''4.1 Tiempo de estudio diario y uso de la IA''' | ||
| − | Ambos grupos informaron tiempos de estudio diarios similares: grupo con IA media 106 minutos (mediana 60, DE 103), grupo humano media 96 minutos (mediana 60, DE 90). Las elevadas desviaciones estándar reflejan una amplia variación: algunos estudiantes estudiaban 10 minutos diarios, otros 360. Dentro del grupo con IA, el uso diario medio de IA fue de 32 minutos (mediana 15), lo que sugiere que la IA constituía aproximadamente el 30 % del tiempo total de estudio. | + | Ambos grupos informaron tiempos de estudio diarios similares: grupo con IA media 106 minutos (mediana 60, DE 103), grupo humano media 96 minutos (mediana 60, DE 90). Las elevadas desviaciones estándar reflejan una amplia variación: algunos estudiantes estudiaban 10 minutos diarios, otros 360. Dentro del grupo con IA, el uso diario medio de IA fue de 32 minutos (mediana 15), lo que sugiere que la IA constituía aproximadamente el 30 % del tiempo total de estudio, dedicando el resto a libros de texto, ejercicios u otros métodos sin IA. |
'''4.2 Mejora general autoinformada''' | '''4.2 Mejora general autoinformada''' | ||
| − | El grupo con profesor humano informó una mejora general mayor después de un mes: media 63,2 % (mediana 70 %, DE 27,5 %, n=42) frente a la media del grupo con IA de 51,9 % (mediana 50 %, DE 18,1 %, n=82). Este hallazgo es notable: a pesar de tiempos de estudio similares, los estudiantes que aprendían con profesores humanos percibieron un mayor progreso. Sin embargo, la mayor desviación estándar del grupo humano (27,5 % frente a 18,1 %) indica experiencias más heterogéneas | + | El grupo con profesor humano informó una mejora general mayor después de un mes: media 63,2 % (mediana 70 %, DE 27,5 %, n=42) frente a la media del grupo con IA de 51,9 % (mediana 50 %, DE 18,1 %, n=82). Este hallazgo es notable: a pesar de tiempos de estudio similares, los estudiantes que aprendían con profesores humanos percibieron un mayor progreso. Sin embargo, la mayor desviación estándar del grupo humano (27,5 % frente a 18,1 %) indica experiencias más heterogéneas —algunos estudiantes del grupo humano informaron de una mejora muy alta (hasta el 100 %), mientras que otros informaron de tan solo el 5 %—. |
| − | |||
| − | |||
| − | + | '''4.3 Calidad de la retroalimentación de la IA''' | |
| − | + | Entre los participantes del grupo con IA, las percepciones de la calidad de la retroalimentación de la IA fueron generalmente positivas: el 38 % la calificó como «muy pertinente» (75-100 puntos), el 54 % como «aceptable» (50-74 puntos) y solo el 4 % como «regular» (25-49 puntos). Ninguno la calificó como deficiente. Tres cuartos (76 %) informaron de que gestionaban la retroalimentación de la IA de manera oportuna, mientras que el 18 % no lo hacía. | |
| − | + | '''4.4 Métodos de aprendizaje con IA''' | |
| − | + | Los métodos de aprendizaje con IA más populares fueron chatear con el software de IA (cuota media de uso 68,6 %) y pedir a la IA que completara tareas (66,3 %). La funcionalidad de profesor de IA recibió un uso moderado (51,3 %), mientras que el aula de RV fue la menos utilizada (31,9 %). Este patrón sugiere que la IA conversacional —la interacción libre con el chatbot— domina el aprendizaje de lenguas asistido por IA en la actualidad, con herramientas pedagógicas de IA estructuradas desempeñando un papel secundario. | |
| − | '''4. | + | '''4.5 Motivaciones''' |
Razones para elegir el grupo con IA (valoradas por importancia): | Razones para elegir el grupo con IA (valoradas por importancia): | ||
| Line 84: | Line 94: | ||
'''5. Más barato que los profesores humanos: 59,9 %''' | '''5. Más barato que los profesores humanos: 59,9 %''' | ||
| + | |||
| + | Las dos principales motivaciones —la novedad y la flexibilidad— sugieren que los primeros adoptantes de la IA están impulsados más por la curiosidad y la conveniencia que por la insatisfacción con la enseñanza tradicional. | ||
Lo que hace atractivo el aprendizaje con IA (valorado por importancia): | Lo que hace atractivo el aprendizaje con IA (valorado por importancia): | ||
| Line 96: | Line 108: | ||
'''5. Ajuste adaptativo de la dificultad: 67,8 %''' | '''5. Ajuste adaptativo de la dificultad: 67,8 %''' | ||
| + | |||
| + | '''6. Velocidad, volumen y voz ajustables: 65,3 %''' | ||
| + | |||
| + | '''7. Más estímulo: 64,5 %''' | ||
| + | |||
| + | '''8. Mucho más barato: 59,4 %''' | ||
| + | |||
| + | '''9. Corrección de pronunciación más precisa: 58,5 %''' | ||
La ventaja mejor valorada —«sin miedo a cometer errores» con un 76,6 %— se alinea con un corpus sustancial de investigación sobre la ansiedad ante las lenguas extranjeras. El chatbot de IA crea lo que los educadores lingüísticos llaman un «entorno de práctica de baja ansiedad» en el que los aprendices pueden experimentar sin vergüenza social. | La ventaja mejor valorada —«sin miedo a cometer errores» con un 76,6 %— se alinea con un corpus sustancial de investigación sobre la ansiedad ante las lenguas extranjeras. El chatbot de IA crea lo que los educadores lingüísticos llaman un «entorno de práctica de baja ansiedad» en el que los aprendices pueden experimentar sin vergüenza social. | ||
| − | '''4.5 Actitudes hacia la IA en la educación y la sociedad''' | + | Razones para elegir el grupo humano: |
| + | |||
| + | '''1. Preferencia por aprender con personas reales: 65,7 %''' | ||
| + | |||
| + | '''2. Estimula un pensamiento más profundo: 63,8 %''' | ||
| + | |||
| + | '''3. Mejor detección de problemas de aprendizaje: 63,6 %''' | ||
| + | |||
| + | '''4. Evaluación de nivel más precisa: 61,2 %''' | ||
| + | |||
| + | '''5. Métodos de retroalimentación más diversos: 60,5 %''' | ||
| + | |||
| + | '''6. Comunicación emocional en la retroalimentación: 58,2 %''' | ||
| + | |||
| + | '''7. Confianza en la enseñanza tradicional: 52,4 %''' | ||
| + | |||
| + | '''8. No querer cambiar de método: 52,3 %''' | ||
| + | |||
| + | '''9. La IA aún no está madura: 45,3 %''' | ||
| + | |||
| + | '''10. Asignación pasiva: 44,7 %''' | ||
| + | |||
| + | Las principales razones del grupo humano se centran en la profundidad relacional y cognitiva: los profesores humanos ofrecen conexión personal, pensamiento más profundo y evaluación más matizada. Esto contrasta con el énfasis del grupo con IA en la comodidad y el confort psicológico. | ||
| + | |||
| + | '''4.6 Áreas de mejora''' | ||
| + | |||
| + | Los estudiantes evaluaron su mejora en diez áreas específicas de competencia lingüística. Los resultados revelan una complementariedad notable: | ||
| + | |||
| + | Áreas donde el grupo con IA informó mayor mejora: - Expresión oral: +12,6 puntos porcentuales (IA 58,4 %, Humano 45,8 %) - Comprensión auditiva: +10,2 pp (IA 53,6 %, Humano 43,5 %) - Confianza en la comunicación: +8,3 pp (IA 55,2 %, Humano 46,9 %) - Sinónimos/expresiones variadas: +5,6 pp (IA 56,8 %, Humano 51,2 %) | ||
| + | |||
| + | Áreas donde el grupo humano informó mayor mejora: - Comprensión lectora: +14,0 pp (Humano 63,7 %, IA 49,8 %) - Gramática: +10,1 pp (Humano 57,0 %, IA 46,9 %) - Sintaxis: +9,3 pp (Humano 57,1 %, IA 47,8 %) - Vocabulario: +5,2 pp (Humano 60,7 %, IA 55,5 %) - Escritura: +5,0 pp (Humano 51,5 %, IA 46,5 %) | ||
| + | |||
| + | El patrón es claro: el aprendizaje asistido por IA parece fortalecer las competencias interactivas y orales (expresión oral, comprensión auditiva, confianza comunicativa), mientras que la enseñanza humana produce mayores ganancias en las competencias estructurales y analíticas (lectura, gramática, sintaxis). Este hallazgo tiene implicaciones pedagógicas directas: la IA y la instrucción humana pueden ser más eficaces no como sustitutos sino como complementos, cada uno abordando diferentes aspectos de la competencia lingüística. | ||
| + | |||
| + | '''4.7 Preferencias de modalidades sensoriales y sociales''' | ||
| + | |||
| + | Los participantes valoraron la importancia de doce modalidades sensoriales y sociales para su aprendizaje de lenguas. Surgieron varias diferencias importantes entre los grupos: | ||
| + | |||
| + | Modalidades valoradas más altamente por el grupo con IA: - Percepción auditiva: +40,7 pp (IA 79,6 %, Humano 38,9 %) - Texto escrito: +37,4 pp (IA 74,5 %, Humano 37,1 %) - Motivación intrínseca: +35,1 pp (IA 77,5 %, Humano 42,4 %) - Motivación extrínseca: +30,0 pp (IA 69,1 %, Humano 39,1 %) - Percepción visual: +29,3 pp (IA 74,6 %, Humano 45,2 %) - Emociones/motivación: +29,0 pp (IA 72,6 %, Humano 43,6 %) - Inmersión ambiental: +20,6 pp (IA 69,9 %, Humano 49,3 %) - Dinámica de grupo: +17,7 pp (IA 64,6 %, Humano 46,9 %) | ||
| + | |||
| + | Modalidades valoradas más altamente por el grupo humano: - Gusto: +32,1 pp (Humano 76,3 %, IA 44,2 %) - Inmersión profesor IA: +31,7 pp (Humano 83,9 %, IA 52,2 %) - Inmersión RV: +29,3 pp (Humano 83,0 %, IA 53,7 %) - Ética RV: +29,3 pp (Humano 81,3 %, IA 52,0 %) - Inmersión chatbot IA: +27,2 pp (Humano 79,4 %, IA 52,2 %) - Impresiones sociales: +21,5 pp (Humano 81,5 %, IA 59,9 %) - Olfato: +16,0 pp (Humano 59,8 %, IA 43,8 %) | ||
| + | |||
| + | Estos resultados requieren una interpretación cuidadosa. El grupo con IA atribuyó una importancia significativamente mayor a las modalidades primarias de aprendizaje de lenguas —visual, auditiva y textual— así como a los factores motivacionales. El grupo humano, paradójicamente, valoró la inmersión en IA y RV como más importante que el propio grupo con IA. Una interpretación es que los estudiantes del grupo humano, al no haber experimentado directamente la inmersión en IA, pueden idealizarla, mientras que los estudiantes del grupo con IA, al haber utilizado herramientas de IA a diario, son más mesurados en su evaluación. | ||
| + | |||
| + | La valoración más alta del grupo humano de las impresiones sociales (81,5 % frente a 59,9 %) es coherente con su preferencia declarada por aprender con personas reales y refleja la importancia de la presencia social en la educación lingüística —un factor que las herramientas de IA actuales, a pesar de los rápidos avances, no pueden replicar plenamente—. | ||
| + | |||
| + | '''4.8 Actitudes hacia la IA en la educación y la sociedad''' | ||
Catorce afirmaciones actitudinales fueron valoradas en una escala de acuerdo 0-100 %. Los resultados revelan un panorama matizado: | Catorce afirmaciones actitudinales fueron valoradas en una escala de acuerdo 0-100 %. Los resultados revelan un panorama matizado: | ||
Ambos grupos gustan mucho de los profesores humanos: grupo con IA 77,7 %, grupo humano 83,6 %. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA mantienen una fuerte apreciación por la instrucción humana. | Ambos grupos gustan mucho de los profesores humanos: grupo con IA 77,7 %, grupo humano 83,6 %. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA mantienen una fuerte apreciación por la instrucción humana. | ||
| + | |||
| + | El grupo con IA es más positivo hacia la enseñanza con IA: la aprobación del profesor de IA actual fue del 57,3 % (frente al 38,2 % en el grupo humano), y la aprobación del futuro profesor de IA avanzado fue del 66,4 % (frente al 53,3 %). Sin embargo, incluso en el grupo con IA, la aprobación del profesor de IA actual (57,3 %) es sustancialmente inferior a la aprobación del profesor humano (77,7 %). | ||
Ambos grupos expresan temor a la dependencia de la IA: - «Miedo a que la IA sustituya la capacidad de pensar»: IA 60,1 %, Humano 61,0 % - «Miedo al deterioro de conocimientos/habilidades»: IA 60,6 %, Humano 66,5 % - «Miedo a perder independencia / adicción a la IA»: IA 59,6 %, Humano 71,6 % | Ambos grupos expresan temor a la dependencia de la IA: - «Miedo a que la IA sustituya la capacidad de pensar»: IA 60,1 %, Humano 61,0 % - «Miedo al deterioro de conocimientos/habilidades»: IA 60,6 %, Humano 66,5 % - «Miedo a perder independencia / adicción a la IA»: IA 59,6 %, Humano 71,6 % | ||
| + | |||
| + | El grupo humano informa consistentemente de un mayor temor a la dependencia de la IA, con la mayor diferencia en la adicción (71,6 % frente a 59,6 %). El grupo con IA, quizá a través de la experiencia directa, ha desarrollado una visión más moderada pero aún cautelosa. | ||
Ambos grupos respaldan firmemente la ética de la IA: «Necesidad de controlar la IA con ética» recibió un 72,8 % (IA) y un 68,7 % (Humano) de acuerdo. | Ambos grupos respaldan firmemente la ética de la IA: «Necesidad de controlar la IA con ética» recibió un 72,8 % (IA) y un 68,7 % (Humano) de acuerdo. | ||
| − | Ambos grupos rechazan el dominio de la IA: «Dejar que la IA controle a los humanos» recibió solo un 14,4 % (IA) y un 21,5 % (Humano) de acuerdo. Estos hallazgos sugieren que los estudiantes universitarios chinos en 2025 mantienen una orientación firmemente humanista: acogen la IA como herramienta pero la rechazan como amo. | + | Ambos grupos rechazan el dominio de la IA: «Dejar que la IA controle a los humanos» recibió solo un 14,4 % (IA) y un 21,5 % (Humano) de acuerdo. «Solo robots de IA, sin humanos, es suficiente» recibió un 15,2 % y un 19,3 %. Estos hallazgos sugieren que los estudiantes universitarios chinos en 2025 mantienen una orientación firmemente humanista: acogen la IA como herramienta pero la rechazan como amo. |
| + | |||
| + | El apego romántico a la IA o a los profesores es mínimo: «Me enamoré de una IA» promedió aproximadamente el 20 % en ambos grupos, y «me enamoré de un profesor humano» promedió el 20-33 %. Estas cifras bajas sugieren que la interacción inmersiva con la IA no ha producido, para esta cohorte, la dependencia emocional que algunos comentaristas han predicho. El contexto cultural chino puede ser relevante aquí: la orientación pragmática hacia la IA como herramienta en lugar de como compañero, combinada con normas sociales claras en torno a las relaciones humanas, puede proporcionar un amortiguador cultural contra el apego parasocial que se ha documentado en algunos estudios occidentales de la interacción humano-IA. | ||
| + | |||
| + | La disposición a usar la IA como dispositivo de ahorro de trabajo fue moderada (aproximadamente el 39 % en ambos grupos), lo que sugiere que la mayoría de los estudiantes no ven la IA principalmente como un atajo. Combinado con el fuerte respaldo al control ético de la IA, este patrón indica una cohorte que ve la IA como útil pero limitada —una posición sofisticada que contradice los estereotipos de los estudiantes chinos como adoptantes acríticos de la tecnología—. | ||
| + | |||
| + | '''4.9 Análisis detallado de actitudes''' | ||
| + | |||
| + | Para comprender las actitudes matizadas con mayor claridad, podemos agrupar los catorce ítems actitudinales en clústeres temáticos: | ||
| + | |||
| + | Clúster A — Preferencia de enseñanza: - «Me gusta que un profesor humano me enseñe»: IA 77,7 %, Humano 83,6 % - «Me gusta que el profesor de IA actual me enseñe»: IA 57,3 %, Humano 38,2 % - «Me gustaría un futuro profesor de IA avanzado»: IA 66,4 %, Humano 53,3 % | ||
| + | |||
| + | Ambos grupos prefieren a los profesores humanos, pero el grupo con IA muestra una apertura significativamente mayor tanto a la instrucción actual como a la futura con IA. La diferencia de 20 puntos entre la aprobación del profesor humano (77,7 %) y la aprobación del profesor de IA actual (57,3 %) en el grupo con IA —después de una experiencia directa con herramientas de IA— sugiere que la familiaridad genera una apreciación cualificada más que entusiasmo. | ||
| + | |||
| + | Clúster B — Miedo a la IA: - «Miedo: la IA sustituye la capacidad de pensar»: IA 60,1 %, Humano 61,0 % - «Miedo: deterioro de conocimientos/habilidades»: IA 60,6 %, Humano 66,5 % - «Miedo: perder independencia, adicción a la IA»: IA 59,6 %, Humano 71,6 % - «Sin miedo: centrarse en otras áreas»: IA 55,7 %, Humano 53,4 % | ||
| + | |||
| + | Ambos grupos albergan una ansiedad sustancial sobre la atrofia cognitiva —una preocupación que los datos cualitativos de Fang Lu hacen vívida—. El mayor temor del grupo humano a la adicción (71,6 % frente a 59,6 %) puede reflejar una comprensión menos diferenciada de lo que la interacción con la IA realmente implica: lo desconocido es a menudo más aterrador que lo conocido. | ||
| + | |||
| + | Clúster C — Gobernanza de la IA: - «Necesidad de controlar la IA con ética»: IA 72,8 %, Humano 68,7 % - «Dar libertad a la IA para desarrollar la próxima generación»: IA 47,5 %, Humano 50,0 % - «Dejar que la IA controle a los humanos»: IA 14,4 %, Humano 21,5 % - «Solo robots de IA, sin humanos, es suficiente»: IA 15,2 %, Humano 19,3 % | ||
| + | |||
| + | Las actitudes hacia la gobernanza revelan una jerarquía clara: fuerte respaldo al control ético, ambivalencia sobre la autonomía de la IA y rechazo firme de la supremacía de la IA. La consistencia entre ambos grupos sugiere que estas actitudes reflejan un consenso generacional más amplio más que efectos específicos del grupo. | ||
| + | |||
| + | '''4.10 Satisfacción con el grupo y disposición al cambio''' | ||
| + | |||
| + | Ambos grupos informaron de una alta satisfacción con su asignación: grupo con IA 80,9 % (mediana 80 %), grupo humano 76,7 % (mediana 85 %). Sin embargo, la disposición a cambiar de grupo cuenta una historia diferente: el 47 % del grupo con IA y un notable 68 % del grupo humano expresaron disposición a cambiar. La alta tasa de cambio del grupo humano sugiere que muchos estudiantes del grupo humano sienten curiosidad por el aprendizaje asistido por IA incluso estando satisfechos con su experiencia actual —coherente con el momento cultural más amplio en el que la IA se percibe como novedosa y atractiva—. | ||
| + | |||
| + | Entre los encuestados del grupo con IA que describieron su preferencia de cambio, la respuesta más común fue «grupo con IA: conveniente» (便利), lo que sugiere que quienes permanecerían valoraban la accesibilidad práctica por encima de todo. Entre los encuestados del grupo humano, varios articularon posiciones reflexivas: «la IA aún no está madura» (AI不完善), «los métodos de enseñanza humana se adaptan mejor a mí» (human组的教学方法比较适合我), y notablemente: «prefiero explorar por mi cuenta. Los humanos nunca serán reemplazados por la IA» (我更喜欢自己探索。人类永远不会被AI取代) —una declaración que encapsula la posición humanista compartida por la mayoría de los encuestados—. | ||
'''5. Discusión''' | '''5. Discusión''' | ||
| + | |||
| + | Los resultados presentan un panorama matizado que resiste las conclusiones simples. Organizamos nuestra discusión en torno a cinco temas: la complementariedad de la instrucción con IA y humana, el diálogo con los ensayos complementarios de este volumen, el mecanismo de reducción de la ansiedad, las diferencias de modalidad y las implicaciones para la educación comparada europeo-china. | ||
'''5.1 La tesis de la complementariedad''' | '''5.1 La tesis de la complementariedad''' | ||
| Line 117: | Line 215: | ||
Nuestro hallazgo central —que el aprendizaje asistido por IA fortalece las competencias orales interactivas mientras que la enseñanza humana fortalece las competencias analíticas estructurales— apoya lo que llamamos la Tesis de la Complementariedad: la instrucción con IA y la instrucción humana no son sustitutos sino complementos, cada uno más adecuado para diferentes dimensiones de la competencia lingüística. Este hallazgo desafía tanto la posición tecnooptimista (que la IA reemplazará a los profesores humanos) como la posición tecnopesimista (que la IA no puede enseñar eficazmente). | Nuestro hallazgo central —que el aprendizaje asistido por IA fortalece las competencias orales interactivas mientras que la enseñanza humana fortalece las competencias analíticas estructurales— apoya lo que llamamos la Tesis de la Complementariedad: la instrucción con IA y la instrucción humana no son sustitutos sino complementos, cada uno más adecuado para diferentes dimensiones de la competencia lingüística. Este hallazgo desafía tanto la posición tecnooptimista (que la IA reemplazará a los profesores humanos) como la posición tecnopesimista (que la IA no puede enseñar eficazmente). | ||
| − | El mecanismo es plausible y está fundamentado en la teoría establecida de adquisición de segundas lenguas. Los chatbots de IA proporcionan una práctica conversacional ilimitada, paciente y libre de juicios —precisamente las condiciones que promueven la fluidez en la expresión oral y la comprensión auditiva—. Los profesores humanos proporcionan instrucción estructurada, análisis de errores y explicación metalingüística —precisamente las condiciones que promueven la precisión gramatical, la comprensión lectora y la conciencia sintáctica—. | + | El mecanismo es plausible y está fundamentado en la teoría establecida de adquisición de segundas lenguas. Los chatbots de IA proporcionan una práctica conversacional ilimitada, paciente y libre de juicios —precisamente las condiciones que promueven la fluidez en la expresión oral y la comprensión auditiva—. Esto se alinea con la Hipótesis de la Interacción de Long (1996), que postula que la interacción conversacional —incluyendo la negociación de significado, las reformulaciones y las verificaciones de comprensión— impulsa la adquisición lingüística. Los chatbots de IA proporcionan una interacción abundante, aunque sin los movimientos interaccionales humanos que Long enfatizaba. Los profesores humanos proporcionan instrucción estructurada, análisis de errores y explicación metalingüística —precisamente las condiciones que promueven la precisión gramatical, la comprensión lectora y la conciencia sintáctica—. Esto se alinea con la Hipótesis del Output de Swain (2000), que argumenta que los aprendices necesitan no solo input comprensible sino oportunidades para producir lengua y recibir retroalimentación correctiva que los impulse más allá de su competencia actual. |
La Tesis de la Complementariedad tiene implicaciones prácticas: en lugar de debatir si la IA debería reemplazar a los profesores humanos (una pregunta que nuestros datos responden claramente: no), los educadores deberían preguntarse cómo pueden orquestarse la instrucción con IA y la instrucción humana para servir a diferentes objetivos de aprendizaje dentro de un currículo unificado. | La Tesis de la Complementariedad tiene implicaciones prácticas: en lugar de debatir si la IA debería reemplazar a los profesores humanos (una pregunta que nuestros datos responden claramente: no), los educadores deberían preguntarse cómo pueden orquestarse la instrucción con IA y la instrucción humana para servir a diferentes objetivos de aprendizaje dentro de un currículo unificado. | ||
| − | '''5.2 El entorno libre de presión''' | + | '''5.2 Diálogo con Fang Lu''' |
| + | |||
| + | El estudio cualitativo de Fang Lu (en este volumen) identifica un riesgo crítico del aprendizaje de lenguas asistido por IA: la posible erosión del pensamiento crítico, la creatividad y el juicio independiente. Sus estudios de caso —un estudiante de nivel elemental cuya escritura asistida por IA era estructuralmente perfecta pero intelectualmente superficial, y un estudiante avanzado cuya traducción asistida por IA era fluida pero carecía de matiz cultural— ilustran el fenómeno de «arrancar las plántulas para ayudarlas a crecer» (拔苗助长): la IA acelera el rendimiento superficial mientras socava el desarrollo cognitivo más profundo. | ||
| + | |||
| + | Nuestros datos cuantitativos tanto respaldan como complican los hallazgos de Fang Lu. La mayor mejora del grupo humano en gramática y sintaxis —competencias que requieren razonamiento analítico más que reproducción de patrones— es coherente con su preocupación de que la IA puede eludir en lugar de desarrollar competencias cognitivas. Sin embargo, la mayor mejora del grupo con IA en confianza comunicativa sugiere que la IA cumple una función genuina e importante que la instrucción humana a menudo no logra proporcionar: crear un espacio psicológicamente seguro para la práctica oral. | ||
| + | |||
| + | La implicación no es que se deba evitar la IA, sino que su papel debe definirse cuidadosamente. La IA parece más beneficiosa para el desarrollo de la fluidez y la reducción de la ansiedad; la instrucción humana parece más beneficiosa para el desarrollo de la precisión y el pensamiento analítico. Un currículo bien diseñado desplegaría ambos. | ||
| + | |||
| + | '''5.3 Diálogo con Ole Döring''' | ||
| + | |||
| + | El artículo filosófico de Döring (en este volumen) cuestiona el concepto mismo de «inteligencia artificial» aplicado a la enseñanza, argumentando que la distinción de la tradición filosófica alemana entre Vernunft (razón, juicio) y Verstand (entendimiento, cálculo) revela un error categorial fundamental en las afirmaciones de que las máquinas pueden «enseñar». Lo que las máquinas hacen, argumenta Döring, es procesar —no comprender, no juzgar, no cuidar—. | ||
| + | |||
| + | Nuestros datos actitudinales resuenan con el análisis de Döring. Cuando los estudiantes dicen que les «gustan» los profesores humanos al 78-84 % pero solo les «gustan» los profesores de IA al 38-57 %, pueden estar respondiendo precisamente a la distinción que Döring identifica: el profesor humano ofrece Vernunft —juicio, cuidado, comprensión del aprendiz individual— mientras que la IA ofrece Verstand —cálculo, coincidencia de patrones, recuperación de información—. Ambos son útiles, pero no son equivalentes. | ||
| + | |||
| + | El fuerte respaldo de los estudiantes al control ético de la IA (70%+) y el firme rechazo del dominio de la IA (<20 %) respaldan aún más la posición humanista de Döring. Estos 133 estudiantes universitarios chinos, mientras utilizan con entusiasmo las herramientas de IA, mantienen un límite conceptual claro entre la agencia humana y la de la máquina. | ||
| + | |||
| + | '''5.4 El entorno libre de presión''' | ||
La ventaja mejor valorada del aprendizaje con IA —«sin miedo a cometer errores» con un 76,6 %— merece especial atención. La ansiedad ante las lenguas extranjeras es una de las barreras más extensamente documentadas para la adquisición lingüística. Los entornos de aula tradicionales, con sus dinámicas sociales inherentes de actuación, juicio y «quedar bien», crean una ansiedad que inhibe la práctica, particularmente la práctica oral. El chatbot de IA sortea esto por completo: no hay audiencia, no hay juicio, no hay pérdida de imagen. | La ventaja mejor valorada del aprendizaje con IA —«sin miedo a cometer errores» con un 76,6 %— merece especial atención. La ansiedad ante las lenguas extranjeras es una de las barreras más extensamente documentadas para la adquisición lingüística. Los entornos de aula tradicionales, con sus dinámicas sociales inherentes de actuación, juicio y «quedar bien», crean una ansiedad que inhibe la práctica, particularmente la práctica oral. El chatbot de IA sortea esto por completo: no hay audiencia, no hay juicio, no hay pérdida de imagen. | ||
| Line 127: | Line 241: | ||
Este hallazgo sugiere que la contribución educativa principal de la IA puede no ser como profesora sino como compañera de práctica —una interlocutora incansable, paciente, que nunca juzga, nunca pierde la paciencia y nunca genera ansiedad social—. Si esto es correcto, el modelo educativo óptimo no es «IA en lugar de profesores humanos» sino «IA como complemento de los profesores humanos», específicamente para el componente de práctica del aprendizaje de lenguas donde la ansiedad más inhibe el rendimiento. | Este hallazgo sugiere que la contribución educativa principal de la IA puede no ser como profesora sino como compañera de práctica —una interlocutora incansable, paciente, que nunca juzga, nunca pierde la paciencia y nunca genera ansiedad social—. Si esto es correcto, el modelo educativo óptimo no es «IA en lugar de profesores humanos» sino «IA como complemento de los profesores humanos», específicamente para el componente de práctica del aprendizaje de lenguas donde la ansiedad más inhibe el rendimiento. | ||
| − | '''5. | + | '''5.5 Diferencias de modalidad y sus implicaciones''' |
| + | |||
| + | Las grandes diferencias en las preferencias de modalidad sensorial entre los grupos —los estudiantes con IA valorando más altamente el input visual, auditivo y textual, los estudiantes con profesor humano valorando más altamente las impresiones sociales, la inmersión en RV y los sentidos físicos— sugieren que los dos grupos pueden tener orientaciones de aprendizaje fundamentalmente diferentes. Los estudiantes del grupo con IA parecen ser aprendices orientados cognitivamente que priorizan los canales de entrada de información. Los estudiantes del grupo humano parecen ser aprendices orientados social y físicamente que priorizan la experiencia relacional y corpórea. | ||
| + | |||
| + | Si estas diferencias son causas o consecuencias de la elección del grupo no está claro. Los estudiantes que prefieren los canales de entrada cognitivos pueden haber seleccionado el grupo con IA porque las herramientas de IA proporcionan precisamente esos canales. Alternativamente, un mes de aprendizaje asistido por IA puede haber habituado a los estudiantes a valorar el input cognitivo por encima de la experiencia social. Sería necesaria una investigación longitudinal para desentrañar estas posibilidades. | ||
| + | |||
| + | '''5.6 Implicaciones para la educación comparada europeo-china''' | ||
| + | |||
| + | Nuestros hallazgos tienen una relevancia específica para el diálogo educativo europeo-chino que aborda este volumen. La educación lingüística europea, configurada por el Marco Común Europeo de Referencia para las Lenguas (MCER) y el enfoque comunicativo, ha enfatizado tradicionalmente la competencia oral, la interacción y el aprendizaje basado en tareas. La educación lingüística china, configurada por la cultura orientada a los exámenes y la pedagogía de traducción gramatical, ha enfatizado tradicionalmente la lectura, la escritura, la gramática y el vocabulario. La aparición de la IA como compañera de práctica puede ayudar a cerrar esta brecha: los estudiantes chinos que carecen de oportunidades para la práctica oral auténtica con hablantes humanos pueden usar la IA para desarrollar las competencias comunicativas que priorizan los enfoques pedagógicos europeos. | ||
| + | |||
| + | Al mismo tiempo, el énfasis europeo en el pensamiento crítico, la autonomía del aprendiz y la práctica reflexiva —valores articulados en el Plan de Acción de Educación Digital de la UE (2021-2027)— proporciona un contrapeso necesario al riesgo de que la práctica con IA pueda desarrollar la fluidez sin profundidad. Los estudios de caso de Fang Lu ilustran este riesgo de manera concreta: el estudiante cuya escritura asistida por IA era fluida pero intelectualmente vacía había desarrollado una competencia superficial sin el compromiso cognitivo más profundo que promueve la interacción humana. | ||
| + | |||
| + | Un modelo europeo-chino de educación lingüística integrada con IA podría, por lo tanto, combinar la adopción entusiasta de las herramientas de IA por parte de los estudiantes chinos con los marcos pedagógicos europeos que insisten en el pensamiento crítico y la práctica reflexiva. La tecnología proporciona el medio; la pedagogía proporciona el propósito. | ||
| + | |||
| + | '''5.7 Recomendaciones para la práctica''' | ||
Basándonos en nuestros hallazgos, ofrecemos cuatro recomendaciones para los educadores que consideren la integración de la IA en la enseñanza de lenguas extranjeras: | Basándonos en nuestros hallazgos, ofrecemos cuatro recomendaciones para los educadores que consideren la integración de la IA en la enseñanza de lenguas extranjeras: | ||
| − | Primera, utilizar la IA para la práctica oral, no como sustituto de la instrucción. Los datos sugieren que la mayor contribución de la IA está en el desarrollo de la fluidez oral y la confianza comunicativa a través de la práctica conversacional de baja ansiedad. | + | Primera, utilizar la IA para la práctica oral, no como sustituto de la instrucción. Los datos sugieren que la mayor contribución de la IA está en el desarrollo de la fluidez oral y la confianza comunicativa a través de la práctica conversacional de baja ansiedad. Esta función complementa en lugar de reemplazar la instrucción humana. |
Segunda, mantener la enseñanza humana para las competencias analíticas. Gramática, sintaxis, comprensión lectora y escritura —las competencias que mostraron mayor mejora en el grupo humano— parecen beneficiarse de la instrucción estructurada, explicativa y correctiva que proporcionan los profesores humanos. | Segunda, mantener la enseñanza humana para las competencias analíticas. Gramática, sintaxis, comprensión lectora y escritura —las competencias que mostraron mayor mejora en el grupo humano— parecen beneficiarse de la instrucción estructurada, explicativa y correctiva que proporcionan los profesores humanos. | ||
| − | Tercera, abordar la ansiedad de los estudiantes ante la IA de manera proactiva. Más del 60 % de los estudiantes en ambos grupos expresaron temor a que la IA reemplace su capacidad de pensamiento o erosione sus habilidades. | + | Tercera, abordar la ansiedad de los estudiantes ante la IA de manera proactiva. Más del 60 % de los estudiantes en ambos grupos expresaron temor a que la IA reemplace su capacidad de pensamiento o erosione sus habilidades. Estas preocupaciones son legítimas y deben abordarse mediante una discusión explícita de las limitaciones de la IA, marcos éticos para el uso de la IA y tareas que requieran pensamiento crítico independiente. |
| + | |||
| + | Cuarta, diseñar evaluaciones que la IA no pueda sortear. Como ilustran los casos de Fang Lu, la IA puede producir resultados pulidos que enmascaran una comprensión superficial. Las evaluaciones deben incluir exámenes orales, respuestas espontáneas y tareas que requieran razonamiento analítico genuino —áreas donde la asistencia de IA es inaccesible o visiblemente artificial—. | ||
| + | |||
| + | '''6. Limitaciones''' | ||
| + | |||
| + | Varias limitaciones condicionan la interpretación de estos resultados: | ||
| + | |||
| + | Primera, el estudio se basa enteramente en datos autoinformados. Las percepciones de los estudiantes sobre su mejora pueden no corresponderse con su mejora real medida mediante pruebas estandarizadas. Un diseño con pruebas previas y posteriores proporcionaría evidencia más robusta. | ||
| + | |||
| + | Segunda, la asignación no aleatoria de los grupos introduce un sesgo de autoselección. Los estudiantes que eligieron el grupo con IA pueden diferir sistemáticamente de aquellos que eligieron o fueron asignados al grupo humano —en alfabetización tecnológica, motivación de aprendizaje, personalidad u otras variables no medidas—. El mayor porcentaje masculino del grupo con IA (26 % frente a 11 %) y su rango de edad más amplio sugieren algunas diferencias demográficas, aunque la significación práctica de estas diferencias para los resultados del aprendizaje de lenguas no está clara. | ||
| + | |||
| + | Tercera, el período de observación de un mes es corto. El aprendizaje de lenguas es un proceso a largo plazo, y las ventajas relativas de la instrucción con IA frente a la humana pueden cambiar en períodos más largos. La ventaja del grupo con IA en expresión oral puede ser una ganancia de fluidez en fase temprana que alcanza una meseta, mientras que la ventaja del grupo humano en gramática puede acumularse con el tiempo. | ||
| + | |||
| + | Cuarta, la muestra se compone enteramente de estudiantes universitarios chinos, predominantemente mujeres, que estudian inglés o alemán. La generalización a otros contextos culturales, grupos de edad, géneros o lenguas meta es incierta. Debe enfatizarse la especificidad cultural de nuestros hallazgos: el énfasis de la cultura del aula china en la preservación de la imagen y la autoridad del profesor puede amplificar los beneficios de reducción de la ansiedad de la IA de maneras que serían menos pronunciadas en culturas con relaciones profesor-estudiante más informales. | ||
| + | |||
| + | Quinta, todas las mediciones son autoinformadas. Los datos de «áreas de mejora» (Sección 4.6) representan las percepciones de los estudiantes sobre dónde mejoraron, no ganancias medidas objetivamente. Los estudiantes pueden sobreestimar la mejora en áreas que más practicaron (confundiendo práctica con progreso) o subestimar la mejora en áreas donde las ganancias se perciben de manera menos consciente. | ||
| + | |||
| + | Sexta, la encuesta se realizó en un único punto temporal. Los datos longitudinales —que rastreen la motivación, las actitudes y los resultados a lo largo de un semestre o año completo— proporcionarían un panorama más rico. Un estudio de seguimiento con los mismos participantes después de seis meses o un año de estudio continuado sería particularmente valioso para comprobar si la Tesis de la Complementariedad se mantiene a lo largo de períodos de aprendizaje más largos. | ||
| − | + | A pesar de estas limitaciones, el estudio ofrece una de las investigaciones comparativas con mayor muestra disponibles hasta la fecha sobre el aprendizaje de lenguas asistido por IA frente al enseñado por humanos, y la amplitud del instrumento de encuesta —que cubre motivación, preferencias de modalidad, actitudes y mejora específica por competencias— proporciona un panorama multidimensional que la mayoría de los estudios existentes carecen. | |
| − | ''' | + | '''7. Conclusión''' |
Este estudio de 133 estudiantes universitarios chinos que aprenden lenguas extranjeras con asistencia de IA (n=85) y con profesores humanos (n=48) arroja cuatro hallazgos principales: | Este estudio de 133 estudiantes universitarios chinos que aprenden lenguas extranjeras con asistencia de IA (n=85) y con profesores humanos (n=48) arroja cuatro hallazgos principales: | ||
| Line 145: | Line 291: | ||
Primero, los estudiantes con profesor humano informaron una mejora general mayor (63,2 % frente a 51,9 %), pero el patrón es específico por competencias: los estudiantes con IA mejoraron más en expresión oral (+12,6 pp), comprensión auditiva (+10,2 pp) y confianza comunicativa (+8,3 pp), mientras que los estudiantes con profesor humano mejoraron más en lectura (+14,0 pp), gramática (+10,1 pp) y sintaxis (+9,3 pp). Esto apoya una Tesis de la Complementariedad: la instrucción con IA y la instrucción humana sirven funciones diferentes y complementarias en la educación lingüística. | Primero, los estudiantes con profesor humano informaron una mejora general mayor (63,2 % frente a 51,9 %), pero el patrón es específico por competencias: los estudiantes con IA mejoraron más en expresión oral (+12,6 pp), comprensión auditiva (+10,2 pp) y confianza comunicativa (+8,3 pp), mientras que los estudiantes con profesor humano mejoraron más en lectura (+14,0 pp), gramática (+10,1 pp) y sintaxis (+9,3 pp). Esto apoya una Tesis de la Complementariedad: la instrucción con IA y la instrucción humana sirven funciones diferentes y complementarias en la educación lingüística. | ||
| − | Segundo, la principal ventaja percibida del aprendizaje con IA no es informativa sino psicológica: «sin miedo a cometer errores» fue la mejor valorada con un 76,6 %. La mayor contribución de la IA a la educación lingüística puede ser crear un entorno libre de presión para la práctica oral. | + | Segundo, la principal ventaja percibida del aprendizaje con IA no es informativa sino psicológica: «sin miedo a cometer errores» fue la mejor valorada con un 76,6 %. La mayor contribución de la IA a la educación lingüística puede ser crear un entorno libre de presión para la práctica oral —abordando una de las barreras más persistentes para la adquisición lingüística—. |
Tercero, ambos grupos mantienen actitudes firmemente humanistas. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA valoran a los profesores humanos por encima de los profesores de IA (77,7 % frente a 57,3 %). Ambos grupos respaldan el control ético de la IA (>68 %) y rechazan el dominio de la IA sobre los humanos (<22 %). | Tercero, ambos grupos mantienen actitudes firmemente humanistas. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA valoran a los profesores humanos por encima de los profesores de IA (77,7 % frente a 57,3 %). Ambos grupos respaldan el control ético de la IA (>68 %) y rechazan el dominio de la IA sobre los humanos (<22 %). | ||
| − | Cuarto, la evidencia no apoya reemplazar a los profesores humanos con IA, ni tampoco excluir la IA de la educación lingüística. En su lugar, apunta hacia un modelo integrado en el que la IA sirve como compañera de práctica complementaria mientras los profesores humanos proporcionan la instrucción estructurada, la orientación analítica y la presencia social que desarrollan la competencia gramatical, la comprensión lectora y el pensamiento crítico. | + | Cuarto, la valoración paradójicamente más alta del grupo humano de la inmersión en IA y RV sugiere curiosidad por tecnologías que no han experimentado, mientras que la evaluación más mesurada del grupo con IA refleja el efecto moderador del uso real. |
| + | |||
| + | Estos hallazgos tienen claras implicaciones para el diseño educativo. La evidencia no apoya reemplazar a los profesores humanos con IA, ni tampoco excluir la IA de la educación lingüística. En su lugar, apunta hacia un modelo integrado en el que la IA sirve como compañera de práctica complementaria —proporcionando la práctica conversacional ilimitada y libre de juicios que desarrolla la fluidez oral y la confianza comunicativa— mientras los profesores humanos proporcionan la instrucción estructurada, la orientación analítica y la presencia social que desarrollan la competencia gramatical, la comprensión lectora y el pensamiento crítico. Tal modelo honraría tanto las posibilidades tecnológicas documentadas en nuestros datos como las preocupaciones filosóficas articuladas por Döring y las advertencias pedagógicas articuladas por Fang Lu. | ||
| + | |||
| + | Estos hallazgos tienen claras implicaciones para el diseño educativo. La evidencia no apoya reemplazar a los profesores humanos con IA, ni tampoco excluir la IA de la educación lingüística. En su lugar, apunta hacia un modelo integrado que aprovecha las fortalezas complementarias de ambos: la IA para el desarrollo de la fluidez y la reducción de la ansiedad, los profesores humanos para el desarrollo de la precisión y el pensamiento crítico. A medida que las capacidades de la IA continúan avanzando, la cuestión no será si usar la IA en la educación lingüística sino cómo usarla sabiamente —una cuestión que requiere investigación empírica continua, reflexión filosófica e innovación pedagógica—. | ||
'''Agradecimientos''' | '''Agradecimientos''' | ||
Cofinanciado por la Unión Europea. Las opiniones expresadas son exclusivamente las del autor y no reflejan necesariamente las de la Unión Europea [101126782]. | Cofinanciado por la Unión Europea. Las opiniones expresadas son exclusivamente las del autor y no reflejan necesariamente las de la Unión Europea [101126782]. | ||
| + | |||
| + | Agradecemos a los estudiantes participantes por sus respuestas sinceras y a los colegas que administraron la encuesta. | ||
'''Referencias''' | '''Referencias''' | ||
| Line 159: | Line 311: | ||
Chapelle, C. A. (2001). Computer Applications in Second Language Acquisition. Cambridge University Press. | Chapelle, C. A. (2001). Computer Applications in Second Language Acquisition. Cambridge University Press. | ||
| − | + | Döring, O. (en este volumen). AI and pedagogy: Between artificial intelligence and human understanding. | |
| − | + | Garrett, N. (2009). Computer-assisted language learning trends and issues revisited: Integrating innovation. The Modern Language Journal, 93(s1), 719–740. | |
| − | + | Godwin-Jones, R. (2015). Contributing, creating, curating: Digital literacies for language learners. Language Learning & Technology, 19(3), 8–20. | |
| − | + | Golonka, E. M., Bowles, A. R., Frank, V. M., Richardson, D. L. & Freynik, S. (2014). Technologies for foreign language learning: A review of technology types and their effectiveness. Computer Assisted Language Learning, 27(1), 70–105. | |
| − | Kim, N. Y. (2019). A study on | + | Horwitz, E. K., Horwitz, M. B. & Cope, J. (1986). Foreign language classroom anxiety. The Modern Language Journal, 70(2), 125–132. |
| + | |||
| + | Huang, W., Hew, K. F. & Fryer, L. K. (2022). Chatbots for language learning — Are they really useful? A systematic review of chatbot-supported language learning. Journal of Computer Assisted Learning, 38(1), 237–257. | ||
| + | |||
| + | Jeon, J. (2022). Exploring AI chatbot affordances in the EFL classroom: Young learners' experiences and perspectives. Computer Assisted Language Learning, 37(1–2), 1–26. | ||
| + | |||
| + | Kim, N. Y. (2019). A study on the use of artificial intelligence chatbots for improving English grammar skills. Journal of Digital Convergence, 17(8), 37–46. | ||
Krashen, S. D. (1982). Principles and Practice in Second Language Acquisition. Pergamon Press. | Krashen, S. D. (1982). Principles and Practice in Second Language Acquisition. Pergamon Press. | ||
| − | Long, M. H. (1996). The role of the linguistic environment in second language acquisition. In Handbook of Second Language Acquisition (pp. 413–468). Academic Press. | + | Lai, C. & Zheng, D. (2018). Self-directed use of mobile devices for language learning beyond the classroom. ReCALL, 30(3), 299–318. |
| + | |||
| + | Long, M. H. (1996). The role of the linguistic environment in second language acquisition. In W. C. Ritchie & T. K. Bhatia (Eds.), Handbook of Second Language Acquisition (pp. 413–468). Academic Press. | ||
| + | |||
| + | Lu, F. (en este volumen). AI in Chinese teaching: Opportunities and challenges from the perspective of critical thinking. | ||
| − | MacIntyre, P. D. & Gardner, R. C. (1994). The subtle effects of language anxiety on cognitive processing. Language Learning, 44(2), 283–305. | + | MacIntyre, P. D. & Gardner, R. C. (1994). The subtle effects of language anxiety on cognitive processing in the second language. Language Learning, 44(2), 283–305. |
| − | Swain, M. (2000). The output hypothesis and beyond. In Sociocultural Theory and Second Language Learning (pp. 97–114). Oxford University Press. | + | Swain, M. (2000). The output hypothesis and beyond: Mediating acquisition through collaborative dialogue. In J. P. Lantolf (Ed.), Sociocultural Theory and Second Language Learning (pp. 97–114). Oxford University Press. |
World Economic Forum. (2025). The Future of Jobs Report 2025. Geneva: WEF. | World Economic Forum. (2025). The Future of Jobs Report 2025. Geneva: WEF. | ||
Latest revision as of 09:46, 18 April 2026
El aprendizaje de lenguas extranjeras con y sin IA: un estudio comparativo empírico
Martin Woesler
Universidad Normal de Hunan
Resumen
Este estudio compara los resultados de aprendizaje autoinformados, las motivaciones y las actitudes de 133 estudiantes universitarios chinos que aprenden una lengua extranjera —85 en un grupo asistido por IA y 48 en un grupo con profesor humano tradicional— durante un período de aproximadamente un mes. Basándose en un instrumento de encuesta integral con 126 variables que cubren datos demográficos, métodos de aprendizaje, preferencias de modalidad sensorial, actitudes hacia la IA en la educación y autoevaluación de la mejora en diez áreas de competencia lingüística, el estudio presenta un panorama complejo que desafía tanto las narrativas tecnooptimistas como las tecnopesimistas. El grupo con profesor humano informó una mejora general mayor (63,2 % frente a 51,9 %), sin embargo, el grupo con IA informó ganancias mayores en expresión oral y comprensión auditiva —precisamente las competencias interactivas para las que los chatbots de IA están diseñados—. Ambos grupos expresaron una fuerte preferencia por los profesores humanos, pero el grupo con IA valoró simultáneamente la disponibilidad, la velocidad y el entorno libre de presión de la IA. Las actitudes hacia la autonomía de la IA fueron cautelosas en ambos grupos: más del 70 % estuvo de acuerdo en que la IA necesita control ético, y menos del 20 % respaldó el dominio de la IA sobre los humanos. Estos hallazgos contribuyen a la creciente literatura sobre la IA en la educación lingüística y se discuten en relación con los hallazgos cualitativos de Fang Lu (en este volumen) y el marco filosófico de Ole Döring (en este volumen).
Palabras clave: aprendizaje de lenguas asistido por IA, estudio comparativo, educación en lenguas extranjeras, interacción humano-IA, educación digital, modalidades sensoriales, actitudes estudiantiles, China, Unión Europea, tesis de la complementariedad
1. Introducción
La integración de la inteligencia artificial en la educación lingüística ha pasado del futurismo especulativo a la práctica diaria con una rapidez notable. Los estudiantes universitarios chinos en 2025 utilizan rutinariamente chatbots de IA —ChatGPT, Kimi, DeepSeek, Doubao— como compañeros de conversación, entrenadores de pronunciación, verificadores gramaticales y tutores de vocabulario. Sin embargo, la evidencia empírica sobre si el aprendizaje de lenguas asistido por IA produce mejores resultados que la instrucción humana tradicional sigue siendo sorprendentemente escasa. La mayoría de los estudios existentes son de pequeña escala, se centran en una sola herramienta de IA o miden los resultados en períodos muy cortos. Lo que falta es un estudio comparativo que examine no solo los resultados de aprendizaje, sino también las dimensiones motivacionales, actitudinales y perceptivas del aprendizaje de lenguas asistido por IA frente al enseñado por humanos.
Este estudio aborda esa laguna. Encuestamos a 133 estudiantes universitarios chinos —85 que eligieron o fueron asignados a aprender una lengua extranjera con asistencia de IA, y 48 que aprendieron con profesores humanos— después de aproximadamente un mes de estudio. El instrumento de encuesta, que comprende 126 variables, captura datos demográficos, conocimiento lingüístico previo, tiempo de estudio diario, razones para la elección del grupo, métodos de uso de la IA, percepciones de calidad de la retroalimentación, autoevaluación de la mejora en diez áreas específicas de competencia, la importancia de doce modalidades sensoriales y sociales en el aprendizaje, y actitudes hacia catorce aspectos de la IA en la educación y la sociedad.
Nuestros hallazgos se sitúan dentro de un creciente corpus de trabajo sobre educación digital en China y Europa, incluyendo los estudios de caso cualitativos de Fang Lu (en este volumen), que examinó los efectos de la IA en el pensamiento crítico en cursos de lengua china en Boston College, y el análisis filosófico de Ole Döring (en este volumen), que interroga los fundamentos conceptuales de la «inteligencia artificial» en contextos pedagógicos. Donde Fang Lu proporciona profundidad a través de casos individuales y Döring ofrece amplitud filosófica, nosotros contribuimos con amplitud a través de la comparación cuantitativa en un grupo sustancial de participantes.
2. Revisión de la literatura
2.1 La IA en la educación lingüística: estado del arte
La aplicación de la tecnología al aprendizaje de lenguas tiene una larga historia, desde los laboratorios de idiomas de los años sesenta hasta el Aprendizaje de Lenguas Asistido por Ordenador (ALAO) de los años noventa y la generación actual de herramientas potenciadas por IA. Chapelle (2001) proporcionó un marco temprano para evaluar la tecnología en la adquisición de segundas lenguas, enfatizando la importancia del potencial de aprendizaje lingüístico, la adecuación al aprendiz y las consideraciones prácticas. Golonka et al. (2014) revisaron 350 estudios sobre tipos de tecnología en el aprendizaje de lenguas extranjeras y encontraron que, si bien la tecnología muestra promesa para la adquisición de vocabulario y la comprensión lectora, la evidencia para las ganancias en expresión oral y escrita era limitada.
La aparición de los modelos de lenguaje de gran tamaño (LLM) —ChatGPT, Claude y sus equivalentes chinos Kimi, DeepSeek y Doubao— ha cambiado fundamentalmente el panorama. A diferencia de los chatbots anteriores que dependían de diálogos programados y coincidencia de palabras clave, los chatbots basados en LLM pueden sostener conversaciones abiertas y contextualmente apropiadas sobre prácticamente cualquier tema. Huang, Hew y Fryer (2022) realizaron una revisión sistemática del aprendizaje de lenguas con apoyo de chatbots y encontraron efectos positivos en la adquisición de vocabulario y la confianza en la expresión oral, pero señalaron que la mayoría de los estudios tenían muestras pequeñas, duraciones cortas y carecían de grupos de control.
Jeon (2022) exploró las posibilidades de los chatbots de IA con jóvenes aprendices coreanos de inglés como lengua extranjera y encontró que los estudiantes apreciaban la paciencia, la disponibilidad y la naturaleza no enjuiciadora del chatbot —hallazgos que nuestros datos corroboran firmemente—. Kim (2019) informó de que la interacción con chatbots de IA mejoró las competencias gramaticales del inglés entre los estudiantes universitarios coreanos, un hallazgo que nuestros datos solo respaldan parcialmente (la mejora gramatical fue en realidad menor en nuestro grupo con IA).
2.2 Ansiedad ante las lenguas extranjeras
La dimensión psicológica del aprendizaje de lenguas ha sido ampliamente estudiada desde que Horwitz, Horwitz y Cope (1986) desarrollaron la Escala de Ansiedad en el Aula de Lengua Extranjera (FLCAS). MacIntyre y Gardner (1994) demostraron que la ansiedad lingüística tiene efectos medibles en el procesamiento cognitivo en la segunda lengua: los aprendices ansiosos procesan la información más lentamente, recuerdan menos vocabulario y producen enunciados menos complejos. La hipótesis del «filtro afectivo» de Krashen (1982) postula que los estados emocionales negativos —ansiedad, inseguridad, aburrimiento— crean una barrera mental que impide la adquisición lingüística.
La relevancia para el aprendizaje asistido por IA es directa. Si los chatbots de IA pueden reducir el filtro afectivo proporcionando un entorno de práctica libre de juicios, pueden permitir a los aprendices procesar y producir lengua más eficazmente de lo que lo harían en el contexto generador de ansiedad de un aula humana. Nuestros datos sugieren que este mecanismo está operando: la ventaja mejor valorada del grupo con IA fue «sin miedo a cometer errores» (76,6 %), y el grupo con IA informó una mayor mejora precisamente en aquellas competencias —expresión oral, comprensión auditiva, confianza comunicativa— que más se ven inhibidas por la ansiedad.
2.3 El contexto chino
El panorama de la IA educativa en China es distintivo. El «Plan de Desarrollo de la Inteligencia Artificial de Nueva Generación» del gobierno chino (2017) y el plan «Modernización de la Educación 2035» identifican la IA como una prioridad estratégica para la reforma educativa. Los estudiantes chinos tienen acceso a una gama de herramientas de IA de desarrollo nacional —incluyendo Kimi (Moonshot AI), DeepSeek, Doubao (ByteDance) y Ernie (Baidu)— además de herramientas internacionales como ChatGPT (accesible a través de VPN). El contexto cultural también es relevante: la cultura del aula china tradicionalmente enfatiza la autoridad del profesor, la deferencia del estudiante y los comportamientos de preservación de la imagen que pueden inhibir la participación oral —precisamente las condiciones bajo las cuales el entorno libre de juicios de la IA puede ofrecer el mayor beneficio—.
3. Diseño del estudio y metodología
3.1 Participantes
Un total de 133 estudiantes universitarios chinos participaron en el estudio. El grupo con IA comprendió 85 participantes (74 % mujeres, 26 % hombres; edad media 23,8 años, rango 19-38). El grupo con profesor humano comprendió 48 participantes (89 % mujeres, 11 % hombres; edad media 23,1 años, rango 20-32). Todos los participantes estaban matriculados en universidades chinas, estudiando predominantemente inglés (IA: 38 %, Humano: 29 %) o alemán (IA: 16 %, Humano: 25 %) como especialidad de lengua extranjera. El desequilibrio de género —más pronunciado en el grupo humano— refleja la demografía general de los departamentos de lenguas extranjeras en las universidades chinas.
Los participantes no fueron asignados aleatoriamente. Algunos eligieron su grupo; otros fueron asignados (el 44,7 % del grupo humano informó asignación pasiva). Esta autoselección introduce un factor de confusión potencial: los estudiantes que eligieron el grupo con IA pueden haber sido más curiosos tecnológicamente o más insatisfechos con la instrucción tradicional. Abordamos esta limitación en la Sección 6.
3.2 Instrumento de encuesta
La encuesta se administró en chino a través de una plataforma de cuestionarios en línea (问卷星) el 28 de marzo de 2025. Comprendió las siguientes secciones:
(a) Datos demográficos: nombre (anonimizado antes del análisis), fecha de nacimiento, género (5 ítems). (b) Competencia lingüística previa: niveles MCER autoevaluados para chino, inglés, alemán, francés, japonés, coreano y hasta tres idiomas adicionales (9 ítems). (c) Lengua de estudio y nivel inicial: misma estructura que (b) pero para la lengua estudiada en el experimento (9 ítems). (d) Hábitos de estudio: tiempo diario de estudio en minutos, asignación de grupo, tiempo diario de uso de IA en minutos (3 ítems). (e) Razones para la elección del grupo: 5-6 razones valoradas por importancia relativa (porcentaje, sumando aproximadamente 100 %) (6-10 ítems según el grupo). (f) Métodos de aprendizaje con IA (solo grupo con IA): chatear con IA, completar tareas, aula VR, profesor IA — cada uno valorado por cuota de uso (5 ítems). (g) Razones de interés en el método actual: 9-10 razones valoradas por importancia (10 ítems). (h) Calidad y manejo de la retroalimentación de la IA (solo grupo con IA): valoración categórica y respuesta sí/no (2 ítems). (i) Mejora general autoinformada: estimación porcentual (1 ítem). (j) Importancia de la modalidad sensorial: 21 ítems que cubren percepción visual, auditiva, textual, gestual, espacial, táctil, olfativa, gustativa, social (3 subítems), emocional (2 subítems), inmersión RV (2 subítems) e inmersión IA (2 subítems), cada uno valorado 0-100 %. (k) Capacidad de modalidad sensorial: mismos 21 ítems, valorados por capacidad personal (0-100 %). (l) Satisfacción con el grupo y disposición a cambiar (4 ítems). (m) Actitudes hacia la IA: 14 afirmaciones valoradas 0-100 % de acuerdo. (n) Áreas de mejora: 10 áreas de competencia lingüística valoradas por mejora relativa (porcentaje, sumando aproximadamente 100 %) (11 ítems).
3.3 Procesamiento de datos
Las respuestas se registraron en una escala de 0-100 %, donde 0 % indica «nada en absoluto» y 100 % «completamente» o «exclusivamente». Para los ítems que requerían asignación porcentual entre múltiples opciones (p. ej., razones para la elección del grupo, áreas de mejora), se indicó a los encuestados que sus valoraciones debían sumar aproximadamente 100 %. No todos los encuestados lograron una suma exacta; informamos de los porcentajes brutos sin normalización. Los valores faltantes se excluyeron por pares. Todos los análisis estadísticos se realizaron utilizando Python (estadística descriptiva, sin pruebas inferenciales dado el carácter exploratorio y el diseño de autoselección).
4. Resultados
4.1 Tiempo de estudio diario y uso de la IA
Ambos grupos informaron tiempos de estudio diarios similares: grupo con IA media 106 minutos (mediana 60, DE 103), grupo humano media 96 minutos (mediana 60, DE 90). Las elevadas desviaciones estándar reflejan una amplia variación: algunos estudiantes estudiaban 10 minutos diarios, otros 360. Dentro del grupo con IA, el uso diario medio de IA fue de 32 minutos (mediana 15), lo que sugiere que la IA constituía aproximadamente el 30 % del tiempo total de estudio, dedicando el resto a libros de texto, ejercicios u otros métodos sin IA.
4.2 Mejora general autoinformada
El grupo con profesor humano informó una mejora general mayor después de un mes: media 63,2 % (mediana 70 %, DE 27,5 %, n=42) frente a la media del grupo con IA de 51,9 % (mediana 50 %, DE 18,1 %, n=82). Este hallazgo es notable: a pesar de tiempos de estudio similares, los estudiantes que aprendían con profesores humanos percibieron un mayor progreso. Sin embargo, la mayor desviación estándar del grupo humano (27,5 % frente a 18,1 %) indica experiencias más heterogéneas —algunos estudiantes del grupo humano informaron de una mejora muy alta (hasta el 100 %), mientras que otros informaron de tan solo el 5 %—.
4.3 Calidad de la retroalimentación de la IA
Entre los participantes del grupo con IA, las percepciones de la calidad de la retroalimentación de la IA fueron generalmente positivas: el 38 % la calificó como «muy pertinente» (75-100 puntos), el 54 % como «aceptable» (50-74 puntos) y solo el 4 % como «regular» (25-49 puntos). Ninguno la calificó como deficiente. Tres cuartos (76 %) informaron de que gestionaban la retroalimentación de la IA de manera oportuna, mientras que el 18 % no lo hacía.
4.4 Métodos de aprendizaje con IA
Los métodos de aprendizaje con IA más populares fueron chatear con el software de IA (cuota media de uso 68,6 %) y pedir a la IA que completara tareas (66,3 %). La funcionalidad de profesor de IA recibió un uso moderado (51,3 %), mientras que el aula de RV fue la menos utilizada (31,9 %). Este patrón sugiere que la IA conversacional —la interacción libre con el chatbot— domina el aprendizaje de lenguas asistido por IA en la actualidad, con herramientas pedagógicas de IA estructuradas desempeñando un papel secundario.
4.5 Motivaciones
Razones para elegir el grupo con IA (valoradas por importancia):
1. Novedad / probar cosas nuevas: 75,4 %
2. Aprender en cualquier momento y lugar: 72,5 %
3. Experiencia de aprendizaje inmersiva: 66,9 %
4. Aburrimiento con los métodos tradicionales: 60,8 %
5. Más barato que los profesores humanos: 59,9 %
Las dos principales motivaciones —la novedad y la flexibilidad— sugieren que los primeros adoptantes de la IA están impulsados más por la curiosidad y la conveniencia que por la insatisfacción con la enseñanza tradicional.
Lo que hace atractivo el aprendizaje con IA (valorado por importancia):
1. Sin miedo a cometer errores / presión reducida: 76,6 %
2. Gran base de conocimientos / temas diversos: 74,7 %
3. Aprender en cualquier momento y lugar: 71,9 %
4. Velocidad de respuesta rápida: 70,4 %
5. Ajuste adaptativo de la dificultad: 67,8 %
6. Velocidad, volumen y voz ajustables: 65,3 %
7. Más estímulo: 64,5 %
8. Mucho más barato: 59,4 %
9. Corrección de pronunciación más precisa: 58,5 %
La ventaja mejor valorada —«sin miedo a cometer errores» con un 76,6 %— se alinea con un corpus sustancial de investigación sobre la ansiedad ante las lenguas extranjeras. El chatbot de IA crea lo que los educadores lingüísticos llaman un «entorno de práctica de baja ansiedad» en el que los aprendices pueden experimentar sin vergüenza social.
Razones para elegir el grupo humano:
1. Preferencia por aprender con personas reales: 65,7 %
2. Estimula un pensamiento más profundo: 63,8 %
3. Mejor detección de problemas de aprendizaje: 63,6 %
4. Evaluación de nivel más precisa: 61,2 %
5. Métodos de retroalimentación más diversos: 60,5 %
6. Comunicación emocional en la retroalimentación: 58,2 %
7. Confianza en la enseñanza tradicional: 52,4 %
8. No querer cambiar de método: 52,3 %
9. La IA aún no está madura: 45,3 %
10. Asignación pasiva: 44,7 %
Las principales razones del grupo humano se centran en la profundidad relacional y cognitiva: los profesores humanos ofrecen conexión personal, pensamiento más profundo y evaluación más matizada. Esto contrasta con el énfasis del grupo con IA en la comodidad y el confort psicológico.
4.6 Áreas de mejora
Los estudiantes evaluaron su mejora en diez áreas específicas de competencia lingüística. Los resultados revelan una complementariedad notable:
Áreas donde el grupo con IA informó mayor mejora: - Expresión oral: +12,6 puntos porcentuales (IA 58,4 %, Humano 45,8 %) - Comprensión auditiva: +10,2 pp (IA 53,6 %, Humano 43,5 %) - Confianza en la comunicación: +8,3 pp (IA 55,2 %, Humano 46,9 %) - Sinónimos/expresiones variadas: +5,6 pp (IA 56,8 %, Humano 51,2 %)
Áreas donde el grupo humano informó mayor mejora: - Comprensión lectora: +14,0 pp (Humano 63,7 %, IA 49,8 %) - Gramática: +10,1 pp (Humano 57,0 %, IA 46,9 %) - Sintaxis: +9,3 pp (Humano 57,1 %, IA 47,8 %) - Vocabulario: +5,2 pp (Humano 60,7 %, IA 55,5 %) - Escritura: +5,0 pp (Humano 51,5 %, IA 46,5 %)
El patrón es claro: el aprendizaje asistido por IA parece fortalecer las competencias interactivas y orales (expresión oral, comprensión auditiva, confianza comunicativa), mientras que la enseñanza humana produce mayores ganancias en las competencias estructurales y analíticas (lectura, gramática, sintaxis). Este hallazgo tiene implicaciones pedagógicas directas: la IA y la instrucción humana pueden ser más eficaces no como sustitutos sino como complementos, cada uno abordando diferentes aspectos de la competencia lingüística.
4.7 Preferencias de modalidades sensoriales y sociales
Los participantes valoraron la importancia de doce modalidades sensoriales y sociales para su aprendizaje de lenguas. Surgieron varias diferencias importantes entre los grupos:
Modalidades valoradas más altamente por el grupo con IA: - Percepción auditiva: +40,7 pp (IA 79,6 %, Humano 38,9 %) - Texto escrito: +37,4 pp (IA 74,5 %, Humano 37,1 %) - Motivación intrínseca: +35,1 pp (IA 77,5 %, Humano 42,4 %) - Motivación extrínseca: +30,0 pp (IA 69,1 %, Humano 39,1 %) - Percepción visual: +29,3 pp (IA 74,6 %, Humano 45,2 %) - Emociones/motivación: +29,0 pp (IA 72,6 %, Humano 43,6 %) - Inmersión ambiental: +20,6 pp (IA 69,9 %, Humano 49,3 %) - Dinámica de grupo: +17,7 pp (IA 64,6 %, Humano 46,9 %)
Modalidades valoradas más altamente por el grupo humano: - Gusto: +32,1 pp (Humano 76,3 %, IA 44,2 %) - Inmersión profesor IA: +31,7 pp (Humano 83,9 %, IA 52,2 %) - Inmersión RV: +29,3 pp (Humano 83,0 %, IA 53,7 %) - Ética RV: +29,3 pp (Humano 81,3 %, IA 52,0 %) - Inmersión chatbot IA: +27,2 pp (Humano 79,4 %, IA 52,2 %) - Impresiones sociales: +21,5 pp (Humano 81,5 %, IA 59,9 %) - Olfato: +16,0 pp (Humano 59,8 %, IA 43,8 %)
Estos resultados requieren una interpretación cuidadosa. El grupo con IA atribuyó una importancia significativamente mayor a las modalidades primarias de aprendizaje de lenguas —visual, auditiva y textual— así como a los factores motivacionales. El grupo humano, paradójicamente, valoró la inmersión en IA y RV como más importante que el propio grupo con IA. Una interpretación es que los estudiantes del grupo humano, al no haber experimentado directamente la inmersión en IA, pueden idealizarla, mientras que los estudiantes del grupo con IA, al haber utilizado herramientas de IA a diario, son más mesurados en su evaluación.
La valoración más alta del grupo humano de las impresiones sociales (81,5 % frente a 59,9 %) es coherente con su preferencia declarada por aprender con personas reales y refleja la importancia de la presencia social en la educación lingüística —un factor que las herramientas de IA actuales, a pesar de los rápidos avances, no pueden replicar plenamente—.
4.8 Actitudes hacia la IA en la educación y la sociedad
Catorce afirmaciones actitudinales fueron valoradas en una escala de acuerdo 0-100 %. Los resultados revelan un panorama matizado:
Ambos grupos gustan mucho de los profesores humanos: grupo con IA 77,7 %, grupo humano 83,6 %. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA mantienen una fuerte apreciación por la instrucción humana.
El grupo con IA es más positivo hacia la enseñanza con IA: la aprobación del profesor de IA actual fue del 57,3 % (frente al 38,2 % en el grupo humano), y la aprobación del futuro profesor de IA avanzado fue del 66,4 % (frente al 53,3 %). Sin embargo, incluso en el grupo con IA, la aprobación del profesor de IA actual (57,3 %) es sustancialmente inferior a la aprobación del profesor humano (77,7 %).
Ambos grupos expresan temor a la dependencia de la IA: - «Miedo a que la IA sustituya la capacidad de pensar»: IA 60,1 %, Humano 61,0 % - «Miedo al deterioro de conocimientos/habilidades»: IA 60,6 %, Humano 66,5 % - «Miedo a perder independencia / adicción a la IA»: IA 59,6 %, Humano 71,6 %
El grupo humano informa consistentemente de un mayor temor a la dependencia de la IA, con la mayor diferencia en la adicción (71,6 % frente a 59,6 %). El grupo con IA, quizá a través de la experiencia directa, ha desarrollado una visión más moderada pero aún cautelosa.
Ambos grupos respaldan firmemente la ética de la IA: «Necesidad de controlar la IA con ética» recibió un 72,8 % (IA) y un 68,7 % (Humano) de acuerdo.
Ambos grupos rechazan el dominio de la IA: «Dejar que la IA controle a los humanos» recibió solo un 14,4 % (IA) y un 21,5 % (Humano) de acuerdo. «Solo robots de IA, sin humanos, es suficiente» recibió un 15,2 % y un 19,3 %. Estos hallazgos sugieren que los estudiantes universitarios chinos en 2025 mantienen una orientación firmemente humanista: acogen la IA como herramienta pero la rechazan como amo.
El apego romántico a la IA o a los profesores es mínimo: «Me enamoré de una IA» promedió aproximadamente el 20 % en ambos grupos, y «me enamoré de un profesor humano» promedió el 20-33 %. Estas cifras bajas sugieren que la interacción inmersiva con la IA no ha producido, para esta cohorte, la dependencia emocional que algunos comentaristas han predicho. El contexto cultural chino puede ser relevante aquí: la orientación pragmática hacia la IA como herramienta en lugar de como compañero, combinada con normas sociales claras en torno a las relaciones humanas, puede proporcionar un amortiguador cultural contra el apego parasocial que se ha documentado en algunos estudios occidentales de la interacción humano-IA.
La disposición a usar la IA como dispositivo de ahorro de trabajo fue moderada (aproximadamente el 39 % en ambos grupos), lo que sugiere que la mayoría de los estudiantes no ven la IA principalmente como un atajo. Combinado con el fuerte respaldo al control ético de la IA, este patrón indica una cohorte que ve la IA como útil pero limitada —una posición sofisticada que contradice los estereotipos de los estudiantes chinos como adoptantes acríticos de la tecnología—.
4.9 Análisis detallado de actitudes
Para comprender las actitudes matizadas con mayor claridad, podemos agrupar los catorce ítems actitudinales en clústeres temáticos:
Clúster A — Preferencia de enseñanza: - «Me gusta que un profesor humano me enseñe»: IA 77,7 %, Humano 83,6 % - «Me gusta que el profesor de IA actual me enseñe»: IA 57,3 %, Humano 38,2 % - «Me gustaría un futuro profesor de IA avanzado»: IA 66,4 %, Humano 53,3 %
Ambos grupos prefieren a los profesores humanos, pero el grupo con IA muestra una apertura significativamente mayor tanto a la instrucción actual como a la futura con IA. La diferencia de 20 puntos entre la aprobación del profesor humano (77,7 %) y la aprobación del profesor de IA actual (57,3 %) en el grupo con IA —después de una experiencia directa con herramientas de IA— sugiere que la familiaridad genera una apreciación cualificada más que entusiasmo.
Clúster B — Miedo a la IA: - «Miedo: la IA sustituye la capacidad de pensar»: IA 60,1 %, Humano 61,0 % - «Miedo: deterioro de conocimientos/habilidades»: IA 60,6 %, Humano 66,5 % - «Miedo: perder independencia, adicción a la IA»: IA 59,6 %, Humano 71,6 % - «Sin miedo: centrarse en otras áreas»: IA 55,7 %, Humano 53,4 %
Ambos grupos albergan una ansiedad sustancial sobre la atrofia cognitiva —una preocupación que los datos cualitativos de Fang Lu hacen vívida—. El mayor temor del grupo humano a la adicción (71,6 % frente a 59,6 %) puede reflejar una comprensión menos diferenciada de lo que la interacción con la IA realmente implica: lo desconocido es a menudo más aterrador que lo conocido.
Clúster C — Gobernanza de la IA: - «Necesidad de controlar la IA con ética»: IA 72,8 %, Humano 68,7 % - «Dar libertad a la IA para desarrollar la próxima generación»: IA 47,5 %, Humano 50,0 % - «Dejar que la IA controle a los humanos»: IA 14,4 %, Humano 21,5 % - «Solo robots de IA, sin humanos, es suficiente»: IA 15,2 %, Humano 19,3 %
Las actitudes hacia la gobernanza revelan una jerarquía clara: fuerte respaldo al control ético, ambivalencia sobre la autonomía de la IA y rechazo firme de la supremacía de la IA. La consistencia entre ambos grupos sugiere que estas actitudes reflejan un consenso generacional más amplio más que efectos específicos del grupo.
4.10 Satisfacción con el grupo y disposición al cambio
Ambos grupos informaron de una alta satisfacción con su asignación: grupo con IA 80,9 % (mediana 80 %), grupo humano 76,7 % (mediana 85 %). Sin embargo, la disposición a cambiar de grupo cuenta una historia diferente: el 47 % del grupo con IA y un notable 68 % del grupo humano expresaron disposición a cambiar. La alta tasa de cambio del grupo humano sugiere que muchos estudiantes del grupo humano sienten curiosidad por el aprendizaje asistido por IA incluso estando satisfechos con su experiencia actual —coherente con el momento cultural más amplio en el que la IA se percibe como novedosa y atractiva—.
Entre los encuestados del grupo con IA que describieron su preferencia de cambio, la respuesta más común fue «grupo con IA: conveniente» (便利), lo que sugiere que quienes permanecerían valoraban la accesibilidad práctica por encima de todo. Entre los encuestados del grupo humano, varios articularon posiciones reflexivas: «la IA aún no está madura» (AI不完善), «los métodos de enseñanza humana se adaptan mejor a mí» (human组的教学方法比较适合我), y notablemente: «prefiero explorar por mi cuenta. Los humanos nunca serán reemplazados por la IA» (我更喜欢自己探索。人类永远不会被AI取代) —una declaración que encapsula la posición humanista compartida por la mayoría de los encuestados—.
5. Discusión
Los resultados presentan un panorama matizado que resiste las conclusiones simples. Organizamos nuestra discusión en torno a cinco temas: la complementariedad de la instrucción con IA y humana, el diálogo con los ensayos complementarios de este volumen, el mecanismo de reducción de la ansiedad, las diferencias de modalidad y las implicaciones para la educación comparada europeo-china.
5.1 La tesis de la complementariedad
Nuestro hallazgo central —que el aprendizaje asistido por IA fortalece las competencias orales interactivas mientras que la enseñanza humana fortalece las competencias analíticas estructurales— apoya lo que llamamos la Tesis de la Complementariedad: la instrucción con IA y la instrucción humana no son sustitutos sino complementos, cada uno más adecuado para diferentes dimensiones de la competencia lingüística. Este hallazgo desafía tanto la posición tecnooptimista (que la IA reemplazará a los profesores humanos) como la posición tecnopesimista (que la IA no puede enseñar eficazmente).
El mecanismo es plausible y está fundamentado en la teoría establecida de adquisición de segundas lenguas. Los chatbots de IA proporcionan una práctica conversacional ilimitada, paciente y libre de juicios —precisamente las condiciones que promueven la fluidez en la expresión oral y la comprensión auditiva—. Esto se alinea con la Hipótesis de la Interacción de Long (1996), que postula que la interacción conversacional —incluyendo la negociación de significado, las reformulaciones y las verificaciones de comprensión— impulsa la adquisición lingüística. Los chatbots de IA proporcionan una interacción abundante, aunque sin los movimientos interaccionales humanos que Long enfatizaba. Los profesores humanos proporcionan instrucción estructurada, análisis de errores y explicación metalingüística —precisamente las condiciones que promueven la precisión gramatical, la comprensión lectora y la conciencia sintáctica—. Esto se alinea con la Hipótesis del Output de Swain (2000), que argumenta que los aprendices necesitan no solo input comprensible sino oportunidades para producir lengua y recibir retroalimentación correctiva que los impulse más allá de su competencia actual.
La Tesis de la Complementariedad tiene implicaciones prácticas: en lugar de debatir si la IA debería reemplazar a los profesores humanos (una pregunta que nuestros datos responden claramente: no), los educadores deberían preguntarse cómo pueden orquestarse la instrucción con IA y la instrucción humana para servir a diferentes objetivos de aprendizaje dentro de un currículo unificado.
5.2 Diálogo con Fang Lu
El estudio cualitativo de Fang Lu (en este volumen) identifica un riesgo crítico del aprendizaje de lenguas asistido por IA: la posible erosión del pensamiento crítico, la creatividad y el juicio independiente. Sus estudios de caso —un estudiante de nivel elemental cuya escritura asistida por IA era estructuralmente perfecta pero intelectualmente superficial, y un estudiante avanzado cuya traducción asistida por IA era fluida pero carecía de matiz cultural— ilustran el fenómeno de «arrancar las plántulas para ayudarlas a crecer» (拔苗助长): la IA acelera el rendimiento superficial mientras socava el desarrollo cognitivo más profundo.
Nuestros datos cuantitativos tanto respaldan como complican los hallazgos de Fang Lu. La mayor mejora del grupo humano en gramática y sintaxis —competencias que requieren razonamiento analítico más que reproducción de patrones— es coherente con su preocupación de que la IA puede eludir en lugar de desarrollar competencias cognitivas. Sin embargo, la mayor mejora del grupo con IA en confianza comunicativa sugiere que la IA cumple una función genuina e importante que la instrucción humana a menudo no logra proporcionar: crear un espacio psicológicamente seguro para la práctica oral.
La implicación no es que se deba evitar la IA, sino que su papel debe definirse cuidadosamente. La IA parece más beneficiosa para el desarrollo de la fluidez y la reducción de la ansiedad; la instrucción humana parece más beneficiosa para el desarrollo de la precisión y el pensamiento analítico. Un currículo bien diseñado desplegaría ambos.
5.3 Diálogo con Ole Döring
El artículo filosófico de Döring (en este volumen) cuestiona el concepto mismo de «inteligencia artificial» aplicado a la enseñanza, argumentando que la distinción de la tradición filosófica alemana entre Vernunft (razón, juicio) y Verstand (entendimiento, cálculo) revela un error categorial fundamental en las afirmaciones de que las máquinas pueden «enseñar». Lo que las máquinas hacen, argumenta Döring, es procesar —no comprender, no juzgar, no cuidar—.
Nuestros datos actitudinales resuenan con el análisis de Döring. Cuando los estudiantes dicen que les «gustan» los profesores humanos al 78-84 % pero solo les «gustan» los profesores de IA al 38-57 %, pueden estar respondiendo precisamente a la distinción que Döring identifica: el profesor humano ofrece Vernunft —juicio, cuidado, comprensión del aprendiz individual— mientras que la IA ofrece Verstand —cálculo, coincidencia de patrones, recuperación de información—. Ambos son útiles, pero no son equivalentes.
El fuerte respaldo de los estudiantes al control ético de la IA (70%+) y el firme rechazo del dominio de la IA (<20 %) respaldan aún más la posición humanista de Döring. Estos 133 estudiantes universitarios chinos, mientras utilizan con entusiasmo las herramientas de IA, mantienen un límite conceptual claro entre la agencia humana y la de la máquina.
5.4 El entorno libre de presión
La ventaja mejor valorada del aprendizaje con IA —«sin miedo a cometer errores» con un 76,6 %— merece especial atención. La ansiedad ante las lenguas extranjeras es una de las barreras más extensamente documentadas para la adquisición lingüística. Los entornos de aula tradicionales, con sus dinámicas sociales inherentes de actuación, juicio y «quedar bien», crean una ansiedad que inhibe la práctica, particularmente la práctica oral. El chatbot de IA sortea esto por completo: no hay audiencia, no hay juicio, no hay pérdida de imagen.
Este hallazgo sugiere que la contribución educativa principal de la IA puede no ser como profesora sino como compañera de práctica —una interlocutora incansable, paciente, que nunca juzga, nunca pierde la paciencia y nunca genera ansiedad social—. Si esto es correcto, el modelo educativo óptimo no es «IA en lugar de profesores humanos» sino «IA como complemento de los profesores humanos», específicamente para el componente de práctica del aprendizaje de lenguas donde la ansiedad más inhibe el rendimiento.
5.5 Diferencias de modalidad y sus implicaciones
Las grandes diferencias en las preferencias de modalidad sensorial entre los grupos —los estudiantes con IA valorando más altamente el input visual, auditivo y textual, los estudiantes con profesor humano valorando más altamente las impresiones sociales, la inmersión en RV y los sentidos físicos— sugieren que los dos grupos pueden tener orientaciones de aprendizaje fundamentalmente diferentes. Los estudiantes del grupo con IA parecen ser aprendices orientados cognitivamente que priorizan los canales de entrada de información. Los estudiantes del grupo humano parecen ser aprendices orientados social y físicamente que priorizan la experiencia relacional y corpórea.
Si estas diferencias son causas o consecuencias de la elección del grupo no está claro. Los estudiantes que prefieren los canales de entrada cognitivos pueden haber seleccionado el grupo con IA porque las herramientas de IA proporcionan precisamente esos canales. Alternativamente, un mes de aprendizaje asistido por IA puede haber habituado a los estudiantes a valorar el input cognitivo por encima de la experiencia social. Sería necesaria una investigación longitudinal para desentrañar estas posibilidades.
5.6 Implicaciones para la educación comparada europeo-china
Nuestros hallazgos tienen una relevancia específica para el diálogo educativo europeo-chino que aborda este volumen. La educación lingüística europea, configurada por el Marco Común Europeo de Referencia para las Lenguas (MCER) y el enfoque comunicativo, ha enfatizado tradicionalmente la competencia oral, la interacción y el aprendizaje basado en tareas. La educación lingüística china, configurada por la cultura orientada a los exámenes y la pedagogía de traducción gramatical, ha enfatizado tradicionalmente la lectura, la escritura, la gramática y el vocabulario. La aparición de la IA como compañera de práctica puede ayudar a cerrar esta brecha: los estudiantes chinos que carecen de oportunidades para la práctica oral auténtica con hablantes humanos pueden usar la IA para desarrollar las competencias comunicativas que priorizan los enfoques pedagógicos europeos.
Al mismo tiempo, el énfasis europeo en el pensamiento crítico, la autonomía del aprendiz y la práctica reflexiva —valores articulados en el Plan de Acción de Educación Digital de la UE (2021-2027)— proporciona un contrapeso necesario al riesgo de que la práctica con IA pueda desarrollar la fluidez sin profundidad. Los estudios de caso de Fang Lu ilustran este riesgo de manera concreta: el estudiante cuya escritura asistida por IA era fluida pero intelectualmente vacía había desarrollado una competencia superficial sin el compromiso cognitivo más profundo que promueve la interacción humana.
Un modelo europeo-chino de educación lingüística integrada con IA podría, por lo tanto, combinar la adopción entusiasta de las herramientas de IA por parte de los estudiantes chinos con los marcos pedagógicos europeos que insisten en el pensamiento crítico y la práctica reflexiva. La tecnología proporciona el medio; la pedagogía proporciona el propósito.
5.7 Recomendaciones para la práctica
Basándonos en nuestros hallazgos, ofrecemos cuatro recomendaciones para los educadores que consideren la integración de la IA en la enseñanza de lenguas extranjeras:
Primera, utilizar la IA para la práctica oral, no como sustituto de la instrucción. Los datos sugieren que la mayor contribución de la IA está en el desarrollo de la fluidez oral y la confianza comunicativa a través de la práctica conversacional de baja ansiedad. Esta función complementa en lugar de reemplazar la instrucción humana.
Segunda, mantener la enseñanza humana para las competencias analíticas. Gramática, sintaxis, comprensión lectora y escritura —las competencias que mostraron mayor mejora en el grupo humano— parecen beneficiarse de la instrucción estructurada, explicativa y correctiva que proporcionan los profesores humanos.
Tercera, abordar la ansiedad de los estudiantes ante la IA de manera proactiva. Más del 60 % de los estudiantes en ambos grupos expresaron temor a que la IA reemplace su capacidad de pensamiento o erosione sus habilidades. Estas preocupaciones son legítimas y deben abordarse mediante una discusión explícita de las limitaciones de la IA, marcos éticos para el uso de la IA y tareas que requieran pensamiento crítico independiente.
Cuarta, diseñar evaluaciones que la IA no pueda sortear. Como ilustran los casos de Fang Lu, la IA puede producir resultados pulidos que enmascaran una comprensión superficial. Las evaluaciones deben incluir exámenes orales, respuestas espontáneas y tareas que requieran razonamiento analítico genuino —áreas donde la asistencia de IA es inaccesible o visiblemente artificial—.
6. Limitaciones
Varias limitaciones condicionan la interpretación de estos resultados:
Primera, el estudio se basa enteramente en datos autoinformados. Las percepciones de los estudiantes sobre su mejora pueden no corresponderse con su mejora real medida mediante pruebas estandarizadas. Un diseño con pruebas previas y posteriores proporcionaría evidencia más robusta.
Segunda, la asignación no aleatoria de los grupos introduce un sesgo de autoselección. Los estudiantes que eligieron el grupo con IA pueden diferir sistemáticamente de aquellos que eligieron o fueron asignados al grupo humano —en alfabetización tecnológica, motivación de aprendizaje, personalidad u otras variables no medidas—. El mayor porcentaje masculino del grupo con IA (26 % frente a 11 %) y su rango de edad más amplio sugieren algunas diferencias demográficas, aunque la significación práctica de estas diferencias para los resultados del aprendizaje de lenguas no está clara.
Tercera, el período de observación de un mes es corto. El aprendizaje de lenguas es un proceso a largo plazo, y las ventajas relativas de la instrucción con IA frente a la humana pueden cambiar en períodos más largos. La ventaja del grupo con IA en expresión oral puede ser una ganancia de fluidez en fase temprana que alcanza una meseta, mientras que la ventaja del grupo humano en gramática puede acumularse con el tiempo.
Cuarta, la muestra se compone enteramente de estudiantes universitarios chinos, predominantemente mujeres, que estudian inglés o alemán. La generalización a otros contextos culturales, grupos de edad, géneros o lenguas meta es incierta. Debe enfatizarse la especificidad cultural de nuestros hallazgos: el énfasis de la cultura del aula china en la preservación de la imagen y la autoridad del profesor puede amplificar los beneficios de reducción de la ansiedad de la IA de maneras que serían menos pronunciadas en culturas con relaciones profesor-estudiante más informales.
Quinta, todas las mediciones son autoinformadas. Los datos de «áreas de mejora» (Sección 4.6) representan las percepciones de los estudiantes sobre dónde mejoraron, no ganancias medidas objetivamente. Los estudiantes pueden sobreestimar la mejora en áreas que más practicaron (confundiendo práctica con progreso) o subestimar la mejora en áreas donde las ganancias se perciben de manera menos consciente.
Sexta, la encuesta se realizó en un único punto temporal. Los datos longitudinales —que rastreen la motivación, las actitudes y los resultados a lo largo de un semestre o año completo— proporcionarían un panorama más rico. Un estudio de seguimiento con los mismos participantes después de seis meses o un año de estudio continuado sería particularmente valioso para comprobar si la Tesis de la Complementariedad se mantiene a lo largo de períodos de aprendizaje más largos.
A pesar de estas limitaciones, el estudio ofrece una de las investigaciones comparativas con mayor muestra disponibles hasta la fecha sobre el aprendizaje de lenguas asistido por IA frente al enseñado por humanos, y la amplitud del instrumento de encuesta —que cubre motivación, preferencias de modalidad, actitudes y mejora específica por competencias— proporciona un panorama multidimensional que la mayoría de los estudios existentes carecen.
7. Conclusión
Este estudio de 133 estudiantes universitarios chinos que aprenden lenguas extranjeras con asistencia de IA (n=85) y con profesores humanos (n=48) arroja cuatro hallazgos principales:
Primero, los estudiantes con profesor humano informaron una mejora general mayor (63,2 % frente a 51,9 %), pero el patrón es específico por competencias: los estudiantes con IA mejoraron más en expresión oral (+12,6 pp), comprensión auditiva (+10,2 pp) y confianza comunicativa (+8,3 pp), mientras que los estudiantes con profesor humano mejoraron más en lectura (+14,0 pp), gramática (+10,1 pp) y sintaxis (+9,3 pp). Esto apoya una Tesis de la Complementariedad: la instrucción con IA y la instrucción humana sirven funciones diferentes y complementarias en la educación lingüística.
Segundo, la principal ventaja percibida del aprendizaje con IA no es informativa sino psicológica: «sin miedo a cometer errores» fue la mejor valorada con un 76,6 %. La mayor contribución de la IA a la educación lingüística puede ser crear un entorno libre de presión para la práctica oral —abordando una de las barreras más persistentes para la adquisición lingüística—.
Tercero, ambos grupos mantienen actitudes firmemente humanistas. Incluso después de un mes de aprendizaje asistido por IA, los estudiantes del grupo con IA valoran a los profesores humanos por encima de los profesores de IA (77,7 % frente a 57,3 %). Ambos grupos respaldan el control ético de la IA (>68 %) y rechazan el dominio de la IA sobre los humanos (<22 %).
Cuarto, la valoración paradójicamente más alta del grupo humano de la inmersión en IA y RV sugiere curiosidad por tecnologías que no han experimentado, mientras que la evaluación más mesurada del grupo con IA refleja el efecto moderador del uso real.
Estos hallazgos tienen claras implicaciones para el diseño educativo. La evidencia no apoya reemplazar a los profesores humanos con IA, ni tampoco excluir la IA de la educación lingüística. En su lugar, apunta hacia un modelo integrado en el que la IA sirve como compañera de práctica complementaria —proporcionando la práctica conversacional ilimitada y libre de juicios que desarrolla la fluidez oral y la confianza comunicativa— mientras los profesores humanos proporcionan la instrucción estructurada, la orientación analítica y la presencia social que desarrollan la competencia gramatical, la comprensión lectora y el pensamiento crítico. Tal modelo honraría tanto las posibilidades tecnológicas documentadas en nuestros datos como las preocupaciones filosóficas articuladas por Döring y las advertencias pedagógicas articuladas por Fang Lu.
Estos hallazgos tienen claras implicaciones para el diseño educativo. La evidencia no apoya reemplazar a los profesores humanos con IA, ni tampoco excluir la IA de la educación lingüística. En su lugar, apunta hacia un modelo integrado que aprovecha las fortalezas complementarias de ambos: la IA para el desarrollo de la fluidez y la reducción de la ansiedad, los profesores humanos para el desarrollo de la precisión y el pensamiento crítico. A medida que las capacidades de la IA continúan avanzando, la cuestión no será si usar la IA en la educación lingüística sino cómo usarla sabiamente —una cuestión que requiere investigación empírica continua, reflexión filosófica e innovación pedagógica—.
Agradecimientos
Cofinanciado por la Unión Europea. Las opiniones expresadas son exclusivamente las del autor y no reflejan necesariamente las de la Unión Europea [101126782].
Agradecemos a los estudiantes participantes por sus respuestas sinceras y a los colegas que administraron la encuesta.
Referencias
Chapelle, C. A. (2001). Computer Applications in Second Language Acquisition. Cambridge University Press.
Döring, O. (en este volumen). AI and pedagogy: Between artificial intelligence and human understanding.
Garrett, N. (2009). Computer-assisted language learning trends and issues revisited: Integrating innovation. The Modern Language Journal, 93(s1), 719–740.
Godwin-Jones, R. (2015). Contributing, creating, curating: Digital literacies for language learners. Language Learning & Technology, 19(3), 8–20.
Golonka, E. M., Bowles, A. R., Frank, V. M., Richardson, D. L. & Freynik, S. (2014). Technologies for foreign language learning: A review of technology types and their effectiveness. Computer Assisted Language Learning, 27(1), 70–105.
Horwitz, E. K., Horwitz, M. B. & Cope, J. (1986). Foreign language classroom anxiety. The Modern Language Journal, 70(2), 125–132.
Huang, W., Hew, K. F. & Fryer, L. K. (2022). Chatbots for language learning — Are they really useful? A systematic review of chatbot-supported language learning. Journal of Computer Assisted Learning, 38(1), 237–257.
Jeon, J. (2022). Exploring AI chatbot affordances in the EFL classroom: Young learners' experiences and perspectives. Computer Assisted Language Learning, 37(1–2), 1–26.
Kim, N. Y. (2019). A study on the use of artificial intelligence chatbots for improving English grammar skills. Journal of Digital Convergence, 17(8), 37–46.
Krashen, S. D. (1982). Principles and Practice in Second Language Acquisition. Pergamon Press.
Lai, C. & Zheng, D. (2018). Self-directed use of mobile devices for language learning beyond the classroom. ReCALL, 30(3), 299–318.
Long, M. H. (1996). The role of the linguistic environment in second language acquisition. In W. C. Ritchie & T. K. Bhatia (Eds.), Handbook of Second Language Acquisition (pp. 413–468). Academic Press.
Lu, F. (en este volumen). AI in Chinese teaching: Opportunities and challenges from the perspective of critical thinking.
MacIntyre, P. D. & Gardner, R. C. (1994). The subtle effects of language anxiety on cognitive processing in the second language. Language Learning, 44(2), 283–305.
Swain, M. (2000). The output hypothesis and beyond: Mediating acquisition through collaborative dialogue. In J. P. Lantolf (Ed.), Sociocultural Theory and Second Language Learning (pp. 97–114). Oxford University Press.
World Economic Forum. (2025). The Future of Jobs Report 2025. Geneva: WEF.