
La inteligencia artificial que imita a los profesores
Evaluación ·
Un innovador estudio liderado por la UPV determina que estas aplicaciones pueden replicar en un 70% la capacidad correctora de los docentes en formaciónSecciones
Servicios
Destacamos
Evaluación ·
Un innovador estudio liderado por la UPV determina que estas aplicaciones pueden replicar en un 70% la capacidad correctora de los docentes en formaciónEl progreso de la inteligencia artificial en numerosos ámbitos de la sociedad es ya imparable. Uno de los estamentos en los que se está adentrando ... con más fuerza es el de la educación, en el que se busca cómo esta herramienta puede facilitar, en especial, el trabajo de los docentes, que son los principales transmisores del conocimiento en el centro educativo.
Con ese fin, un equipo de investigadores de la UPV/EHU, liderado por Héctor Galindo-Domínguez, ayudado por personal de la Université de Pau, de Francia, dio vuelo hace un año a un proyecto cuyo objetivo «era el de valorar el impacto de la IA en las evaluaciones educativas de docentes en formación». Para tal propósito, convocaron a 507 estudiantes de Magisterio de la UPV/EHU para que corrigieran una serie de textos. Pero no eran unos textos cualquiera, «si no unos creados por herramientas de inteligencia artificial», apunta Galindo, como ChatGPT de OpenAI, Gemini de Google y Copilot de Bing. El experimento, «que ha sido la fase de inicial de una investigación más potente que vamos a llevar a cabo», se fundamentó en conocer de qué manera el conocimiento y el criterio de los jóvenes profesores vascos está relacionado con la capacidad de la IA para corregir.
Ante la complejidad de conseguir cientos de textos escritos por alumnos reales y dado el caracter experimental de esta investigación, Galindo y sus compañeros de investigación probaron a pedir a las herramientas de IA que elaborasen 12 textos simulando ser un niño de 10 años -equivalente a 5º de Primaria-. «Utilizamos cuatro tipologías: tres textos descriptivos, tres narrativos, tres argumentativos y tres instructivos. Estos 12 textos estaban también divididos en cuanto a su calidad: cuatro excelentes, cuatro mediocres y cuatro muy mejorables».
Después, se estableció la rúbrica de evaluación, «que es una matriz en formato de tabla en la que se recogen los criterios de evaluación y los niveles de logro», aclara el investigador de la UPV/EHU. Por ejemplo, en la estructura del texto habría distintos de esos niveles de logro, «como excelente, muy bueno, normal o malo». Entre los criterios de corrección se encontraba el contenido, la organización, el vocabulario y la coherencia. Para cada una de estas pautas, existían cuatro niveles de logro: excelente, bueno, regular o pobre.
Los estudiantes de la facultad de Educación de la UPV/EHU, una vez recibidos los textos y las rúbricas de evaluación, corrigieron los escritos generados por la IA. 507 modelos de evaluación diferentes, correspondientes al mismo número de profesores en formación que han participado en el proyecto. «Fue un trabajo laborioso el de analizar las correcciones de todos los participantes y compararlas con las que habían efectuado las diferentes herramientas de inteligencia artificial que hemos utilizado para esta investigación». La primera conclusión, según Galindo, «fue comprobar el grado de relación existente entre las calificaciones de los docentes en formación y las de la IA». Observaron que existen inteligencias artificiales que replican con más precisión el comportamiento humano que otras. En el caso concreto de ChatGPT, se descubrió que replicaba el comportamiento de los docentes en formación «con casi un 70% de precisión». Es decir, de cada 10 textos, «7 tenían una puntuación excesivamente similar a la de los profesores en formación».
El rendimiento académico de los maestros en formación también resultó ser clave dentro del estudio. Esto es, «los jóvenes que participaron y tenían mejores notas se ha visto en este experimento que daban unas evaluaciones mucho más alineadas con las de la inteligencia artificial». Dándole la vuelta a esta idea, se entiende que «la IA está empezando a replicar en un mayor grado las calificaciones proporcionadas por los profesores en formación con mejores expedientes académicos». Una vez explicado el proceso mediante el cual se ha llevado a cabo este experimento en el ámbito educativo, Galindo resalta que «no pretendemos que el profesor deje de corregir. Lo va a tener que seguir haciendo y va a tener que seguir dando feedback a sus alumnos...». Con todo, vista la velocidad de crucero que está cogiendo la IA, «esta puede ser de mucha ayuda para la comunidad docente. Animo a los profesores especializados en tecnología educativa a enseñar este tipo de conocimientos en la formación inicial del profesorado», señala el investigador de la UPV/EHU.
Héctor Galindo-Domínguez
Los profesores que están más capacitados en el ámbito digital «gestionan mejor su tiempo. Es algo que pudimos observar en unos estudios que hicimos». Esta optimización del tiempo implica «que el estrés se reduzca y se sientan más hábiles para desarrollar otro tipo de actividades relacionadas con la docencia».
La investigación ha sido presentada recientemente en la revista científica 'Edutec' y de la misma también se extraía que el género «no pareció influir significativamente en la precisión de las evaluaciones. Esto es algo que refuerza la capacidad de la IA para ser una herramienta de apoyo inclusiva y efectiva». En un contexto de «aulas numerosas» y en las que el profesor destina tanto tiempo a tareas asociadas con la evaluación, «este estudio invita a pensar que la IA podría permitir a los docentes destinar más tiempo a la inclusión o la personalización de la enseñanza».
¿Ya eres suscriptor/a? Inicia sesión
Publicidad
Publicidad
Te puede interesar
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.