El Portal de las Tecnologías para la Innovación

Los datos de tutores inteligentes ayudan a predecir los resultados académicos de K-12, según un estudio

Una nueva investigación muestra que los datos de corto horizonte pueden ayudar a predecir el rendimiento de los estudiantes a largo plazo, lo que podría ayudar en la personalización de edtech y la toma de decisiones de los maestros.

El aprendizaje digital se ha convertido en la norma en la educación, pero evaluar su efectividad sigue siendo un desafío. En la configuración K-12, los resultados de un sistema de tutoría o juego educativo a menudo llegan mucho después de que los estudiantes se hayan comprometido con la herramienta. Las evaluaciones poco frecuentes, como los exámenes estatales al final de un año escolar, dificultan la identificación de los estudiantes que pueden sobresalir o fallar, y retrasan a los investigadores para medir el impacto del software educativo.

Investigadores de Stanford, War Child Alliance y Carnegie Learning investigaron si los modelos de aprendizaje automático podrían usar los registros de los estudiantes desde sus primeras horas de uso de una herramienta de software educativo para predecir los resultados finales de las pruebas externas después de meses de uso. El estudio, “Predecir los Resultados de los Estudiantes a Largo Plazo de los Datos de Registro de EdTech a Corto Plazo”, presentado en LAK ’25: Proceedings of the 15th International Learning Analytics and Knowledge Conference 2025, encontró que los datos de solo dos a cinco horas de actividad con un tutor inteligente o un juego de aprendizaje pueden proporcionar información valiosa sobre cómo se desempeñarán los estudiantes en evaluaciones externas estándar varios meses después.

“En educación, a menudo estamos interesados en resultados retrasados como las evaluaciones de fin de año, pero sería útil si pudiéramos predecir esos resultados utilizando cantidades más cortas de datos de plataformas de software educativo, dice el autor principal Emma Brunskillprofesor asociado de informática y miembro de la facultad del Instituto Stanford de Inteligencia Artificial Centrada en el Humano (HAI). “Informado por tales predicciones, los maestros o el software en sí podrían ofrecer un apoyo más personalizado a los estudiantes que están luchando y plantear nuevos desafíos para aquellos que están prosperando.”

Encontrar las características comunes

La investigación previa en esta área se ha centrado en el uso de datos de un año de productos edtech para predecir los resultados en los exámenes de fin de año, un método que lleva mucho tiempo generar resultados. Otros estudios han utilizado unos minutos de actividad estudiantil para predecir los resultados a corto plazo una hora más tarde, lo que no proporciona información sobre el impacto a más largo plazo de las herramientas tecnológicas. Los investigadores de Stanford querían ver si podían obtener predicciones significativas para el rendimiento de fin de año utilizando datos de un período de tiempo relativamente corto con un juego educativo o un tutor inteligente. Apoyado en parte por un Stanford HAI Seed Research Grant, el equipo trató de examinar si una pequeña cantidad de uso de la plataforma edtech, en el orden de unas pocas horas, podría usarse con algoritmos de aprendizaje automático para predecir los resultados de las pruebas externas de los estudiantes después de varios meses de uso.El equipo utilizó datos de tres herramientas tecnológicas educativas diferentes y grupos de estudiantes para evaluar qué tan bien podría generalizarse su enfoque en una variedad de plataformas y poblaciones.

El primer conjunto de datos provino de una colaboración con Canoct Espera para Aprender (CWTL Reading), un producto de juego de alfabetización diseñado para apoyar a los niños que viven en áreas afectadas por conflictos. Para este estudio, la organización matriz, War Child, compartió datos de sus estudiantes en Uganda. El segundo y tercer conjunto de datos provino de dos sistemas de tutoría de matemáticas, iReady y MATHia, ambos utilizados por estudiantes de secundaria en los Estados Unidos.

En educación, a menudo estamos interesados en resultados retrasados como evaluaciones de fin de año, pero sería útil si pudiéramos predecir esos resultados utilizando cantidades más cortas de datos de plataformas de software educativoEmma BrunskillProfesor asociado de informática y afiliado de la facultad de HAI

Gao Ge, un académico postdoctoral en ciencias de la computación que está afiliado al grupo AI for Human Impact (AI4HI) y Laboratorio IA Stanford (SAIL), dice que era importante identificar las características comunes que podrían extraerse de los datos de registro de cada plataforma, sin requerir un conocimiento específico del dominio de la herramienta, la demografía de los estudiantes o los datos de rendimiento previos para los estudiantes. Usando una metodología de árbol de decisión –, una técnica que divide la información en grupos más pequeños y reveladores – para descubrir qué factores son los más importantes para el rendimiento de students’ los académicos encontraron que características como el porcentaje de veces que el estudiante tuvo éxito en un problema (su tasa de éxito) y el número promedio de veces que un estudiante intentó un problema se clasificaron como criterios principales que podrían generalizarse en todas las plataformas.

“Al centrarnos en características ampliamente similares que probablemente estén presentes en muchas plataformas educativas, podemos evaluar las similitudes y diferencias entre los entornos,” explica. Con el conjunto de características determinado, el equipo estaba listo para comparar el rendimiento de tres modelos populares de aprendizaje automático para predecir los resultados de los estudiantes para el horizonte temporal dado y en los tres contextos de aprendizaje.

Identificando los extremos

Gao y sus colegas destacan varios hallazgos clave de este estudio. En primer lugar, los resultados muestran que los datos de dos a cinco horas de uso del software edtech son suficientes para predecir si es probable que un estudiante caiga en los extremos – en el quintil inferior o en el quintil superior – en una evaluación retrasada que ocurre después de meses de usar la herramienta. Aunque los modelos de aprendizaje automático no pudieron predecir los resultados precisos de los estudiantes en un examen, como una puntuación exacta o la colocación del percentil en un examen, los investigadores sugieren que poder identificar los resultados más bajos y más altos en un examen es información valiosa para desarrolladores de software y educadores por igual. “Nuestros hallazgos sugieren direcciones futuras interesantes para crear sistemas que puedan alertar a los educadores o proporcionar apoyo o desafío adicional en el sistema de tutoría,” Gao dice.

El equipo comparó los resultados del estudio con escenarios en los que los estudiantes toman una evaluación previa. Aquí, encontraron que los datos a corto plazo ofrecen un poder predictivo similar al de una puntuación separada previa a la prueba, y ocasionalmente la combinación de ambos ofrece un beneficio adicional. Esto es importante porque, en muchos entornos, no siempre es práctico o deseable dar a cada estudiante una evaluación previa antes de comenzar a usar una herramienta de edtech.

Implicaciones para desarrolladores y educadores

Gao dice que el equipo está satisfecho de que su enfoque tuviera una precisión bastante alta para predecir los resultados más altos y más bajos. Aunque se necesita más exploración, cree que los predictores habilitados por este estudio podrían usarse para mejorar la personalización en el software edtech, así como para ayudar a los maestros a tomar mejores decisiones sobre cómo usan los recursos del aula.

“Nuestro objetivo es ayudar a los maestros a intervenir en el momento justo para alentar y celebrar el progreso,”, dice. “Si podemos colaborar con los desarrolladores de sistemas de tutoría inteligentes, pueden mejorar sus productos para dar a los profesores más pistas sobre el rendimiento de sus alumnos.” Stanford Report. G. G., A. L., A. J., J. T., H. A., S. F. y E. B. Traducido al español

Artículos relacionados

Scroll al inicio