Predicción de la deserción estudiantil utilizando la técnica de árboles de decisión en la escuela de posgrado de la Universidad Nacional José Faustino Sánchez Carrión
Abstract
La presente tesis analiza el problema de determinar si existe una relación entre las variables de estudio deserción estudiantil y técnicas de árbol de decisión. Se planteó como hipótesis general la afirmación que es posible aplicar la metodología de minería de datos denominada “árboles de decisión” para crear un modelo de predicción del comportamiento de la deserción estudiantil de la población de la Escuela de Posgrado de la UNJFSC, ello significó la construcción de un modelo de simulación utilizando el software Weka y la captura de datos en relación a los atributos de las circunstancias personales de los estudiantes; para ello se utilizó un cuestionario de 20 ítems el cual fue aplicado a la muestra de 237 estudiantes matriculados en el ciclo 2019-2. Además, se obtuvieron los datos de los matriculados a través de los registros académicos de la Escuela de Posgrado de la UNJFSC para determinar la deserción real de la muestra a la fecha del estudio. Realizado el modelo, se lograron identificar los principales factores que afectan la deserción estudiantil según el análisis estadístico realizado por el software Weka, los cuales fueron graficados en un árbol de decisiones. Dicho modelo de simulación obtuvo una exactitud del 87,76% y una concordancia, medida a través del índice Kappa de Cohen de un valor de 0,6663, al cual le corresponde una valoración de “concordancia considerable” o “buena” según distintas aproximaciones teóricas. Como principal conclusión se halló la demostración de la hipótesis general de la investigación al haberse encontrado una concordancia moderada entre el modelo de simulación y los registros de los casos de deserción real registrados por los estudiantes de la muestra a través del índice Kappa con un valor de 0,6663 (concordancia considerable) generado por el software Weka