Predictive Model Design applying Data Mining to identify causes of Dropout in University Students

Petra Norma Maya Pérez, Jorge R. Aguilar C,, Rosa A. Zamora R., J. Miguel Barron A.

Abstract


This paper presents a prediction model developed with techniques and methods Data Mining (DM) with classification rules and selection of attributes. The objective is to identify patterns related to the aspects of greater influence in the for school dropout in Higher Education Institutions (IES) in the Mexico State. The research begins with an exploratory, correlational and explanatory analysis, guided by the strategy and the life cycle of a DM project. Subsequently, the training of the model is carried out with a sample of 170 students, in which different classification algorithms are applied (JRIP, OneR, ZeroR, J48, REPTree) and selection (CfsSubsetEval and BestFirst). The best results are obtained in the identification of the causes that impact school dropout and failure by 66%, with respect to the causes reported by the IES and error margin of 47% in J48 algorithm with a confidence factor of 0.60, 0.75 and 1.0. The implemented method obtains, a satisfactory approach is achieved to address the phenomenon of dropout or failure in the Universities.


Full Text:

PDF (SPANISH)

References


Álvarez, L. (2009). Comportamiento de la Deserción y Reprobación en el Colegio de Bachilleres del Estado de Baja California: Caso Plantel Ensenada. X Congreso Nacional de Investigación Educativa. Veracruz, Veracruz, México.

Araque, F., Roldán, C., y Salguero, A. (2009). Factors Influencing University Drop Out Rates. Computers y Education, 53(3), 563 - 574.

Atlantia, S. (2014). Reporte Cualitativo. Investigación sobre las causas de la deserción escolar en México. Recuperado de http://atlantiasearch.com/wp-content/uploads/2014/12/CO-RS-2013-04-Reporte-Deserci%C3%B3n-escolar-en-M%C3%A9xico-1.pdf

Calders, T., y Pechenizkiy, M. (2011). Introduction to the special section on educational data mining. ACM SIGKDD Explorations Newsletter, 13(2), 3 - 6. doi:10.1145/2207243.2207245.

Cendejas, J. (2014). Implementación del modelo integral colaborativo (MDSIC) como fuente de innovación para el desarrollo ágil de software en las empresas de la zona centro - occidente en México. (Tesis Doctoral. Centro Interdisciplinario de Posgrados, Investigación y Consultoría UPAEP). Puebla, México.

Formia, S. (2013). La deserción en cursos universitarios. Construcción de modelos sobre datos de la UNRN usando técnicas de Extracción de Conocimiento. (Tesis Magsiter, Facultad de Informática, UNLP). Argentina.

Galán, V. (2015). Aplicación de la Metodología CRISP-DM a un proyecto de Minería de Datos en el entorno Universitario. (Tesis de grado.Escuela Politecnica Superior, Ingeniería en Informática, Universidad Carlos III de Madrid). Madrid: Recuperado de http://e-archivo.uc3m.es/bitstream/handle/10016/22198/PFC_Victor_Galan_Cortina.pdf?sequence=1.

Girones J., Casas J., Minguillón J. y Cauhuelas R. (2017). Minería de datos. Modelos y Algoritmos. Recuperado de https://edoc.site/mineria-de-datos-modelos-y-algoritmospdf-pdf-free.html

Hernández, J., Ramírez, M.J., y Ferri, C. (2014). Introducción a la Minería de Datos. España: Pearson.

Hernández, R., Fernández, C., y Baptista, M. (2010). Metodología de la investigación. México: Mc Graw-Hill.

Herrero, J., y Molina, J. (2012). Técnicas de análisis de datos. Aplicaciones Prácticas utilizando Microsoft Excel y WEKA. Madrid, España: Universidad Carlos III.

Machine Learning at Waikato University. (s.f.). Isla Norte, New Zealand. Recuperado de https://www.cs.waikato.ac.nz/ml/weka/book.html

Márquez, C., Romero, C., y Ventura, S. (2013). Predicting School Failure and Dropout by Using Data Mining Techniques. IEEE Journal of Latin-American Learning Technologies, 8(1), 7-14.

Más-Estellés, J., Alcover, R., Dapena, A., Valderruten, A., Satorre, F., Llopis, F., y otros. (2009). Rendimiento Académico de los Estudios de Informática en Algunos Centros Españoles. XV Jornadas de Enseñanza Universitaria de la Informática, 5 - 12 Recuperado de: http://upcommons.upc.edu/bitstream/handle/2099/7904/p156.pdf.

Maya, P., Aguilar , C., Zamora , R., y Barron, A. (2016). Propuesta del Diseño de un Modelo Predictivo de alerta temprana en indicadores educativos de Nivel Superior aplicando Minería de Datos. Revista de Aplicación Científica y Técnica 2016, 2(4), 29-40.

Rodríguez, Y., y Díaz, A. (2009). Herramientas de Minería de Datos. Revista Cubana de Ciencias Informáticas, 3(3 - 4), 73 - 80.

Saunders, Lewis, P., y Thornhill, A. (2009). Research methods for business students (Fifth ed.).England: Pearson Education.

SEP-SIGED. (2014). Sistema de Información y Gestión Educativa. Recuperado de: http://www.siged.sep.gob.mx/.

SEP-SNIEE. (2014). Sistema Nacional de Información Estadística Educativa. Estadísticas Educativas. Recuperado de http://www.snie.sep.gob.mx/estadisticas_educativas.html.

Treviño, M., Ibarra, S., Castán, J., Laria, J., y Guzmán, J. (2013). A Framework to avoid Scholar Desertion using Artificial Intelligence. Proceedings of the World Congress on Engineering, 3, 1493-1497. Recuperado de http://www.iaeng.org/publication/WCE2013/WCE2013_pp1493-1497.pdf

Valero, S., Vargas, A., y García , M. (2010). Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos. En M. Prieto, Tecnologías del Aprendizaje . Merida: Kaambal.

Waikato University. (s.f.). Weka 3: Data Mining Software in Java. Isla Norte, New Zealand. Recuperado de https://www.cs.waikato.ac.nz/ml/weka/index.html.

Witten, I., Frank, E., y Hall, M. (2011). Data mining, Practical machine learning tools and techniques. USA: Morgan Kaufmann.


Refbacks

  • There are currently no refbacks.