La presente investigación propone la implementación de un sistema de predicción para reducir la deserción estudiantil en el programa de Ingeniería de Sistemas de la Fundación Universitaria Compensar, modalidad virtual. Se pretende abordar la problemática de deserción mediante la aplicación de técnicas de análisis de datos, específicamente KDD, semma y CRISP-DM. El enfoque circunda la centralización de la información estudiantil dispersa en diferentes unidades de negocio dentro de la institución y, de esta forma, integrarla en un sistema que permita prospectar casos específicos de deserción. Consecuentemente, se propone aprovisionar a través de cursos interactivos y guías claras a la plataforma e-learning institucional. En adición, se busca evaluar la asistencia, las notas y las calificaciones para identificar patrones de deserción. En adición a lo anterior, la recopilación de datos se realizará mediante un sistema de información que integre archivos de Excel y utilice herramientas de Big Data para análisis. La metodología incluirá la aplicación de procesos analíticos para generar informes en Power BI, ofreciendo una visión detallada y prospectiva de los estudiantes con mayor riesgo de deserción. Finalmente, el objetivo ulterior del estudio se basa en mejorar la retención estudiantil a través intervenciones personalizadas basadas en el análisis predictivo de dato