Modelo de predicción para la demanda de usos en las escuelas de natación de una Caja de compensación.
Trabajo de grado - Maestría
2022
Escuela Colombian de Ingeniería
El pronóstico de la demanda es clave para la gerencia de Recreación y Deportes en la CAJA COLOMBIANA DE SUBSIDIO FAMILIAR (COLSUBSIDIO). Por medio del ciclo CRISP-DM (entendimiento del negocio, entendimiento de los datos, preparación de los datos, modelado, evaluación y despliegue) se desarrolló un modelo predictivo que permite pronosticar la cantidad de sesiones en las escuelas de natación por sede, nivel, intensidad, día, intervalo, tipo de afiliado (categoría A, B, C). Esta demanda permite estimar la ocupación por piscina y los gastos asociados a la operación de las escuelas de natación como mantenimiento, limpieza, arriendo, entre otros. Dada la temporalidad de los programas, la calidad de la información, los continuos cambios de procesos y el impacto de la pandemia el ejercicio se ejecutó a través de un matchup entre varios modelos como Regresión logística, Holt Winters, ETS Estocástico, XGBoost, Decision Tree y SVM, obteniendo una confianza del modelo entre 30% y 80%. Demand forecasting is key for the swimming school business line of CAJA COLOMBIANA DE SUBSIDIO FAMILIAR (COLSUBSIDIO). Through the CRISP-DM cycle (business understanding, data understanding, data preparation, modeling, evaluation and deployment), a predictive model was developed to forecast the number of sessions in the swimming schools by location, level, intensity, day, interval, type of member (category A, B, C). This demand allows estimating the occupancy per pool and the expenses associated with the operation of the swimming schools such as maintenance, cleaning, rent, among others. Given the temporality of the programs, the quality of the information, the continuous changes of processes and the impact of the pandemic, the exercise was executed through a matchup between several models such as Logistic Regression, Holt Winters, Stochastic ETS, XGBoost, Decision Tree and SVM, obtaining a model confidence between 30% and 80%.