Publication: Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
Loading...
Files
Authors
Abstract (Spanish)
El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cual se plantearon soluciones como ajuste de pesos y técnicas de remuetreo. Se implementaron tres modelos de aprendizaje supervisado: bosque aleatorio, regresión logística y XGBoost.
La evaluación de los modelos se basó en diversas métricas, como precisión, recall, puntaje F1 y la matriz de confusión. Estas métricas proporcionaron información valiosa sobre la capacidad de los modelos para identificar correctamente los casos de fraude. Además, se utilizó la curva ROC para visualizar el rendimiento de los modelos y encontrar el equilibrio óptimo entre la tasa de verdaderos positivos y la tasa de falsos positivos.
Por último, se planteó un tablero de control en Power BI, con el objetivo de brindar un panorama completa de los siniestros vehiculares, permitiéndonos identificar patrones, tendencias y posibles casos de fraude, así como monitorear el rendimiento del modelo por medio de la matriz de confusión.
Abstract (English)
The project focused on addressing the challenge of detecting fraud in the Compulsory Traffic Accident Insurance (SOAT) using supervised learning techniques. The response variable, which took values of fraud or non-fraud, presented a significant imbalance, prompting solutions such as weight adjustment and resampling techniques. Three supervised learning models were implemented: Random Forest, Logistic Regression, and XGBoost.
The evaluation of the models was based on various metrics, such as accuracy, recall, F1 score, and the confusion matrix. These metrics provided valuable information about the models' ability to correctly identify fraud cases. Additionally, the ROC curve was used to visualize the models' performance and find the optimal balance between true positive rate and false positive rate.
Finally, a Power BI dashboard was created to provide a comprehensive overview of vehicle accidents, allowing us to identify patterns, trends, and potential fraud cases, as well as monitor the model's performance through the confusion matrix.
Director
Advisors/Directors
Extent
78 páginas
Collections
How to cite
APA
Villarraga Palomino, Jesus Antonio (2023). Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning.
MLA
Villarraga Palomino, Jesus Antonio. "Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning." 2023.
Chicago
Villarraga Palomino, Jesus Antonio. 2023. "Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning."