Minería de imágenes en repositorios de proyectos de Software soportada por Machine Learning
...
Rodríguez Torres, Sergio Andrés | 2023
Este documento presenta un análisis enfocado a los diagramas de software en repositorios Git. Para el análisis se construyó un dataset con 5.981 imágenes con las categorías none, diagrama de actividades, diagrama de secuencia, diagrama de clases, diagrama de componentes, diagrama de casos de uso y diagramas cloud. Dicho dataset se usó para el entrenamiento de una red convolucional DenseNet169 pre-entrenada con el dataset ImageNet usando la técnica de transfer learning. La red alcanzó una exactitud en la predicción del 98.6 % y un f1-score de 98.3 %. Luego se usaron técnicas de minería de repositorios para analizar 2’469.206 imágenes equivalentes a 231 GB en datos, obtenidas de 287.201 repositorios. Con el fin de conocer que tan común es cargar imágenes de diagramas, cómo se distribuyen en los repositorios de software y cada cuanto se actualizan.
LEER