Benchmarking automatizado para compra de autos y motos usados en Colombia mediante web scraping y analítica prescriptiva
Trabajo de grado - Maestría
2023
Escuela Colombian de Ingeniería
Benchmarking Automatizado - Autos y motos usados- Colombia
Web scraping- Autos y motos usados- Colombia
Análisis de datos
Benchmarking Automatizado - Autos y motos usados- Colombia
Automated Benchmarking - Used Cars and Motorcycles - Colombia
Web scraping- Autos y motos usados- Colombia
Web scraping- Used cars and motorcycles- Colombia
Análisis de datos
Analysis of data
Web scraping- Autos y motos usados- Colombia
Análisis de datos
Benchmarking Automatizado - Autos y motos usados- Colombia
Automated Benchmarking - Used Cars and Motorcycles - Colombia
Web scraping- Autos y motos usados- Colombia
Web scraping- Used cars and motorcycles- Colombia
Análisis de datos
Analysis of data
En el contexto actual del mercado automotriz en Colombia existe una exorbitante subida de precios
de vehículos de segunda mano y a falta de herramientas estructuradas para acceder de forma rápida
y confiable a la información del mercado de usados, se hace necesario crear un conjunto de datos
centralizado que refleje el inventario ofrecido en la web. Con el propósito de facilitar la
comparación, recopilación y toma de decisiones en el proceso de compra-venta de segunda mano,
se desarrolló una herramienta de comparación automatizada que utiliza la técnica de Web Scraping
para extraer información de la WEB y crea un motor de benchmarking que compara el stock
disponible en la WEB con la Guía Fasecolda y las características seleccionadas por el usuario. La
metodología empleada sigue el enfoque Knowledge Discovery in Data Set que contiene un código
de scraping, análisis de similitud de texto, predicciones estadísticas de serie de tiempo y un modelo
basado en árboles de decisión.
De esta forma los resultados de la herramienta son satisfactorios ya que ofrece al usuario dos
opciones de acuerdo con las características buscadas del automotor a comprar, comparando los
precios ofrecidos y los precios regulados estimados. La primera opción es un vehículo económico
que se ajusta al precio regulado mientras que la segunda opción es un vehículo con bajo kilometraje
y el precio más económico en el mercado en línea. Estos resultados se logran gracias a la eficiente
extracción de información, ingeniería de variables, análisis de texto de similitud, análisis de serie
de tiempo bajo metodologías estadísticas y el modelo de decisión de precios estilo benchmarking.
Sin embargo, se recomienda explorar un framework más completo para una experiencia más
personalizada. In the current context of the automotive market in Colombia and in the absence of structured tools
to quickly and reliably access used car market information, it is necessary to create a centralized
data set that reflects the inventory offered on the web. With the purpose of facilitating the
comparison, compilation and decision making in the used car buying and selling process, an
automated comparison tool was developed that uses the Web Scraping technique to extract
information from the WEB and creates a benchmarking engine that compares the stock available
on the WEB with the Fasecolda Guide and the characteristics selected by the user. The
methodology used follows the Knowledge Discovery in Data approach that contains a scraping
code, text similarity analysis, time series statistical predictions and a model based on decision
trees.
In this way, the results of the tool are satisfactory since it offers the user two options according to
the characteristics of the vehicle to be purchased, comparing the prices offered and the estimated
regulated prices. The first option is an economic vehicle that fits the regulated price while the
second option is a vehicle with low mileage and the cheapest price in the online market. These
results are achieved through efficient data mining, variable engineering, similarity text analysis,
time series analysis under statistical methodologies and the benchmarking style pricing decision
model used. However, it is recommended to explore a more complete framework for a more
personalized experience.