GE - Trabajos de Grado Maestría en Ciencia de Datoshttps://repositorio.escuelaing.edu.co/handle/001/19412024-03-29T10:57:19Z2024-03-29T10:57:19ZDetección del tipo de terreno sobre el que transita un Rover, a través de la aplicación de técnicas de machine learningPatarroyo Godoy, Laura MelisaJején Salinas, Santiagohttps://repositorio.escuelaing.edu.co/handle/001/28652024-03-04T21:20:40Z2024-01-01T00:00:00ZDetección del tipo de terreno sobre el que transita un Rover, a través de la aplicación de técnicas de machine learning
Patarroyo Godoy, Laura Melisa; Jején Salinas, Santiago
2024-01-01T00:00:00ZModelos no supervisados para la visualización de pacientes en cuidados intensivos y con fibrilación auricularLeón Zamora, Yessica Tatianahttps://repositorio.escuelaing.edu.co/handle/001/28542024-03-04T21:19:16Z2024-01-01T00:00:00ZModelos no supervisados para la visualización de pacientes en cuidados intensivos y con fibrilación auricular
León Zamora, Yessica Tatiana
La fibrilación auricular es una afección cardiaca caracterizada por pulsaciones cardiacas rápidas e irregulares (National Health Services, 2022). Esta es una de las arritmias cardiacas más conocidas en general y también en las unidades de cuidados intensivos. Su prevalencia en UCI es cercana al 10%, y en una UCI cardiaca de 50% (Malik, Candilio, & Hausenloy, 2013)
Sin embargo, las características físicas, clínicas o biológicas que puedan desempeñar una relación importante en el desarrollo de fibrilación auricular, no se conocen con certeza. Comprender estas características podría contribuir significativamente a la detección temprana de esta afección médica, especialmente si se pueden interpretar visualmente de manera rápida. Esto, a su vez, facilitaría su inclusión en las rutinas médicas de cuidados intensivos.
Con este objetivo en mente, hemos propuesto llevar a cabo un estudio centrado en el uso de modelos de aprendizaje no supervisados interpretables, como Autoencoders, PCA, T-SNE, GTM. Nuestra investigación se concentra en la exploración de modelos interpretables no supervisados que permitan una interpretación visual sencilla de los posibles biomarcadores asociados al desarrollo de fibrilación auricular en pacientes de cuidados intensivos.; Atrial Fibrillation is a cardiac condition characterized by rapid and irregular heartbeats (National Health
Services, 2022). It is one of the most well-known cardiac arrhythmias both in general and in Intensive Care Units (ICUs). Its prevalence in ICUs is approximately 10%, and in a cardiac ICU, it can be as high as 50% (Malik, Candilio, & Hausenloy, 2013).
However, the specific physical, clinical, or biological characteristics that may play a significant role in the
development of Atrial Fibrillation are not definitively known. Understanding these characteristics could
significantly contribute to the early detection of this medical condition, especially if they can be visually interpreted quickly. This, in turn, would facilitate its integration into ICU medical routines. With this objective in mind, we have proposed to conduct a study focused on the use of interpretable unsupervised learning models, such as Autoencoders, PCA, T-SNE, and GTM. Our research is centered on the exploration of interpretable unsupervised models that allow for a straightforward visual interpretation of biomarkers that may be associated with risk factors for Atrial Fibrillation in ICU patients
2024-01-01T00:00:00ZPronóstico de ventas a través de una aplicación web aplicando machine learning y variables exógenasFerro Rugeles, Rubén DaríoCossio Escobar, GonzaloFernandéz Moncada, Nicolashttps://repositorio.escuelaing.edu.co/handle/001/28152024-03-04T21:07:29Z2023-01-01T00:00:00ZPronóstico de ventas a través de una aplicación web aplicando machine learning y variables exógenas
Ferro Rugeles, Rubén Darío; Cossio Escobar, Gonzalo; Fernandéz Moncada, Nicolas
Actualmente, el entorno empresarial y organizacional, se enfrenta a una problemática generalizada que trasciende sectores: la gestión ineficiente de los pronósticos de ventas y su falta de implementación. La realización de las predicciones de ventas, dentro de las organizaciones, se realiza de manera manual y utilizando métodos obsoletos, lo cual consume recursos valiosos, tanto en tiempo como en dinero, con consecuencias económicas bastante graves. Se habla de cifras impactantes, cuyos valores oscilan entre 568 millones de pesos a nivel de una sola organización. Estas pérdidas, representan desafíos reales para las empresas, ya que estos recursos podrían destinarse a la expansión, innovación e inversión en otros aspectos cruciales del negocio aumentando su crecimiento. En este contexto, la precisión en las proyecciones de ventas es vital, ya que cualquier margen de error puede tener un impacto significativo en los resultados financieros. En un mundo empresarial altamente competitivo, la capacidad de identificar patrones y relaciones entre indicadores y ventas es un activo invaluable. La implementación de soluciones de pronóstico de ventas precisas y eficientes no solo permite recuperar pérdidas, sino que también impulsa el crecimiento sostenible y la toma de decisiones informadas, lo que convierte esta área en una prioridad en cualquier organización que busque el éxito en el mercado global. Con base en las razones y el contexto expuesto anteriormente, este proyecto de grado tiene como objetivo desarrollar una solución, que incluya un modelo de predicción de ventas, el cual emplee técnicas de machine learning previamente seleccionados e investigadas, para la predicción de ventas, incorporando diferentes variables exógenas que impactan significativamente en el mercado. Para los modelos seleccionados, se incluirán variables relevantes tanto del entorno empresarial como del contexto externo. La solución se visualizará a través de una aplicación web, desarrollada para el trabajo de grado. El ambiente de desarrollo será Google Colab y se utilizará una aplicación web desarrollada en Angular como plataforma de visualización de la data. Inicialmente, se extraerán indicadores macroeconómicos del mercado mundial de la página del Banco Mundial, posteriormente se realizara un análisis exploratorio de los datos y se decidirá que variables tanto internas como externas serán de importancia para la realización del modelo. A continuación, se realizará la evaluación de diferentes modelos de machine learning aplicados a Series Temporales. En este contexto, se evaluará el modelo con los datos de las ventas de una compañía del sector de tecnología. El modelo deberá aprender de las múltiples variables y pronosticar las ventas. Por último, se realizará la visualización de los datos a través de una aplicación web, donde se mostrará la precisión de predicción del modelo, la data histórica, data pronosticada y las variables de alto impacto en el modelo.; Currently, the business and organizational environment is facing a widespread problem that transcends sectors: the inefficient management of sales forecasts and their lack of implementation. Sales forecasting within organizations is done manually and using obsolete methods, which consumes valuable resources, both in time and money, with quite serious economic consequences. We are talking about shocking figures, with values ranging from 568 million pesos at the level of a single organization. These losses represent real challenges for companies, since these resources could be used for expansion, innovation and investment in other crucial aspects of the business, increasing its growth.
In this context, accuracy in sales projections is vital, as any margin of error can have a significant impact on financial results. In a highly competitive business world, the ability to identify patterns and relationships between indicators and sales is an invaluable asset. Implementing accurate and efficient sales forecasting solutions not only enables loss recovery, but also drives sustainable growth and informed decision making, making this area a priority in any organization seeking success in the global marketplace. Based on the above reasons and context, this degree project aims to develop a solution, including a sales prediction model, which employs previously selected and researched machine learning techniques for sales prediction, incorporating different exogenous variables that significantly impact the market.
For the selected models, relevant variables from both the business environment and the external context will be included. The solution will be visualized through a web application, developed for the degree work. The development environment will be Google Colab and a web application developed in Angular will be used as the data visualization platform. Initially, macroeconomic indicators of the world market will be extracted from the World Bank website, then an exploratory analysis of the data will be performed and it will be decided which internal and external variables will be of importance for the realization of the model.
Then, the evaluation of different machine learning models applied to Time Series will be carried out. In this context, the model will be evaluated with the sales data of a company in the technology sector. The model should learn from multiple variables and forecast sales. Finally, the visualization of the data will be done through a web application, where the prediction accuracy of the model, the historical data, the predicted data and the variables of high impact on the model will be shown.
2023-01-01T00:00:00ZBenchmarking automatizado para compra de autos y motos usados en Colombia mediante web scraping y analítica prescriptivaAriza Ahumada, Lady Camila.https://repositorio.escuelaing.edu.co/handle/001/27272024-03-04T21:18:56Z2023-01-01T00:00:00ZBenchmarking automatizado para compra de autos y motos usados en Colombia mediante web scraping y analítica prescriptiva
Ariza Ahumada, Lady Camila.
En el contexto actual del mercado automotriz en Colombia existe una exorbitante subida de precios
de vehículos de segunda mano y a falta de herramientas estructuradas para acceder de forma rápida
y confiable a la información del mercado de usados, se hace necesario crear un conjunto de datos
centralizado que refleje el inventario ofrecido en la web. Con el propósito de facilitar la
comparación, recopilación y toma de decisiones en el proceso de compra-venta de segunda mano,
se desarrolló una herramienta de comparación automatizada que utiliza la técnica de Web Scraping
para extraer información de la WEB y crea un motor de benchmarking que compara el stock
disponible en la WEB con la Guía Fasecolda y las características seleccionadas por el usuario. La
metodología empleada sigue el enfoque Knowledge Discovery in Data Set que contiene un código
de scraping, análisis de similitud de texto, predicciones estadísticas de serie de tiempo y un modelo
basado en árboles de decisión.
De esta forma los resultados de la herramienta son satisfactorios ya que ofrece al usuario dos
opciones de acuerdo con las características buscadas del automotor a comprar, comparando los
precios ofrecidos y los precios regulados estimados. La primera opción es un vehículo económico
que se ajusta al precio regulado mientras que la segunda opción es un vehículo con bajo kilometraje
y el precio más económico en el mercado en línea. Estos resultados se logran gracias a la eficiente
extracción de información, ingeniería de variables, análisis de texto de similitud, análisis de serie
de tiempo bajo metodologías estadísticas y el modelo de decisión de precios estilo benchmarking.
Sin embargo, se recomienda explorar un framework más completo para una experiencia más
personalizada.; In the current context of the automotive market in Colombia and in the absence of structured tools
to quickly and reliably access used car market information, it is necessary to create a centralized
data set that reflects the inventory offered on the web. With the purpose of facilitating the
comparison, compilation and decision making in the used car buying and selling process, an
automated comparison tool was developed that uses the Web Scraping technique to extract
information from the WEB and creates a benchmarking engine that compares the stock available
on the WEB with the Fasecolda Guide and the characteristics selected by the user. The
methodology used follows the Knowledge Discovery in Data approach that contains a scraping
code, text similarity analysis, time series statistical predictions and a model based on decision
trees.
In this way, the results of the tool are satisfactory since it offers the user two options according to
the characteristics of the vehicle to be purchased, comparing the prices offered and the estimated
regulated prices. The first option is an economic vehicle that fits the regulated price while the
second option is a vehicle with low mileage and the cheapest price in the online market. These
results are achieved through efficient data mining, variable engineering, similarity text analysis,
time series analysis under statistical methodologies and the benchmarking style pricing decision
model used. However, it is recommended to explore a more complete framework for a more
personalized experience.
2023-01-01T00:00:00Z