Mostrar el registro sencillo del ítem

dc.contributor.advisorConti, Dante (dir)spa
dc.contributor.advisorOspina, Victoria Eugenia (Co-dir)spa
dc.contributor.authorVargas Antolínez, Edwin Albertospa
dc.date.accessioned2018-08-29T21:50:52Zspa
dc.date.accessioned2021-10-01T16:08:43Z
dc.date.available2018-08-29T21:50:52Zspa
dc.date.available2021-10-01T16:08:43Z
dc.date.issued2018spa
dc.identifier.urihttps://catalogo.escuelaing.edu.co/cgi-bin/koha/opac-detail.pl?biblionumber=21550spa
dc.identifier.urihttps://repositorio.escuelaing.edu.co/handle/001/829
dc.description.abstractE-mail communication is still the most prevalent form of Customer support process in Organizations. Therefore, organizations have had to implementing processes focused on email categorization in accordance with email contents, in order to provide an efficient response to customer requests. A common text mining approach involves a representation of text based on keywords later combined with machine learning. This project presents a methodological approach that evaluates classification algorithms: Supoport Vector Machine and Gradient Boodting Trees on a corpus builded from emails database of the Administrative Department of Public Function in Colombia.eng
dc.description.abstractEl uso de correo electrónico a nivel de las organizaciones, como canal de comunicación en procesos de servicio y atención al cliente, ha crecido en los últimos tiempos. Por tanto, las organizaciones han debido implementar procesos focalizados en organizar dichos correos de acuerdo con la temática esencial transmitida en ellos, para así dar una respuesta eficiente ante las solicitudes de los clientes. Una manera de abordar el problema es a través de la categorización de la correspondencia electrónica mediante la extracción del contenido textual en corpus de palabras determinantes (Minería de Texto) que se usan para una posterior clasificación de los correos con técnicas de aprendizaje automático de máquinas (Machine Learning). Este proyecto presenta un enfoque metodológico que evalúa diversos algoritmos de clasificación con técnicas de muestreo aleatorio simple sobre una población de documentos (correos) del registro de correspondencia del Departamento Administrativo de la Función Pública en Colombia, como caso de estudio. La investigación se detalla en un sistema paso a paso, desde el preprocesamiento de la información, reducción de la dimensionalidad, selección de diversas muestras hasta la aplicación de algoritmos de clasificación. El modelado incluye un benchmarking entre diversos algoritmos: clasificadores de tipo Naive Bayesianos, máquinas de soporte vectorial (SVM) y Boosting. Se propone, además, una arquitectura funcional semiautomática que puede escalarse en futuro en un sistema productivo de gran manejo de datos en tiempo real (streaming) basada en R, Spark y MapReduce. El modelo se pone a prueba logrando valores de “accuracy” superiores al 90% que soportan una buena Línea Base para soluciones en producción para el enfoque empleado en esta investigación.spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.publisherEscuela Colombiana de Ingeniería Julio Garavitospa
dc.rightsDerechos Reservados - Escuela Colombiana de Ingeniería Julio Garavito, 2018spa
dc.rights.urihttps://creativecommons.org/licenses/by-nc/4.0/spa
dc.subjectClasificación de correspondenciaspa
dc.subjectMinería de datosspa
dc.subjectAprendizaje de Máquinaspa
dc.subjectAlgoritmos de clasificaciónspa
dc.titleModelado basado en datos para la clasificación semiautomática de correspondencia electrónica: caso de estudio para la Administración Pública Colombianaspa
dc.typeTrabajo de grado - Maestríaspa
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa
oaire.versionhttp://purl.org/coar/version/c_970fb48d4fbd8a85spa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Gestión de Informaciónspa
dc.publisher.programMaestría en Gestión de Informaciónspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)spa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.subject.keywordsEmail classificationspa
dc.subject.keywordsData miningspa
dc.subject.keywordsMachine Learningspa
dc.subject.keywordsClassification algorithmsspa


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Derechos Reservados - Escuela Colombiana de Ingeniería Julio Garavito, 2018
Excepto si se señala otra cosa, la licencia del ítem se describe como Derechos Reservados - Escuela Colombiana de Ingeniería Julio Garavito, 2018