Estudio, análisis e implementación de FSDR-SMOTE, técnica de sobremuestreo para problemas de clasificación desbalanceados.
Date
Authors
Director
Publisher
Project identifier
Abstract
A la hora de entrenar un modelo de clasificación de aprendizaje automático, en muchas ocasiones, nos encontramos con conjuntos de datos desbalanceados, que son problemas donde una clase, la mayoritaria, tiene muchos más ejemplos que la otra, la minoritaria. Esta disparidad de los datos ocasiona que los modelos tiendan a aprender la clase mayoritaria creando un sesgo hacia esa clase. Por ello, clasifican pocas veces los ejemplos en la clase minoritaria, que además suele ser la de interés. Para solucionar este problema, una de las metodologías más populares es el sobremuestreo u oversampling, que consiste en generar ejemplos sintéticos de la clase minoritaria hasta lograr un balance. FSDR-SMOTE (Feature Standard Deviation Random SMOTE) es una técnica reciente para abordar los problemas no balanceados mediante la eliminación de ruido, clustering, la creación del conjunto de ejemplos de bordes y aplicando Random SMOTE. El objetivo principal del trabajo fin de grado es entender, implementar y comparar los resultados de FSDR-SMOTE frente a los resultados proporcionados en el artículo original. Otro objetivo es realizar una contribución a la librería inbalancedlearn, de forma que el método FSDR-SMOTE pueda ser utilizado por cualquier interesado. Además de esto, se pretende crear un nuevo método, basado en FSDR-SMOTE, que palíe algunos de sus problemas de diseño y concepto.
Description
Keywords
Department
Faculty/School
Degree
Doctorate program
item.page.cita
item.page.rights
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.