Estudio, análisis e implementación de FSDR-SMOTE, técnica de sobremuestreo para problemas de clasificación desbalanceados.

Date

2025

Authors

Lalana Morales, Unai

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

A la hora de entrenar un modelo de clasificación de aprendizaje automático, en muchas ocasiones, nos encontramos con conjuntos de datos desbalanceados, que son problemas donde una clase, la mayoritaria, tiene muchos más ejemplos que la otra, la minoritaria. Esta disparidad de los datos ocasiona que los modelos tiendan a aprender la clase mayoritaria creando un sesgo hacia esa clase. Por ello, clasifican pocas veces los ejemplos en la clase minoritaria, que además suele ser la de interés. Para solucionar este problema, una de las metodologías más populares es el sobremuestreo u oversampling, que consiste en generar ejemplos sintéticos de la clase minoritaria hasta lograr un balance. FSDR-SMOTE (Feature Standard Deviation Random SMOTE) es una técnica reciente para abordar los problemas no balanceados mediante la eliminación de ruido, clustering, la creación del conjunto de ejemplos de bordes y aplicando Random SMOTE. El objetivo principal del trabajo fin de grado es entender, implementar y comparar los resultados de FSDR-SMOTE frente a los resultados proporcionados en el artículo original. Otro objetivo es realizar una contribución a la librería inbalancedlearn, de forma que el método FSDR-SMOTE pueda ser utilizado por cualquier interesado. Además de esto, se pretende crear un nuevo método, basado en FSDR-SMOTE, que palíe algunos de sus problemas de diseño y concepto.

Description

Keywords

Problemas de clasificación no balanceados, Técnicas de sobremuestreo de datos, Clustering, Conjunto de ejemplos de borde

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación / Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra, Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.