(2020) Solano Martínez, Imanol; Sanz Delgado, José Antonio; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
Es sabido que, hoy en día, el campo del Machine Learning o Aprendizaje Automático
está siendo uno de los más explotados por diferentes científicos de datos en el mundo.
Entre los diferentes algoritmos de clasificación existentes en este campo, se encuentra
FARC-HD. Un trabajo de investigación anterior consiguió mejorar su rendimiento
incluyendo técnicas de descomposición y funciones de solapamiento. En concreto, se
utilizó la técnica OVO.
Sin embargo, al incluir dicha técnica, se pierde la interpretabilidad propia de
FARC-HD. Por ello, en este trabajo se propone dividir la fase de entrenamiento en dos
fases: una primera de extracción de reglas aplicando OVO y una segunda, en la que se
aplica a la totalidad de las reglas extraídas en la fase anterior un algoritmo genético cuya
función fitness tiene en cuenta el uso de OVO, logrando así una base de datos única e
interpretable. Además, se incluye una fase de filtrado que elimina las reglas redundantes
para tratar de conseguir también una base de reglas fácilmente interpretable. Con ello,
se pretende recuperar la interpretabilidad perdida tratando de mantener la mejora con
respecto a FARC-HD