Publication: Optimización del cálculo de los pesos de las reglas del clasificador FARC-HD
Date
Authors
Director
Publisher
Project identifier
Abstract
El uso de grandes cantidades de datos en el auge del aprendizaje automático es necesario para poder adaptarnos a las nuevas tendencias y para poder utilizar dichas cantidades de datos en modelos de inteligencia artificial. Por ejemplo, en problemas de clasificación, modelos como el clasificador FARC-HD (Fuzzy Association Rule-Base Classification Model for High-Dimensional problems) son útiles puesto que es un sistema de clasificación basado en reglas difusas preparado para trabajar con grandes cantidades de datos ofreciendo un sistema preciso en interpretable. A pesar de poder manejar grandes volúmenes de datos, el clasificador FARC-HD no logra obtener resultados en tiempos razonables cuando el número de clases o de atributos del problema aumenta en exceso. Una de las razones es por el cálculo que tiene que hacer el clasificador de tanto la confianza como el soporte de las reglas que genera. En este sentido, recientemente se ha publicado un algoritmo llamado QChi (Quick Chi) el cual asegura reducir el tiempo de ejecución sin perder rendimiento en exceso al aplicar un nuevo método a la hora de calcular los pesos asociados a las reglas difusas que genera el clasificador definido por Chi y otros. Este proyecto, se basa en aplicar el método QChi en el clasificador FARC-HD para analizar su efecto en distintas etapas del clasificador y analizar si consigue reducir el tiempo de ejecución del algoritmo sin grandes reducciones en el rendimiento de éste.
The use of large amounts of data in the rise of machine learning is necessary to be able to adapt to current trends and to be able to use these amounts of data in artificial intelligence models. For example, in classification problems, models such as the FARC-HD classifier (Fuzzy Association Rule-Base Classification Model for High-Dimensional problems) are useful since it is a classification system based on fuzzy rules prepared to work with large amounts of data, offering an accurate and interpretable system. Despite being able to manage large volumes of data, the FARC-HD classifier does not achieve results in reasonable times when the number of classes or attributes of the problem increases excessively. One of the reasons for this is due to the classifier's computation of both the confidence and the support of the rules it generates. In this sense, an algorithm called QChi (Quick Chi) has recently been published which ensures a reduction in execution time without losing too much precision by applying a new method when calculating the weights associated with the fuzzy rules generated by the classifier defined by Chi et al. This project is based on applying the QChi method to the FARC-HD classifier to analyze its effect on different stages of the classifier and to analyze whether it manages to reduce the execution time of the algorithm without major reductions in its accuracy.
Description
Keywords
Department
Faculty/School
Degree
Doctorate program
item.page.cita
item.page.rights
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.