Generación de prototipos para clasificación en entornos Big Data

View/ Open
Date
2016Author
Version
Acceso abierto / Sarbide irekia
Type
Trabajo Fin de Grado/Gradu Amaierako Lana
Impact
|
nodoi-noplumx
|
Abstract
El objetivo del proyecto es utilizar las nuevas tecnologías del campo del Big Data para crear un
algoritmo que consiga reducir un dataset de clasificación compuesto por muchísimos ejemplos
a unos pocos prototipos que los representen sin perder calidad para ayudar a los sistemas de
clasificación a enfrentarse a estos datasets tan grandes.
Para lograrlo partiremos de un algoritmo base de genera ...
[++]
El objetivo del proyecto es utilizar las nuevas tecnologías del campo del Big Data para crear un
algoritmo que consiga reducir un dataset de clasificación compuesto por muchísimos ejemplos
a unos pocos prototipos que los representen sin perder calidad para ayudar a los sistemas de
clasificación a enfrentarse a estos datasets tan grandes.
Para lograrlo partiremos de un algoritmo base de generación de prototipos. Este algoritmo es
CHI-PR, el cual se basa en el método de CHI para generar reglas difusas. Usando las reglas
difusas agrega los ejemplos y genera prototipos. Con este algoritmo se realizaran varias
iteraciones utilizando distintos modelos y configuraciones. Para probar la calidad del algoritmo
se testeara utilizándolo sobre distintos datasets de clasificación.
Finalmente se realizaran una serie de comparativas para verificar que el algoritmo supera al
algoritmo base y obtener una versión estable que pueda ser utilizada por la gran mayoría de
datasets de clasificación. [--]
Subject
Generación de prototipos,
Big Data,
Clasificación,
Algoritmo de los k-vecinos más cercanos
Degree
Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra /
Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan