Publication:
Generación de prototipos para clasificación en entornos Big Data

Consultable a partir de

Date

2016

Authors

Iñiguez Jiménez, Luis

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

El objetivo del proyecto es utilizar las nuevas tecnologías del campo del Big Data para crear un algoritmo que consiga reducir un dataset de clasificación compuesto por muchísimos ejemplos a unos pocos prototipos que los representen sin perder calidad para ayudar a los sistemas de clasificación a enfrentarse a estos datasets tan grandes. Para lograrlo partiremos de un algoritmo base de generación de prototipos. Este algoritmo es CHI-PR, el cual se basa en el método de CHI para generar reglas difusas. Usando las reglas difusas agrega los ejemplos y genera prototipos. Con este algoritmo se realizaran varias iteraciones utilizando distintos modelos y configuraciones. Para probar la calidad del algoritmo se testeara utilizándolo sobre distintos datasets de clasificación. Finalmente se realizaran una serie de comparativas para verificar que el algoritmo supera al algoritmo base y obtener una versión estable que pueda ser utilizada por la gran mayoría de datasets de clasificación.

Keywords

Generación de prototipos, Big Data, Clasificación, Algoritmo de los k-vecinos más cercanos

Department

Faculty/School

Escuela Técnica Superior de Ingenieros Industriales y de Telecomunicación / Telekomunikazio eta Industria Ingeniarien Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra, Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

Editor version

Funding entities

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.