Clasificación multi-etiqueta de géneros cinematográficos

Date

2022

Authors

Zalba Huarte, Oier

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

Este trabajo trata de clasificación multi-etiqueta con machine learning. En particular, a partir de un dataset con títulos y sinopsis de películas en inglés, se tratará de predecir a qué género o géneros pertenece. Para ello nos valdremos de diferentes técnicas de preprocesamiento de datos, minería de texto y aprendizaje automático. A diferencia de los algoritmos de clasificación habituales que están orientados a dos o más clases excluyentes entre sí, en el caso de la multi-etiqueta, cada instancia puede estar clasificada en varias clases a la vez. Por lo tanto, valoraremos qué modificaciones, estrategias y técnicas seguir para abordar el problema.


This paper deals multi-label classification with machine learning. In particular, from a dataset with titles and synopsis of movies in English, we will try to predict to which genre or genres they belong. For this purpose, we will use different data preprocessing techniques, text mining and machine learning. Unlike usual classification algorithms that are oriented to two or more mutually exclusive classes, in the case of multi-labeling, each instance can be classified into several classes at the same time. Therefore, we will assess which modifications, strategies and techniques to follow to address the problem.

Description

Keywords

Aprendizaje automático, Bag-of-words, Clasificación multi-etiqueta, Evaluación multi-etiqueta, Machine Learning, Bag-of-words, Multi-label classification, Multi-label evaluation

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación / Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra, Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.