Comparación de métodos de clasificación de texto en euskera

Date

2024

Authors

Agesta Pérez-Ilzarbe, Ibai

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

En el marco del procesamiento del lenguaje natural, se realizan diferentes técnicas de preprocesado de texto y se utilizan modelos clásicos de Aprendizaje Automático y modelos de Aprendizaje Profundo para comparar sus rendimientos en un conjunto de datos que trata de clasificar textos en euskera en diferentes categorías. Después, se trata de analizar y comparar los diferentes métodos de preprocesado y de clasificación, así como sus respectivos parámetros para estudiar cómo se comportan estos algoritmos en un idioma distinto al que se usó en la creación de los modelos.


Different text preprocessing techniques, classic Machine Learning models and Deep Learning models are implemented and developed for compare their performance on a data set that tries to classify Basque texts into different categories. Afterwards, we analyze and compare the different preprocessing and classification methods, as well as their respective parameters to study how these algorithms behave in a language other than the one used to create the models.

Description

Keywords

Clasificación de texto, Aprendizaje automático, Aprendizaje profundo, Euskera, Text classification, Machine Learning, Deep Learning, Basque

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Agronómica y Biociencias / Nekazaritzako Ingeniaritzako eta Biozientzietako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarra, Datuen Zientzietako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.