Publication:
Separación de hablantes individuales en entornos "cocktail-party" mediante redes de aprendizaje profundo

Consultable a partir de

Date

2023

Authors

Cantalapiedra Arellano, Ana

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

El efecto cóctel presenta un desafío significativo para las personas con discapacidad auditiva al participar en conversaciones en entornos ruidosos. Este fenómeno, que se refiere a la dificultad de separar fuentes sonoras y detectar la fuente de interés en situaciones de múltiples hablantes, ha sido objeto de investigación en el campo de la audición y la percepción auditiva. En la última década, se han desarrollado diversos sistemas de separación de hablantes, especialmente basados en técnicas de aprendizaje profundo (deep learning), que han demostrado mejoras significativas en la separación de fuentes. En este trabajo, se empleó una base de datos de cocktail party, luego, se aplicaron los algoritmos ConvTasNET y DPRNN para separar las fuentes de audio y se evaluaron sus capacidades de rendimiento.

Keywords

Discapacidad auditiva, Deep learning, ConvTasNET, DPRNN

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Agronómica y Biociencias / Nekazaritzako Ingeniaritzako eta Biozientzietako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarra, Datu Zientzietan Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

Editor version

Funding entities

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.