Publication: Separación de hablantes individuales en entornos "cocktail-party" mediante redes de aprendizaje profundo
Consultable a partir de
Date
Authors
Director
Publisher
Project identifier
Abstract
El efecto cóctel presenta un desafío significativo para las personas con discapacidad auditiva al participar en conversaciones en entornos ruidosos. Este fenómeno, que se refiere a la dificultad de separar fuentes sonoras y detectar la fuente de interés en situaciones de múltiples hablantes, ha sido objeto de investigación en el campo de la audición y la percepción auditiva. En la última década, se han desarrollado diversos sistemas de separación de hablantes, especialmente basados en técnicas de aprendizaje profundo (deep learning), que han demostrado mejoras significativas en la separación de fuentes. En este trabajo, se empleó una base de datos de cocktail party, luego, se aplicaron los algoritmos ConvTasNET y DPRNN para separar las fuentes de audio y se evaluaron sus capacidades de rendimiento.
Keywords
Department
Faculty/School
Degree
Doctorate program
Editor version
Funding entities
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.