Desarrollo de un sistema de detección de múltiples hablantes en una grabación de voz

Consultable a partir de

2029-07-01

Date

2024

Authors

Morala Martínez, Andrea

Publisher

Acceso embargado / Sarbidea bahitua dago
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

Uno de los desafíos para las soluciones de biometría de voz de Veridas es la detección de múltiples hablantes en una señal de voz. Una muestra contaminada con la aparición de más personas cuya identidad se desea comprobar puede afectar negativamente al rendimiento del sistema, disminuyendo la precisión y confianza en la respuesta y degradando la experiencia del cliente y del usuario. En este Trabajo de Fin de Grado se ha investigado el problema de los múltiples hablantes en un entorno productivo, analizando su impacto sobre los motores biométricos y evaluando la solución implementada actualmente en el producto de biometría de voz de Veridas. Con el objetivo de mejorar su rendimiento, se han investigado tres distintas aproximaciones, midiendo su rendimiento en términos de precisión y coste computacional; criterios esenciales para su implementación en entornos de producción. De estas, se ha identificado un detector basado en ventanas deslizantes como aquel que mejor se ajusta a las necesidades del producto.

Description

Keywords

Voice biometrics, Multi-speaker, Speaker diarization, Overlapped speech detection, Speaker change detection

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación / Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra, Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.