Orbegozo Torrano, Íñigo2021-07-262021https://academica-e.unavarra.es/handle/2454/40253Este trabajo fin de máster se ha desarrollado durante unas prácticas curriculares en Veridas Digital Authentication Solutions S.I, empresa Navarra dedicada a la verificación por medios digitales. En concreto, se ha realizado el trabajo dentro del departamento de biometría de voz centrándose en el pre-procesado del habla y estudiando diferentes algoritmos para la detección de actividad de voz. Como paso previo a la generación del vector biométrico de la voz, se procesa el audio para eliminar los tramos en los que la persona no está hablando. Actualmente esto se hace calculando la energía que hay en cada tramo del audio. Es un método que funciona bien en entornos silenciosos, pero si hay música o ruido de fondo el detector comienza a fallar. Se ha realizado el estudio del estado del arte, un análisis de diferentes herramientas ya existentes y el desarrollo de una plataforma para la evaluación y comparación de los VADs. Todos estos modelos son comparados según métricas buscando cual es la solución conveniente y para ello ha sido necesario buscar y modificar datasets que permitan entrenar y evaluar modelos de machine learning. Finalmente se realiza una conclusión eligiendo las herramientas de detección de actividad de voz que mejor rendimiento han obtenido y un planteamiento de guías futuras para la posible continuación del proyecto.application/pdfspaDetector de actividad de vozVADVoice activity detectionVozProcesadoAudioMachine learningInteligencia artificialAnálisis y desarrollo de algoritmos de detección de actividad de vozinfo:eu-repo/semantics/masterThesis2021-07-26info:eu-repo/semantics/embargoedAccess