Detection of unknown sound sources for learning new object classes

View/ Open
Date
2011Author
Version
Acceso abierto / Sarbide irekia
Type
Proyecto Fin de Carrera / Ikasketen Amaierako Proiektua
Impact
|
nodoi-noplumx
|
Abstract
El objetivo principal de este proyecto fin de carrera es desarrollar un algoritmo que posibilite el rechazo de fuentes de sonido desconocidas mediante el uso del ya existente sistema OPASCA. Para ello, sería implementada una One-Class-Support Vector Machine. Esta trataría de ser capaz de dar una decisión sobre si lo que es percibido por los micrófonos se corresponde a alguna de las clases existen ...
[++]
El objetivo principal de este proyecto fin de carrera es desarrollar un algoritmo que posibilite el rechazo de fuentes de sonido desconocidas mediante el uso del ya existente sistema OPASCA. Para ello, sería implementada una One-Class-Support Vector Machine. Esta trataría de ser capaz de dar una decisión sobre si lo que es percibido por los micrófonos se corresponde a alguna de las clases existentes o es desconocido. Para conseguir un método de clasificación y rechazo de la manera más eficiente, diferentes objetos, entornos acústicos, parámetros de la señal de audio (i.e. SNR) y diferentes combinaciones de representaciones paramétricas (i.e. MFCC, LPC) serían utilizados. El sistema trataría de ser lo más parecido posible a la realidad. La posición del robot humanoide no es estática, es decir, puede moverse por su entorno o incluso cambiar de escenario. Por esta razón, la decisión sobre si lo percibido es conocido o desconocido, no debe verse afectada por los cambios en el entorno. Para ello, el sistema sería entrenado y probado en diferentes situaciones y emplazamientos. El proceso puede ser separado en cuatro partes: Captura de la señal de audio, representación paramétrica, entrenamiento del modelo y testeo de los datos. En primer lugar, es necesario un conjunto de datos para entrenar y testar el modelo. Grabaciones de diferentes aplicaciones de uso común en una cocina doméstica (i.e. máquina de café, molinillo eléctrico, cortador de pan, teléfono) deberían ser realizadas (ver Sec.5.1) En segundo lugar, es necesaria una representación paramétrica de estos datos (ver Sec.3.1). En tercer lugar, los datos de audio serían empleados para estimar los parámetros de los modelos acústicos (ver Sec.5.2). Como último paso, para verificar que los modelos creados son correctos, una etapa de prueba es necesaria (ver Sec.6). [--]
Subject
Robots,
Fuentes de sonido desconocidas
Departament
Universidad Pública de Navarra. Departamento de Ingeniería Eléctrica y Electrónica /
Nafarroako Unibertsitate Publikoa. Ingeniaritza Elektrikoa eta Elektronikoa Saila