Publication:
Implementación y evaluación de modelos para la generación sintética de señales espectrales para el balanceo de datos de perfiles metabólicos

Date

2024

Authors

Martín Asiáin, María

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

Introducción Aunque el avance de la Inteligencia Artificial (IA) en la medicina es significativo, su impacto potencial depende del acceso a datos médicos, su calidad y su disponibilidad. Un desafío particular es el desbalance de clases en conjuntos de datos médicos. Este desbalance puede introducir sesgos en los modelos de IA que reducen su capacidad para identificar y/o diagnosticar con precisión las condiciones de salud menos comunes. Para abordar este problema, las técnicas de generación sintética de datos han surgido como una solución prometedora. En este proyecto, se propone balancear una base de datos con perfiles metabólicos de sujetos con y sin condiciones asociadas al Síndrome Metabólico, mediante la generación sintética de datos. Objetivos El objetivo principal es la generación sintética de señales espectrales de resonancia magnética nuclear (RMN) que permitan balancear las clases de una base de datos con perfiles metabólicos. Metodología Se han implementado tres modelos de aprendizaje profundo (CTGGAN, GAN y VAE) para la generación de señales espectrales de RMN sintéticas. Las señales sintéticas se han sometido a un análisis utilizando diversas métricas para evaluar la similitud con las señales reales de muestras de sangre y orina. Posteriormente se ha aplicado un proceso de filtrado para garantizar la validez de los datos generados. Las métricas utilizadas incluyen el coeficiente de correlación de Pearson, Dynamic Time Warping (DTW) y mapa de calor. Estas se han empleado tanto para comparar la forma y tendencia de las señales, como para examinar las correlaciones entre los metabolitos. Además, se ha realizado una clasificación binaria utilizando una Red Neuronal Convolucional para evaluar si la inclusión de señales sintéticas mejora la clasificación. Resultados Las mejores señales espectrales sintéticas se han conseguido con un Autocodificador Variacional (VAE), adaptando el modelo para replicar la forma y distribución de las señales reales. Se ha conseguido que aproximadamente el 50% de las señales generadas sean consideradas válidas para equilibrar el conjunto de datos original. Los resultados de correlación entre las señales reales y sintéticas han sido consistentemente altos, y el análisis de DTW ha mostrado una similitud significativa entre las señales en términos de forma. A diferencia de las señales sintéticas generadas a partir de muestras de sangre, los resultados obtenidos con las muestras de orina han sido más difíciles de evaluar debido a la alta variabilidad presente en las señales reales. Por último, los resultados de la clasificación han mostrado un aumento en la sensibilidad tras añadir los espectros sintéticos. Conclusiones Se ha demostrado que la generación sintética de señales se puede utilizar para el balanceo de bases de datos. Se ha implementado un modelo de aprendizaje profundo para generar señales espectrales de RMN sintéticas, mostrando similitud con las originales en forma y distribución de picos. Finalmente, se ha comprobado que la inclusión de datos sintéticos de la clase minoritaria puede mejorar la detección de casos positivos en conjuntos de datos desbalanceados, aunque es esencial explorar estrategias para equilibrar la sensibilidad y la precisión.

Description

Keywords

Señales espectrales, Generación sintética de datos, Aprendizaje profundo, Autocodificador variacional, Red generativa adversaria, Síndrome metabólico, Desbalance

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación / Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería Biomédica por la Universidad Pública de Navarra, Ingeniaritza Biomedikoko Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.