Implementación y evaluación de modelos para la generación sintética de señales espectrales para el balanceo de datos de perfiles metabólicos

dc.contributor.advisorTFEMalanda Trigueros, Armando
dc.contributor.affiliationEscuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicaciónes_ES
dc.contributor.affiliationIndustria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoaeu
dc.contributor.authorMartín Asiáin, María
dc.date.accessioned2024-09-25T11:43:07Z
dc.date.available2024-09-25T11:43:07Z
dc.date.issued2024
dc.date.updated2024-09-24T09:32:19Z
dc.description.abstractIntroducción Aunque el avance de la Inteligencia Artificial (IA) en la medicina es significativo, su impacto potencial depende del acceso a datos médicos, su calidad y su disponibilidad. Un desafío particular es el desbalance de clases en conjuntos de datos médicos. Este desbalance puede introducir sesgos en los modelos de IA que reducen su capacidad para identificar y/o diagnosticar con precisión las condiciones de salud menos comunes. Para abordar este problema, las técnicas de generación sintética de datos han surgido como una solución prometedora. En este proyecto, se propone balancear una base de datos con perfiles metabólicos de sujetos con y sin condiciones asociadas al Síndrome Metabólico, mediante la generación sintética de datos. Objetivos El objetivo principal es la generación sintética de señales espectrales de resonancia magnética nuclear (RMN) que permitan balancear las clases de una base de datos con perfiles metabólicos. Metodología Se han implementado tres modelos de aprendizaje profundo (CTGGAN, GAN y VAE) para la generación de señales espectrales de RMN sintéticas. Las señales sintéticas se han sometido a un análisis utilizando diversas métricas para evaluar la similitud con las señales reales de muestras de sangre y orina. Posteriormente se ha aplicado un proceso de filtrado para garantizar la validez de los datos generados. Las métricas utilizadas incluyen el coeficiente de correlación de Pearson, Dynamic Time Warping (DTW) y mapa de calor. Estas se han empleado tanto para comparar la forma y tendencia de las señales, como para examinar las correlaciones entre los metabolitos. Además, se ha realizado una clasificación binaria utilizando una Red Neuronal Convolucional para evaluar si la inclusión de señales sintéticas mejora la clasificación. Resultados Las mejores señales espectrales sintéticas se han conseguido con un Autocodificador Variacional (VAE), adaptando el modelo para replicar la forma y distribución de las señales reales. Se ha conseguido que aproximadamente el 50% de las señales generadas sean consideradas válidas para equilibrar el conjunto de datos original. Los resultados de correlación entre las señales reales y sintéticas han sido consistentemente altos, y el análisis de DTW ha mostrado una similitud significativa entre las señales en términos de forma. A diferencia de las señales sintéticas generadas a partir de muestras de sangre, los resultados obtenidos con las muestras de orina han sido más difíciles de evaluar debido a la alta variabilidad presente en las señales reales. Por último, los resultados de la clasificación han mostrado un aumento en la sensibilidad tras añadir los espectros sintéticos. Conclusiones Se ha demostrado que la generación sintética de señales se puede utilizar para el balanceo de bases de datos. Se ha implementado un modelo de aprendizaje profundo para generar señales espectrales de RMN sintéticas, mostrando similitud con las originales en forma y distribución de picos. Finalmente, se ha comprobado que la inclusión de datos sintéticos de la clase minoritaria puede mejorar la detección de casos positivos en conjuntos de datos desbalanceados, aunque es esencial explorar estrategias para equilibrar la sensibilidad y la precisión.en
dc.description.degreeGraduado o Graduada en Ingeniería Biomédica por la Universidad Pública de Navarraes_ES
dc.description.degreeIngeniaritza Biomedikoko Graduatua Nafarroako Unibertsitate Publikoaneu
dc.format.extent71 p.
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://academica-e.unavarra.es/handle/2454/51767
dc.language.isospa
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.subjectSeñales espectraleses_ES
dc.subjectGeneración sintética de datoses_ES
dc.subjectAprendizaje profundoes_ES
dc.subjectAutocodificador variacionales_ES
dc.subjectRed generativa adversariaes_ES
dc.subjectSíndrome metabólicoes_ES
dc.subjectDesbalancees_ES
dc.titleImplementación y evaluación de modelos para la generación sintética de señales espectrales para el balanceo de datos de perfiles metabólicoses_ES
dc.typeinfo:eu-repo/semantics/bachelorThesis
dspace.entity.typePublication
relation.isAdvisorTFEOfPublication14bdde9e-ab9d-462d-87c3-7da2c7e13976
relation.isAdvisorTFEOfPublication.latestForDiscovery14bdde9e-ab9d-462d-87c3-7da2c7e13976

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFG_MariaMartin.pdf
Size:
5.42 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: