Show simple item record

dc.creatorAlonso Castrillejo, Sergioes_ES
dc.date.accessioned2020-10-06T13:12:32Z
dc.date.available2020-10-06T13:12:32Z
dc.date.issued2020
dc.identifier.urihttps://hdl.handle.net/2454/38351
dc.description.abstractMotivación. El conocimiento genético aportado por las nuevas tecnologías de secuenciación ha permitido desarrollar herramientas de predicción de riesgo a padecer enfermedades multifactoriales y poligénicas. En este sentido, se ha estudiado la diabetes mellitus tipo II (DMT2) mediante técnicas de computación como el machine learning (ML) para el desarrollo de herramientas predictivas de riesgo poligénico. Para ello, se empleó la información procedente del proyecto SUN e InCluSilver y se incluyó una selección de variables, limpieza de datos e imputación multivariante de datos faltantes sobre un tamaño muestral de 1000 participantes. Posteriormente, se aplicaron 7 algoritmos diferentes de ML supervisado y la técnica de k-fold cross validation empleando el lenguaje de programación R. Resultados. De los 7 algoritmos evaluados para comparar la capacidad predictiva del ML frente a los métodos tradicionales, los algoritmos basados en árboles de decisión no obtuvieron la robustez suficiente. Sin embargo, 2 de estos modelos como son el método K-nearest neighbours (KNN) y redes neuronales (NN) aportaron resultados con baja variabilidad, bajos índices de error y correlaciones positivas entre los datos de entrada y los valores predichos, siendo el modelo NN el que obtuvo los resultados más prometedores.es_ES
dc.description.abstractMotivation. The genetic knowledge provided by the new sequencing technologies has made it possible to development risk prediction tools for multifactorial and polygenic diseases. In this sense, Type II Diabetes Mellitus (T2DM) has been studied using computer techniques such as Machine Learning (ML) for the development of polygenic risk predictive tools. Information from the SUN and InCluSilver Projects was used, including a selection of variables, data cleaning and multivariate imputation of missing data on a sample size of 1000 participants. Subsequently, 7 different supervised ML algorithms and the k-fold cross validation technique were applied using the R programming language. Results. From the 7 algorithms evaluated to compare the predictive capacity of ML against traditional methods, algorithms based on decision trees did not obtain sufficient robustness. However, 2 of these models, such as the K-nearest neighbours (KNN) and neural networks (NN), provided results with low variability, low error rates, and positive correlations between the input data and the predicted values, being the NN model the one with the most promising results.en
dc.format.mimetypeapplication/pdfen
dc.language.isospaen
dc.subjectDiabetes mellitus tipo IIes_ES
dc.subjectMachine learninges_ES
dc.subjectMedicina de precisiónes_ES
dc.subjectRiesgo poligénicoes_ES
dc.subjectRedes neuronaleses_ES
dc.subjectType II Diabetes Mellitusen
dc.subjectPrecision medicineen
dc.subjectPolygenic risken
dc.subjectNeural networken
dc.titleAplicación de algoritmos de machine learning en la prediccion de la diabetes mellitus tipo IIes_ES
dc.typeTrabajo Fin de Máster/Master Amaierako Lanaes
dc.typeinfo:eu-repo/semantics/masterThesisen
dc.date.updated2020-10-02T12:41:09Z
dc.contributor.affiliationFacultad de Ciencias de la Saludes_ES
dc.contributor.affiliationOsasun Zientzien Fakultateaeu
dc.description.degreeMáster Universitario en Investigación en Ciencias de la Saludes_ES
dc.description.degreeUnibertsitate Masterra Osasun Zientzietako Ikerketaneu
dc.rights.accessRightsAcceso embargado 5 años / 5 urteko bahituraes
dc.rights.accessRightsinfo:eu-repo/semantics/embargoedAccessen
dc.embargo.lift2025-07-01
dc.embargo.terms2025-07-01es_ES
dc.contributor.advisorTFEEncío Martínez, Ignacioes_ES
dc.contributor.advisorTFEGalbete Ciaurriz, Ceciliaes_ES


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record


El Repositorio ha recibido la ayuda de la Fundación Española para la Ciencia y la Tecnología para la realización de actividades en el ámbito del fomento de la investigación científica de excelencia, en la Línea 2. Repositorios institucionales (convocatoria 2020-2021).
Logo MinisterioLogo Fecyt