Estudio de la decodificación de proteínas con fines predictivos

dc.contributor.advisorTFEMoler Cuiral, José Antonio
dc.contributor.affiliationEscuela Técnica Superior de Ingeniería Agronómica y Biocienciases_ES
dc.contributor.affiliationNekazaritzako Ingeniaritzako eta Biozientzietako Goi Mailako Eskola Teknikoaeu
dc.contributor.authorSanz Delgado, Irati
dc.coverage.spatialeast=-1.63490; north=42.76201; name=Noáin, Navarra, España
dc.date.accessioned2023-10-19T07:19:21Z
dc.date.available2023-10-19T07:19:21Z
dc.date.issued2023
dc.date.updated2023-10-17T09:11:04Z
dc.description.abstractEste estudio se enfoca en investigar el potencial predictivo de diversas decodificaciones de secuencias proteicas en relación con caracteríticas determinantes para la idoneidad de las proteínas en estudios clínicos. Además de analizar las secuencias proteicas, se abordan aspectos como la actividad de las proteínas mediante un problema de clasificación binaria, utilizando datos suministrados por Telum Therapeutics S.L. Se emplearon cinco decodificaciones del paquete protp de R Studio y se exploraron diversos modelos predictivos, incluyendo Random Forest, SVM Radial y Gradient Boosting como enfoques de aprendizaje automático, y Regresión Logística como un enfoque estadístico. Los resultados destacan que las decodificaciones de menor dimensionalidad demostraron un rendimiento superior, independientemente del modelo utilizado. Sin embargo, se observó que no existe un modelo universalmente efectivo para todos los problemas planteados. Se sugiere que un aumento en el tamaño de la muestra podría proporcionar un respaldo sólido para ciertos resultados, como el mayor rendimiento de la decodificación basada en la composición en la predicción de la actividad de las proteínas, en comparación con los datos experimentales proporcionados por Telum. Este enfoque podría resultar en un ahorro significativo de tiempo y recursos en términos de la cantidad de experimentos necesarios para determinar la actividad de las proteínas.es_ES
dc.description.abstractThis study focuses on investigating the predictive capability of various protein sequence decodings concerning critical features for protein suitability in clinical trials. In addition to the analysis of protein sequences, aspects related to protein activity are addressed through a binary classification problem, using data provided by Telum Therapeutics S.L. Five decodings from the protp package of R Studio were employed, and various predictive models were explored, including Random Forest, Radial SVM, and Gradient Boosting as machine learning approaches, and Logistic Regression as a statistical approach. The results highlight that lower-dimensional decodings exhibited superior performance, regardless of the model used. However, it was observed that there is no universally effective model for all the problems solved. It is suggested that an increase in the sample size could provide strong support for certain results, such as the improved performance of composition-based decoding in predicting protein activity compared to experimental data provided by Telum. This approach could result in significant time and resource savings in terms of the number of experiments needed to determine protein activity.en
dc.description.degreeGraduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarraes_ES
dc.description.degreeDatu Zientzietan Graduatua Nafarroako Unibertsitate Publikoaneu
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://academica-e.unavarra.es/handle/2454/46541
dc.language.isospaen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.subjectDecodificación de proteínases_ES
dc.subjectEstudios clínicoses_ES
dc.subjectProceso Telumes_ES
dc.subjectMétodos de Decodificaciónes_ES
dc.subjectProtein decodingen
dc.subjectClinical studiesen
dc.subjectTelum Processen
dc.subjectDecoding Methodsen
dc.titleEstudio de la decodificación de proteínas con fines predictivoses_ES
dc.typeinfo:eu-repo/semantics/bachelorThesis
dspace.entity.typePublication
relation.isAdvisorTFEOfPublicationec10e36c-8a72-4ba6-b481-289a596f1c4a
relation.isAdvisorTFEOfPublication.latestForDiscoveryec10e36c-8a72-4ba6-b481-289a596f1c4a

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
sanz.134050_TFG.pdf
Size:
5.31 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.78 KB
Format:
Item-specific license agreed to upon submission
Description: