Publication: Sistema de cribado de fármacos con Inteligencia Artificial e implementación en GPU
Date
Authors
Director
Publisher
Project identifier
Abstract
Introducción: Los fármacos son moléculas que se unen a una proteína objetivo cambiando su estructura y, por tanto, su funcionalidad. La viabilidad de los fármacos se puede evaluar calculando la afinidad de unión, la cual depende de su compatibilidad estructural. El descubrimiento de estas moléculas es un proceso que consume mucho tiempo y dinero que, además, se ve impulsado por el enorme espectro de moléculas existentes. Para hacer frente a este reto surge la aproximación conocida como Virtual Screening (VS), que es un método que intenta reducir el campo de búsqueda mediante métodos in silico. Una de estas aproximaciones de VS es el Docking, que consiste en determinar computacionalmente una pose de la molécula, o ligando, que optimice la fuerza de unión en el pocket de la proteína, es decir, que genere el complejo más estable posible. Posteriormente, se puntúa la afinidad entre esta pose y la proteína objetivo, prediciendo así su actividad biológica. A pesar de la existencia de funciones de puntuación de diferente naturaleza, las últimas tendencias se inclinan por las basadas en Inteligencia Artificial. Objetivos: Reducir el número de moléculas que entren en las fases experimentales del descubrimiento de fármacos diseñando un sistema de Virtual Screening basado en metodología Deep Learning, concretamente Redes Neuronales Convolucionales. Metodología: Para el desarrollo de esta tesis se plantea una metodología dividida en tres fases: Primero se desarrolló una metodología Benchmarking que habilite la captura, preprocesado, ejecución de modelos de Docking más populares (Smina, RF-Score-VS y CNN-Score) y su evaluación. Segundo, se desarrolló una aproximación de captura adicional de datos existentes en la literatura y la generación de datos adicionales usando metodología de Deep Learning generativa. Finalmente se implementó un modelo de Deep Learning basado en redes de convolución. Para ello, se desarrolló diferentes estrategias de representación de datos de entrada basada en la generación de matrices tridimensionales que representen las uniones entre fármaco y diana. Posteriormente se entrenó la Red de Convolución en GPU y se evalúo utilizando el área bajo la curva de Precisión contra Sensibilidad y el factor de Enriquecimiento al 1%. Resultado: El rendimiento obtenido del método de Virtual Screening diseñado supera ampliamente en ambas métricas a sus competidores cuando se evalúa con ligandos candidatos de la misma proteína con la que se ha entrenado. Al realizar la evaluación con moléculas de otras proteínas se obtienen peores rendimientos, sin lograr superar el umbral establecido por los métodos del estado del arte. Conclusiones: Se ha diseñado un nuevo método de Virtual Screening basado en una idea de representación de datos original, que consigue batir a los métodos que otorgan mejores resultados cuando se evalúa con ligandos candidatos de la misma proteína que con los que ha sido entrenada la Red Neuronal Convolucional implementada.
Description
Keywords
Department
Faculty/School
Degree
Doctorate program
item.page.cita
item.page.rights
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.