Orozco Acosta, Erick
Loading...
Email Address
person.page.identifierURI
Birth Date
Job Title
Last Name
Orozco Acosta
First Name
Erick
person.page.departamento
EstadĆstica, InformĆ”tica y MatemĆ”ticas
person.page.instituteName
InaMat2. Instituto de Investigación en Materiales Avanzados y MatemÔticas
ORCID
person.page.observainves
person.page.upna
Name
- Publications
- item.page.relationships.isAdvisorOfPublication
- item.page.relationships.isAdvisorTFEOfPublication
- item.page.relationships.isAuthorMDOfPublication
2 results
Search Results
Now showing 1 - 2 of 2
Publication Open Access Bayesian modeling approach in Big Data contexts: an application in spatial epidemiology(IEEE, 2020) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte MartĆnez, MarĆa Dolores; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; EstadĆstica, InformĆ”tica y MatemĆ”ticasIn this work we propose a novel scalable Bayesian modeling approach to smooth mortality risks borrowing information from neighbouring regions in high-dimensional spatial disease mapping contexts. The method is based on the well-known divide and conquer approach, so that the spatial domain is divided into D subregions where local spatial models can be fitted simultaneously. Model fitting and inference has been carried out using the integrated nested Laplace approximation (INLA) technique. Male colorectal cancer mortality data in the municipalities of continental Spain have been analyzed using the new model proposals. Results show that the new modeling approach is very competitive in terms of model fitting criteria when compared with a global spatial model, and it is computationally much more efficient.Publication Open Access Exploring disease mapping models in big data contexts: some new proposals(2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte MartĆnez, MarĆa Dolores; EstadĆstica, InformĆ”tica y MatemĆ”ticas; Estatistika, Informatika eta Matematika; Universidad PĆŗblica de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA2001La representación cartogrĆ”fica de enfermedades es un Ć”rea de investigación muy relevante y significativa dentro del campo de la estadĆstica espacial (datos de Ć”rea), ya que ofrece un apoyo muy importante para la toma de decisiones en materia de salud pĆŗblica. Debido a la gran variabilidad de los estimadores de riesgo clĆ”sicos, como la razón de mortalidad estandarizada (RME), el uso de modelos estadĆsticos complejos resulta esencial para obtener una representación mĆ”s coherente del riesgo de enfermedad subyacente. Durante las Ćŗltimas dĆ©cadas se han propuesto en la literatura varios modelos estadĆsticos para suavizar riesgos espacio-temporales, la mayorĆa de ellos considerando modelos que incorporan efectos aleatorios con distribuciones a priori condicionales autorregresivas (CAR), basĆ”ndose en el trabajo seminal de Besag et al. (1991). Sin embargo, la escalabilidad de estos modelos, concretamente su viabilidad en escenarios en los que el nĆŗmero de Ć”reas pequeƱas aumenta significativamente, no ha sido estudiada suficientemente. Por lo tanto, el principal objetivo de esta tesis es proponer nuevos mĆ©todos de modelización bayesiana escalables para suavizar riesgos (o tasas) de incidencia/mortalidad en datos de Ć”rea espaciales y espacio-temporales de alta dimensión. La metodologĆa estĆ” basada en el principio de ādivide y vencerĆ”sā. La presente tesis aborda en concreto los objetivos descritos a continuación. El primer objetivo es revisar la bibliografĆa mĆ”s reciente acerca de las principales aportaciones en el Ć”mbito espacial y espacio-temporal que son relevantes para los objetivos de esta investigación. El capĆtulo 1 ofrece una visión general del ajuste y la inferencia de modelos, centrĆ”ndose en la tĆ©cnica INLA, basada en aproximaciones de Laplace anidadas e integración numĆ©rica, ampliamente utilizada para modelos Gaussianos latentes dentro del paradigma Bayesiano (Rue et al., 2009). En este capĆtulo tambiĆ©n se proporcionan aproximaciones de criterios de selección de modelos basados en la desviación Bayesiana (denominada deviance en inglĆ©s) y la distribución predictiva bajo las nuevas propuestas de modelos escalables. TambiĆ©n se incluye una breve descripción del paquete bigDM de R, que implementa todos los algoritmos y modelos propuestos en esta disertación. El segundo objetivo de esta tesis es proponer un mĆ©todo de modelización Bayesiana escalable para el tratamiento de datos de Ć”rea espaciales de alta dimensión. En el CapĆtulo 2, se facilita una descripción exhaustiva de una nueva metodologĆa de suavización de riesgos. TambiĆ©n se lleva a cabo un estudio de simulación multiescenario que incluye casi 8 000 municipios espaƱoles para comparar el mĆ©todo propuesto con un modelo global tipo CAR en tĆ©rminos de bondad de ajuste y precisión en la estimación de la superficie de riesgos. AdemĆ”s, se ilustra el comportamiento de los modelos escalables analizando datos de mortalidad por cĆ”ncer de colon y recto en hombres para municipios espaƱoles utilizando dos estrategias diferentes de partición del dominio espacial. El tercer objetivo es ampliar el enfoque de modelización Bayesiana escalable para suavizar riesgos de mortalidad o incidencia espacio-temporales de alta dimensión. En el capĆtulo 3, se presenta una descripción exhaustiva de los modelos CAR espaciotemporales propuestos originalmente por Knorr-Held (2000), que son la base de la nueva propuesta de modelización para analizar datos de Ć”rea espacio-temporales. El capĆtulo tambiĆ©n explica las estrategias de paralelización y computación distribuida implementadas en el paquete bigDM para acelerar los cĆ”lculos mediante el uso del paquete future (Bengtsson, 2021) de R. Se realiza un estudio de simulación para comparar la nueva propuesta escalable con dos estrategias de fusión diferentes frente a los modelos CAR espacio-temporales tradicionales utilizando el mapa de los municipios espaƱoles como plantilla. AdemĆ”s, se evalĆŗa la nueva propuesta en tĆ©rminos de tiempo computacional. Finalmente, se ilustran y comparan todos los enfoques descritos en este capĆtulo analizando la evolución espacio-temporal de la mortalidad por cĆ”ncer de pulmón en hombres en los municipios espaƱoles durante el periodo 1991-2015. El cuarto objetivo es evaluar la idoneidad del mĆ©todo desarrollado en el CapĆtulo 3 para la previsión a corto plazo de datos de alta resolución espacial. En el CapĆtulo 4, se presenta el modelo CAR espacio-temporal que incorpora observaciones faltantes en la variable respuesta para los periodos de tiempo que se van a pronosticar. Adicionalmente, se realiza un estudio de validación para evaluar la capacidad predictiva de los modelos para predicciones a uno, dos y tres periodos utilizando datos reales de mortalidad por cĆ”ncer de pulmón en municipios espaƱoles. En este capĆtulo, tambiĆ©n se compara la capacidad predictiva de los modelos utilizando medidas de validación cruzada (denominadas en inglĆ©s leave-one-out y leave-group-out) (Liu and Rue, 2022). El quinto objetivo es transversal a todos los capĆtulos. El objetivo es desarrollar un paquete en lenguaje R de código abierto llamado bigDM (Adin et al., 2023b) que consolida todos los mĆ©todos propuestos en esta disertación haciĆ©ndolos fĆ”cilmente disponibles para su uso por la comunidad cientĆfica. La tesis finaliza con las principales conclusiones de este trabajo y detalla futuras lĆneas de investigación.