Orozco Acosta, Erick

Loading...
Profile Picture

Email Address

Birth Date

Job Title

Last Name

Orozco Acosta

First Name

Erick

person.page.departamento

Estadƭstica, InformƔtica y MatemƔticas

person.page.instituteName

InaMat2. Instituto de Investigación en Materiales Avanzados y MatemÔticas

person.page.observainves

person.page.upna

Name

Search Results

Now showing 1 - 2 of 2
  • PublicationOpen Access
    Bayesian modeling approach in Big Data contexts: an application in spatial epidemiology
    (IEEE, 2020) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martƭnez, Marƭa Dolores; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Estadƭstica, InformƔtica y MatemƔticas
    In this work we propose a novel scalable Bayesian modeling approach to smooth mortality risks borrowing information from neighbouring regions in high-dimensional spatial disease mapping contexts. The method is based on the well-known divide and conquer approach, so that the spatial domain is divided into D subregions where local spatial models can be fitted simultaneously. Model fitting and inference has been carried out using the integrated nested Laplace approximation (INLA) technique. Male colorectal cancer mortality data in the municipalities of continental Spain have been analyzed using the new model proposals. Results show that the new modeling approach is very competitive in terms of model fitting criteria when compared with a global spatial model, and it is computationally much more efficient.
  • PublicationOpen Access
    Exploring disease mapping models in big data contexts: some new proposals
    (2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estadística, InformÔtica y MatemÔticas; Estatistika, Informatika eta Matematika; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA2001
    La representación cartogrĆ”fica de enfermedades es un Ć”rea de investigación muy relevante y significativa dentro del campo de la estadĆ­stica espacial (datos de Ć”rea), ya que ofrece un apoyo muy importante para la toma de decisiones en materia de salud pĆŗblica. Debido a la gran variabilidad de los estimadores de riesgo clĆ”sicos, como la razón de mortalidad estandarizada (RME), el uso de modelos estadĆ­sticos complejos resulta esencial para obtener una representación mĆ”s coherente del riesgo de enfermedad subyacente. Durante las Ćŗltimas dĆ©cadas se han propuesto en la literatura varios modelos estadĆ­sticos para suavizar riesgos espacio-temporales, la mayorĆ­a de ellos considerando modelos que incorporan efectos aleatorios con distribuciones a priori condicionales autorregresivas (CAR), basĆ”ndose en el trabajo seminal de Besag et al. (1991). Sin embargo, la escalabilidad de estos modelos, concretamente su viabilidad en escenarios en los que el nĆŗmero de Ć”reas pequeƱas aumenta significativamente, no ha sido estudiada suficientemente. Por lo tanto, el principal objetivo de esta tesis es proponer nuevos mĆ©todos de modelización bayesiana escalables para suavizar riesgos (o tasas) de incidencia/mortalidad en datos de Ć”rea espaciales y espacio-temporales de alta dimensión. La metodologĆ­a estĆ” basada en el principio de ā€œdivide y vencerĆ”sā€. La presente tesis aborda en concreto los objetivos descritos a continuación. El primer objetivo es revisar la bibliografĆ­a mĆ”s reciente acerca de las principales aportaciones en el Ć”mbito espacial y espacio-temporal que son relevantes para los objetivos de esta investigación. El capĆ­tulo 1 ofrece una visión general del ajuste y la inferencia de modelos, centrĆ”ndose en la tĆ©cnica INLA, basada en aproximaciones de Laplace anidadas e integración numĆ©rica, ampliamente utilizada para modelos Gaussianos latentes dentro del paradigma Bayesiano (Rue et al., 2009). En este capĆ­tulo tambiĆ©n se proporcionan aproximaciones de criterios de selección de modelos basados en la desviación Bayesiana (denominada deviance en inglĆ©s) y la distribución predictiva bajo las nuevas propuestas de modelos escalables. TambiĆ©n se incluye una breve descripción del paquete bigDM de R, que implementa todos los algoritmos y modelos propuestos en esta disertación. El segundo objetivo de esta tesis es proponer un mĆ©todo de modelización Bayesiana escalable para el tratamiento de datos de Ć”rea espaciales de alta dimensión. En el CapĆ­tulo 2, se facilita una descripción exhaustiva de una nueva metodologĆ­a de suavización de riesgos. TambiĆ©n se lleva a cabo un estudio de simulación multiescenario que incluye casi 8 000 municipios espaƱoles para comparar el mĆ©todo propuesto con un modelo global tipo CAR en tĆ©rminos de bondad de ajuste y precisión en la estimación de la superficie de riesgos. AdemĆ”s, se ilustra el comportamiento de los modelos escalables analizando datos de mortalidad por cĆ”ncer de colon y recto en hombres para municipios espaƱoles utilizando dos estrategias diferentes de partición del dominio espacial. El tercer objetivo es ampliar el enfoque de modelización Bayesiana escalable para suavizar riesgos de mortalidad o incidencia espacio-temporales de alta dimensión. En el capĆ­tulo 3, se presenta una descripción exhaustiva de los modelos CAR espaciotemporales propuestos originalmente por Knorr-Held (2000), que son la base de la nueva propuesta de modelización para analizar datos de Ć”rea espacio-temporales. El capĆ­tulo tambiĆ©n explica las estrategias de paralelización y computación distribuida implementadas en el paquete bigDM para acelerar los cĆ”lculos mediante el uso del paquete future (Bengtsson, 2021) de R. Se realiza un estudio de simulación para comparar la nueva propuesta escalable con dos estrategias de fusión diferentes frente a los modelos CAR espacio-temporales tradicionales utilizando el mapa de los municipios espaƱoles como plantilla. AdemĆ”s, se evalĆŗa la nueva propuesta en tĆ©rminos de tiempo computacional. Finalmente, se ilustran y comparan todos los enfoques descritos en este capĆ­tulo analizando la evolución espacio-temporal de la mortalidad por cĆ”ncer de pulmón en hombres en los municipios espaƱoles durante el periodo 1991-2015. El cuarto objetivo es evaluar la idoneidad del mĆ©todo desarrollado en el CapĆ­tulo 3 para la previsión a corto plazo de datos de alta resolución espacial. En el CapĆ­tulo 4, se presenta el modelo CAR espacio-temporal que incorpora observaciones faltantes en la variable respuesta para los periodos de tiempo que se van a pronosticar. Adicionalmente, se realiza un estudio de validación para evaluar la capacidad predictiva de los modelos para predicciones a uno, dos y tres periodos utilizando datos reales de mortalidad por cĆ”ncer de pulmón en municipios espaƱoles. En este capĆ­tulo, tambiĆ©n se compara la capacidad predictiva de los modelos utilizando medidas de validación cruzada (denominadas en inglĆ©s leave-one-out y leave-group-out) (Liu and Rue, 2022). El quinto objetivo es transversal a todos los capĆ­tulos. El objetivo es desarrollar un paquete en lenguaje R de código abierto llamado bigDM (Adin et al., 2023b) que consolida todos los mĆ©todos propuestos en esta disertación haciĆ©ndolos fĆ”cilmente disponibles para su uso por la comunidad cientĆ­fica. La tesis finaliza con las principales conclusiones de este trabajo y detalla futuras lĆ­neas de investigación.