Person:
Orozco Acosta, Erick

Loading...
Profile Picture

Email Address

Birth Date

Research Projects

Organizational Units

Job Title

Last Name

Orozco Acosta

First Name

Erick

person.page.departamento

ORCID

0000-0002-1170-667X

person.page.upna

811891

Name

Search Results

Now showing 1 - 6 of 6
  • PublicationOpen Access
    Big problems in spatio-temporal disease mapping: methods and software
    (Elsevier, 2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte MartĆ­nez, MarĆ­a Dolores; EstadĆ­stica, InformĆ”tica y MatemĆ”ticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Universidad PĆŗblica de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA20001
    Background and objective: Fitting spatio-temporal models for areal data is crucial in many fields such as cancer epidemiology. However, when data sets are very large, many issues arise. The main objective of this paper is to propose a general procedure to analyze high-dimensional spatio-temporal areal data, with special emphasis on mortality/incidence relative risk estimation. Methods: We present a pragmatic and simple idea that permits hierarchical spatio-temporal models to be fitted when the number of small areas is very large. Model fitting is carried out using integrated nested Laplace approximations over a partition of the spatial domain. We also use parallel and distributed strategies to speed up computations in a setting where Bayesian model fitting is generally prohibitively time-consuming or even unfeasible. Results: Using simulated and real data, we show that our method outperforms classical global models. We implement the methods and algorithms that we develop in the open-source R package bigDM where specific vignettes have been included to facilitate the use of the methodology for non-expert users. Conclusions: Our scalable methodology proposal provides reliable risk estimates when fitting Bayesian hierarchical spatio-temporal models for high-dimensional data.
  • PublicationOpen Access
    Factores de gestioĢn del conocimiento en entidad pĆŗblica del sector de trĆ”nsito y transporte
    (Universidad Pablo de Olavide, 2021) Orozco Acosta, Erick; Ortiz Ospino, Luis Eduardo; Padilla Suarez, Doris; Pizarro GutiƩrrez, Analida; Estadƭstica, InformƔtica y MatemƔticas; Estatistika, Informatika eta Matematika
    Desde una visiĆ³n sistĆ©mica, la gestiĆ³n del conocimiento afecta al proceso de toma de decisiones en las organizaciones que, en un entorno globalizado, deben plantear estrategias que posibiliten el incremento de la competitividad y productividad. El objetivo es determinar los factores de gestiĆ³n del conocimiento (GC) en una entidad pĆŗblica del sector transporte en Colombia que optimizan la prestaciĆ³n de sus servicios, ofreciendo herramientas que facilitan la captura, creaciĆ³n, retenciĆ³n, difusiĆ³n y uso del conocimiento, tomando como referencia, el anĆ”lisis relacional de cuatro factores como son el manejo de informaciĆ³n, la planeaciĆ³n estratĆ©gica, la comunicaciĆ³n e incentivos y la gestiĆ³n tecnolĆ³gica. La investigaciĆ³n es de enfoque cuantitativo, con un alcance correlacional y diseƱo no experimental de tipo transversal. En el anĆ”lisis de los datos se aplicaron tĆ©cnicas estadĆ­sticas multivariadas. Se realizĆ³ un anĆ”lisis correlacional a travĆ©s del cĆ”lculo del coeficiente de correlaciĆ³n de Sperman, para establecer cĆ³mo son las relaciones entre las dimensiones de los factores estudiados y entre cada factor. Luego se validan los factores mediante un anĆ”lisis de ecuaciones estructurales con estimaciones de mĆ”xima verosimilitud. Dentro de los hallazgos destaca que no existe una asociaciĆ³n entre el manejo de la unformaciĆ³n y la gestiĆ³n tecnolĆ³gica, lo que limita la gestiĆ³n del conocimiento organizacional, pero a su vez constituye una oportunidad de mejora para la efectiva ejecuciĆ³n futura de los procesos.
  • PublicationOpen Access
    Exploring disease mapping models in big data contexts: some new proposals
    (2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte MartĆ­nez, MarĆ­a Dolores; EstadĆ­stica, InformĆ”tica y MatemĆ”ticas; Estatistika, Informatika eta Matematika; Universidad PĆŗblica de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA2001
    La representaciĆ³n cartogrĆ”fica de enfermedades es un Ć”rea de investigaciĆ³n muy relevante y significativa dentro del campo de la estadĆ­stica espacial (datos de Ć”rea), ya que ofrece un apoyo muy importante para la toma de decisiones en materia de salud pĆŗblica. Debido a la gran variabilidad de los estimadores de riesgo clĆ”sicos, como la razĆ³n de mortalidad estandarizada (RME), el uso de modelos estadĆ­sticos complejos resulta esencial para obtener una representaciĆ³n mĆ”s coherente del riesgo de enfermedad subyacente. Durante las Ćŗltimas dĆ©cadas se han propuesto en la literatura varios modelos estadĆ­sticos para suavizar riesgos espacio-temporales, la mayorĆ­a de ellos considerando modelos que incorporan efectos aleatorios con distribuciones a priori condicionales autorregresivas (CAR), basĆ”ndose en el trabajo seminal de Besag et al. (1991). Sin embargo, la escalabilidad de estos modelos, concretamente su viabilidad en escenarios en los que el nĆŗmero de Ć”reas pequeƱas aumenta significativamente, no ha sido estudiada suficientemente. Por lo tanto, el principal objetivo de esta tesis es proponer nuevos mĆ©todos de modelizaciĆ³n bayesiana escalables para suavizar riesgos (o tasas) de incidencia/mortalidad en datos de Ć”rea espaciales y espacio-temporales de alta dimensiĆ³n. La metodologĆ­a estĆ” basada en el principio de ā€œdivide y vencerĆ”sā€. La presente tesis aborda en concreto los objetivos descritos a continuaciĆ³n. El primer objetivo es revisar la bibliografĆ­a mĆ”s reciente acerca de las principales aportaciones en el Ć”mbito espacial y espacio-temporal que son relevantes para los objetivos de esta investigaciĆ³n. El capĆ­tulo 1 ofrece una visiĆ³n general del ajuste y la inferencia de modelos, centrĆ”ndose en la tĆ©cnica INLA, basada en aproximaciones de Laplace anidadas e integraciĆ³n numĆ©rica, ampliamente utilizada para modelos Gaussianos latentes dentro del paradigma Bayesiano (Rue et al., 2009). En este capĆ­tulo tambiĆ©n se proporcionan aproximaciones de criterios de selecciĆ³n de modelos basados en la desviaciĆ³n Bayesiana (denominada deviance en inglĆ©s) y la distribuciĆ³n predictiva bajo las nuevas propuestas de modelos escalables. TambiĆ©n se incluye una breve descripciĆ³n del paquete bigDM de R, que implementa todos los algoritmos y modelos propuestos en esta disertaciĆ³n. El segundo objetivo de esta tesis es proponer un mĆ©todo de modelizaciĆ³n Bayesiana escalable para el tratamiento de datos de Ć”rea espaciales de alta dimensiĆ³n. En el CapĆ­tulo 2, se facilita una descripciĆ³n exhaustiva de una nueva metodologĆ­a de suavizaciĆ³n de riesgos. TambiĆ©n se lleva a cabo un estudio de simulaciĆ³n multiescenario que incluye casi 8 000 municipios espaƱoles para comparar el mĆ©todo propuesto con un modelo global tipo CAR en tĆ©rminos de bondad de ajuste y precisiĆ³n en la estimaciĆ³n de la superficie de riesgos. AdemĆ”s, se ilustra el comportamiento de los modelos escalables analizando datos de mortalidad por cĆ”ncer de colon y recto en hombres para municipios espaƱoles utilizando dos estrategias diferentes de particiĆ³n del dominio espacial. El tercer objetivo es ampliar el enfoque de modelizaciĆ³n Bayesiana escalable para suavizar riesgos de mortalidad o incidencia espacio-temporales de alta dimensiĆ³n. En el capĆ­tulo 3, se presenta una descripciĆ³n exhaustiva de los modelos CAR espaciotemporales propuestos originalmente por Knorr-Held (2000), que son la base de la nueva propuesta de modelizaciĆ³n para analizar datos de Ć”rea espacio-temporales. El capĆ­tulo tambiĆ©n explica las estrategias de paralelizaciĆ³n y computaciĆ³n distribuida implementadas en el paquete bigDM para acelerar los cĆ”lculos mediante el uso del paquete future (Bengtsson, 2021) de R. Se realiza un estudio de simulaciĆ³n para comparar la nueva propuesta escalable con dos estrategias de fusiĆ³n diferentes frente a los modelos CAR espacio-temporales tradicionales utilizando el mapa de los municipios espaƱoles como plantilla. AdemĆ”s, se evalĆŗa la nueva propuesta en tĆ©rminos de tiempo computacional. Finalmente, se ilustran y comparan todos los enfoques descritos en este capĆ­tulo analizando la evoluciĆ³n espacio-temporal de la mortalidad por cĆ”ncer de pulmĆ³n en hombres en los municipios espaƱoles durante el periodo 1991-2015. El cuarto objetivo es evaluar la idoneidad del mĆ©todo desarrollado en el CapĆ­tulo 3 para la previsiĆ³n a corto plazo de datos de alta resoluciĆ³n espacial. En el CapĆ­tulo 4, se presenta el modelo CAR espacio-temporal que incorpora observaciones faltantes en la variable respuesta para los periodos de tiempo que se van a pronosticar. Adicionalmente, se realiza un estudio de validaciĆ³n para evaluar la capacidad predictiva de los modelos para predicciones a uno, dos y tres periodos utilizando datos reales de mortalidad por cĆ”ncer de pulmĆ³n en municipios espaƱoles. En este capĆ­tulo, tambiĆ©n se compara la capacidad predictiva de los modelos utilizando medidas de validaciĆ³n cruzada (denominadas en inglĆ©s leave-one-out y leave-group-out) (Liu and Rue, 2022). El quinto objetivo es transversal a todos los capĆ­tulos. El objetivo es desarrollar un paquete en lenguaje R de cĆ³digo abierto llamado bigDM (Adin et al., 2023b) que consolida todos los mĆ©todos propuestos en esta disertaciĆ³n haciĆ©ndolos fĆ”cilmente disponibles para su uso por la comunidad cientĆ­fica. La tesis finaliza con las principales conclusiones de este trabajo y detalla futuras lĆ­neas de investigaciĆ³n.
  • PublicationOpen Access
    A scalable approach for short-term disease forecasting in high spatial resolution areal data
    (Wiley-VCH, 2023) Orozco Acosta, Erick; Riebler, Andrea; Adin Urtasun, Aritz; Ugarte MartĆ­nez, MarĆ­a Dolores; EstadĆ­stica, InformĆ”tica y MatemĆ”ticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Universidad PĆŗblica de Navarra / Nafarroako Unibertsitate Publikoa
    Short-term disease forecasting at specific discrete spatial resolutions has become a high-impact decision-support tool in health planning. However, when the number of areas is very large obtaining predictions can be computationally intensive or even unfeasible using standard spatiotemporal models. The purpose of this paper is to provide a method for short-term predictions in high-dimensional areal data based on a newly proposed Āædivide-and-conquerĀæ approach. We assess the predictive performance of this method and other classical spatiotemporal models in a validation study that uses cancer mortality data for the 7907 municipalities of continental Spain. The new proposal outperforms traditional models in terms of mean absolute error, root mean square error, and interval score when forecasting cancer mortality 1, 2, and 3 years ahead. Models are implemented in a fully Bayesian framework using the well-known integrated nested Laplace estimation technique.
  • PublicationOpen Access
    Scalable Bayesian modeling for smoothing disease mapping risks in large spatial data sets using INLA
    (Elsevier, 2021) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martƭnez, Marƭa Dolores; Estadƭstica, InformƔtica y MatemƔticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2
    Several methods have been proposed in the spatial statistics literature to analyse big data sets in continuous domains. However, new methods for analysing high-dimensional areal data are still scarce. Here, we propose a scalable Bayesian modelling approach for smoothing mortality (or incidence) risks in high-dimensional data, that is, when the number of small areas is very large. The method is implemented in the R add-on package bigDM and it is based on the idea of ā€œdivide and conquerā€œ. Although this proposal could possibly be implemented using any Bayesian fitting technique, we use INLA here (integrated nested Laplace approximations) as it is now a well-known technique, computationally efficient, and easy for practitioners to handle. We analyse the proposalā€™s empirical performance in a comprehensive simulation study that considers two model-free settings. Finally, the methodology is applied to analyse male colorectal cancer mortality in Spanish municipalities showing its benefits with regard to the standard approach in terms of goodness of fit and computational time.
  • PublicationOpen Access
    Bayesian modeling approach in Big Data contexts: an application in spatial epidemiology
    (IEEE, 2020) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martƭnez, Marƭa Dolores; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Estadƭstica, InformƔtica y MatemƔticas
    In this work we propose a novel scalable Bayesian modeling approach to smooth mortality risks borrowing information from neighbouring regions in high-dimensional spatial disease mapping contexts. The method is based on the well-known divide and conquer approach, so that the spatial domain is divided into D subregions where local spatial models can be fitted simultaneously. Model fitting and inference has been carried out using the integrated nested Laplace approximation (INLA) technique. Male colorectal cancer mortality data in the municipalities of continental Spain have been analyzed using the new model proposals. Results show that the new modeling approach is very competitive in terms of model fitting criteria when compared with a global spatial model, and it is computationally much more efficient.