Orozco Acosta, Erick
Loading...
Email Address
person.page.identifierURI
Birth Date
Job Title
Last Name
Orozco Acosta
First Name
Erick
person.page.departamento
Estadística, Informática y Matemáticas
person.page.instituteName
InaMat2. Instituto de Investigación en Materiales Avanzados y Matemáticas
ORCID
person.page.observainves
person.page.upna
Name
- Publications
- item.page.relationships.isAdvisorOfPublication
- item.page.relationships.isAdvisorTFEOfPublication
- item.page.relationships.isAuthorMDOfPublication
7 results
Search Results
Now showing 1 - 7 of 7
Publication Open Access Big problems in spatio-temporal disease mapping: methods and software(Elsevier, 2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA20001Background and objective: Fitting spatio-temporal models for areal data is crucial in many fields such as cancer epidemiology. However, when data sets are very large, many issues arise. The main objective of this paper is to propose a general procedure to analyze high-dimensional spatio-temporal areal data, with special emphasis on mortality/incidence relative risk estimation. Methods: We present a pragmatic and simple idea that permits hierarchical spatio-temporal models to be fitted when the number of small areas is very large. Model fitting is carried out using integrated nested Laplace approximations over a partition of the spatial domain. We also use parallel and distributed strategies to speed up computations in a setting where Bayesian model fitting is generally prohibitively time-consuming or even unfeasible. Results: Using simulated and real data, we show that our method outperforms classical global models. We implement the methods and algorithms that we develop in the open-source R package bigDM where specific vignettes have been included to facilitate the use of the methodology for non-expert users. Conclusions: Our scalable methodology proposal provides reliable risk estimates when fitting Bayesian hierarchical spatio-temporal models for high-dimensional data.Publication Open Access A scalable approach for short-term disease forecasting in high spatial resolution areal data(Wiley-VCH, 2023) Orozco Acosta, Erick; Riebler, Andrea; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Universidad Pública de Navarra / Nafarroako Unibertsitate PublikoaShort-term disease forecasting at specific discrete spatial resolutions has become a high-impact decision-support tool in health planning. However, when the number of areas is very large obtaining predictions can be computationally intensive or even unfeasible using standard spatiotemporal models. The purpose of this paper is to provide a method for short-term predictions in high-dimensional areal data based on a newly proposed ¿divide-and-conquer¿ approach. We assess the predictive performance of this method and other classical spatiotemporal models in a validation study that uses cancer mortality data for the 7907 municipalities of continental Spain. The new proposal outperforms traditional models in terms of mean absolute error, root mean square error, and interval score when forecasting cancer mortality 1, 2, and 3 years ahead. Models are implemented in a fully Bayesian framework using the well-known integrated nested Laplace estimation technique.Publication Open Access Psychometric properties and normative data using item response theory approach for three neuropsychological tests in Waranka children population(MDPI, 2025-02-15) Fierro Bósquez, María José; Fuentes Mendoza, Eliana María; Olabarrieta Landa, Laiene; Abiuso Lillo, Trinidad; Orozco Acosta, Erick; Mascialino, Guido; Arango Lasprilla, Juan Carlos; Rivera, Diego; Ciencias de la Salud; Osasun Zientziak: Objective: To evaluate the psychometric properties of the Shortened Version of the Token Test (SVTT), the Peabody Picture Vocabulary Test (PPVT-III), and the Rey–Osterrieth Complex Figure (ROCF) using an item response theory (IRT) framework and to establish normative data for Waranka children and adolescents based on their ability scores. Methods: A total of 436 healthy people aged between 6 and 17 participated in this study. The factor structure was evaluated using confirmatory factor analysis (CFA) and the difficulty and discrimination parameters using IRT through the two-parameter logistic model for the SVTT and PPTV-III, while for the ROCF, the graded response model was used. The ordinal alpha and McDonald’s omega were used for reliability. Results: For most items, a low ability was enough to achieve the highest scores for the ROCF and SVTT. For the PPVTIII, the items aligned sequentially based on the difficulty, and a low level of ability was enough to achieve the highest score for the first 40 items. The ROCF, SVTT, and PPVTIII demonstrated adequate reliability. The ROCF copy and immediate recall scores were influenced by the mean parents’ years of education (MPE) and quadratic age interaction. The SVTT performance was affected by the quadratic age and sex interaction, and the PPVT-III by the interaction effect of the MPE and quadratic age. Conclusions: This is the first study to analyze the psychometric properties of the ROCF, SVTT, and PPVT-III through IRT models that are accurate and relevant for the validity of the obtained data and generate normative data in the under-represented nation of Ecuador for clinical and research purposes.Publication Open Access Scalable Bayesian modeling for smoothing disease mapping risks in large spatial data sets using INLA(Elsevier, 2021) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2Several methods have been proposed in the spatial statistics literature to analyse big data sets in continuous domains. However, new methods for analysing high-dimensional areal data are still scarce. Here, we propose a scalable Bayesian modelling approach for smoothing mortality (or incidence) risks in high-dimensional data, that is, when the number of small areas is very large. The method is implemented in the R add-on package bigDM and it is based on the idea of “divide and conquer“. Although this proposal could possibly be implemented using any Bayesian fitting technique, we use INLA here (integrated nested Laplace approximations) as it is now a well-known technique, computationally efficient, and easy for practitioners to handle. We analyse the proposal’s empirical performance in a comprehensive simulation study that considers two model-free settings. Finally, the methodology is applied to analyse male colorectal cancer mortality in Spanish municipalities showing its benefits with regard to the standard approach in terms of goodness of fit and computational time.Publication Open Access Bayesian modeling approach in Big Data contexts: an application in spatial epidemiology(IEEE, 2020) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estatistika, Informatika eta Matematika; Institute for Advanced Materials and Mathematics - INAMAT2; Estadística, Informática y MatemáticasIn this work we propose a novel scalable Bayesian modeling approach to smooth mortality risks borrowing information from neighbouring regions in high-dimensional spatial disease mapping contexts. The method is based on the well-known divide and conquer approach, so that the spatial domain is divided into D subregions where local spatial models can be fitted simultaneously. Model fitting and inference has been carried out using the integrated nested Laplace approximation (INLA) technique. Male colorectal cancer mortality data in the municipalities of continental Spain have been analyzed using the new model proposals. Results show that the new modeling approach is very competitive in terms of model fitting criteria when compared with a global spatial model, and it is computationally much more efficient.Publication Open Access Exploring disease mapping models in big data contexts: some new proposals(2023) Orozco Acosta, Erick; Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA2001La representación cartográfica de enfermedades es un área de investigación muy relevante y significativa dentro del campo de la estadística espacial (datos de área), ya que ofrece un apoyo muy importante para la toma de decisiones en materia de salud pública. Debido a la gran variabilidad de los estimadores de riesgo clásicos, como la razón de mortalidad estandarizada (RME), el uso de modelos estadísticos complejos resulta esencial para obtener una representación más coherente del riesgo de enfermedad subyacente. Durante las últimas décadas se han propuesto en la literatura varios modelos estadísticos para suavizar riesgos espacio-temporales, la mayoría de ellos considerando modelos que incorporan efectos aleatorios con distribuciones a priori condicionales autorregresivas (CAR), basándose en el trabajo seminal de Besag et al. (1991). Sin embargo, la escalabilidad de estos modelos, concretamente su viabilidad en escenarios en los que el número de áreas pequeñas aumenta significativamente, no ha sido estudiada suficientemente. Por lo tanto, el principal objetivo de esta tesis es proponer nuevos métodos de modelización bayesiana escalables para suavizar riesgos (o tasas) de incidencia/mortalidad en datos de área espaciales y espacio-temporales de alta dimensión. La metodología está basada en el principio de “divide y vencerás”. La presente tesis aborda en concreto los objetivos descritos a continuación. El primer objetivo es revisar la bibliografía más reciente acerca de las principales aportaciones en el ámbito espacial y espacio-temporal que son relevantes para los objetivos de esta investigación. El capítulo 1 ofrece una visión general del ajuste y la inferencia de modelos, centrándose en la técnica INLA, basada en aproximaciones de Laplace anidadas e integración numérica, ampliamente utilizada para modelos Gaussianos latentes dentro del paradigma Bayesiano (Rue et al., 2009). En este capítulo también se proporcionan aproximaciones de criterios de selección de modelos basados en la desviación Bayesiana (denominada deviance en inglés) y la distribución predictiva bajo las nuevas propuestas de modelos escalables. También se incluye una breve descripción del paquete bigDM de R, que implementa todos los algoritmos y modelos propuestos en esta disertación. El segundo objetivo de esta tesis es proponer un método de modelización Bayesiana escalable para el tratamiento de datos de área espaciales de alta dimensión. En el Capítulo 2, se facilita una descripción exhaustiva de una nueva metodología de suavización de riesgos. También se lleva a cabo un estudio de simulación multiescenario que incluye casi 8 000 municipios españoles para comparar el método propuesto con un modelo global tipo CAR en términos de bondad de ajuste y precisión en la estimación de la superficie de riesgos. Además, se ilustra el comportamiento de los modelos escalables analizando datos de mortalidad por cáncer de colon y recto en hombres para municipios españoles utilizando dos estrategias diferentes de partición del dominio espacial. El tercer objetivo es ampliar el enfoque de modelización Bayesiana escalable para suavizar riesgos de mortalidad o incidencia espacio-temporales de alta dimensión. En el capítulo 3, se presenta una descripción exhaustiva de los modelos CAR espaciotemporales propuestos originalmente por Knorr-Held (2000), que son la base de la nueva propuesta de modelización para analizar datos de área espacio-temporales. El capítulo también explica las estrategias de paralelización y computación distribuida implementadas en el paquete bigDM para acelerar los cálculos mediante el uso del paquete future (Bengtsson, 2021) de R. Se realiza un estudio de simulación para comparar la nueva propuesta escalable con dos estrategias de fusión diferentes frente a los modelos CAR espacio-temporales tradicionales utilizando el mapa de los municipios españoles como plantilla. Además, se evalúa la nueva propuesta en términos de tiempo computacional. Finalmente, se ilustran y comparan todos los enfoques descritos en este capítulo analizando la evolución espacio-temporal de la mortalidad por cáncer de pulmón en hombres en los municipios españoles durante el periodo 1991-2015. El cuarto objetivo es evaluar la idoneidad del método desarrollado en el Capítulo 3 para la previsión a corto plazo de datos de alta resolución espacial. En el Capítulo 4, se presenta el modelo CAR espacio-temporal que incorpora observaciones faltantes en la variable respuesta para los periodos de tiempo que se van a pronosticar. Adicionalmente, se realiza un estudio de validación para evaluar la capacidad predictiva de los modelos para predicciones a uno, dos y tres periodos utilizando datos reales de mortalidad por cáncer de pulmón en municipios españoles. En este capítulo, también se compara la capacidad predictiva de los modelos utilizando medidas de validación cruzada (denominadas en inglés leave-one-out y leave-group-out) (Liu and Rue, 2022). El quinto objetivo es transversal a todos los capítulos. El objetivo es desarrollar un paquete en lenguaje R de código abierto llamado bigDM (Adin et al., 2023b) que consolida todos los métodos propuestos en esta disertación haciéndolos fácilmente disponibles para su uso por la comunidad científica. La tesis finaliza con las principales conclusiones de este trabajo y detalla futuras líneas de investigación.Publication Open Access Factores de gestión del conocimiento en entidad pública del sector de tránsito y transporte(Universidad Pablo de Olavide, 2021) Orozco Acosta, Erick; Ortiz Ospino, Luis Eduardo; Padilla Suarez, Doris; Pizarro Gutiérrez, Analida; Estadística, Informática y Matemáticas; Estatistika, Informatika eta MatematikaDesde una visión sistémica, la gestión del conocimiento afecta al proceso de toma de decisiones en las organizaciones que, en un entorno globalizado, deben plantear estrategias que posibiliten el incremento de la competitividad y productividad. El objetivo es determinar los factores de gestión del conocimiento (GC) en una entidad pública del sector transporte en Colombia que optimizan la prestación de sus servicios, ofreciendo herramientas que facilitan la captura, creación, retención, difusión y uso del conocimiento, tomando como referencia, el análisis relacional de cuatro factores como son el manejo de información, la planeación estratégica, la comunicación e incentivos y la gestión tecnológica. La investigación es de enfoque cuantitativo, con un alcance correlacional y diseño no experimental de tipo transversal. En el análisis de los datos se aplicaron técnicas estadísticas multivariadas. Se realizó un análisis correlacional a través del cálculo del coeficiente de correlación de Sperman, para establecer cómo son las relaciones entre las dimensiones de los factores estudiados y entre cada factor. Luego se validan los factores mediante un análisis de ecuaciones estructurales con estimaciones de máxima verosimilitud. Dentro de los hallazgos destaca que no existe una asociación entre el manejo de la unformación y la gestión tecnológica, lo que limita la gestión del conocimiento organizacional, pero a su vez constituye una oportunidad de mejora para la efectiva ejecución futura de los procesos.