Tesis doctorales DEIO - EIOS Doktoretza tesiak

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 5 of 5
  • PublicationOpen Access
    Probabilistic analysis of adaptive experimental designs
    (2014) Galbete Jiménez, Arkaitz; Moler Cuiral, José Antonio; Plo, Fernando; Estadística e Investigación Operativa; Estatistika eta Ikerketa Operatiboa
    Un ensayo clínico es un experimento estadístico que consiste en comparar el comportamiento de dos tratamientos con objeto de establecer la superioridad de uno respecto al otro. En esta tesis se ha presentado un nuevo diseño de ensayo clínico adaptado a la respuesta, llamado diseño urna de Klein, que intenta combinar buenas propiedades éticas e inferenciales. A su vez, se han estudiado sus propiedades exactas y asintóticas y se compara el nuevo diseño con otros diseños destacados en la literatura estadística. Se realiza un estudio detallado de inferencia basado en la aleatorización desde un punto de vista exacto y asintótico. Finalmente, se analiza la inclusión de variables en el diseño.
  • PublicationOpen Access
    Modelado matemático de la incertidumbre asociada a la generación de energías renovables
    (2017) Frías Paredes, Laura; Mallor Giménez, Fermín; León Mendoza, María Teresa; Gastón Romeo, Martín; Estadística e Investigación Operativa; Estatistika eta Ikerketa Operatiboa
    Los trabajos realizados en el marco de esta tesis tienen como objetivo proporcionar herramientas matemáticas que permitan un conocimiento más profundo y detallado del comportamiento de los modelos de predicción de energías renovables. Aborda la problemática del estudio de la calidad de las predicciones desde una nueva perspectiva: la influencia de los desvíos temporales en la calidad y utilidad de los pronósticos. Para ello, se ha desarrollado un procedimiento completo que permite, por un lado, cuantificar numéricamente el desvío temporal de las predicciones y además, conocer la proporción de error originada por este tipo de desvíos. Además los métodos desarrollados proporcionan una nueva metodología para comparar distintas predicciones aportando mayor robustez y fiabilidad a la tarea de selección de predicciones óptimas o combinación de las mismas. Esta actividad es clave en la integración en red de las energías renovables y su participación en el mercado eléctrico. Cabe señalar que se ha desarrollado un paquete propio, basado en el software de libre distribución R, que contiene las funciones necesarias para aplicar las propuestas de este trabajo. Esto facilitará que las metodologías desarrolladas puedan ser aprovechadas por la comunidad científica. Se presenta la metodología desarrollada para poder evaluar la diferencia entre las series predichas y medidas desde el punto de vista temporal, lo que nos conduce a la definición de un nuevo índice de error, el índice de distorsión temporal (TDI, por sus siglas en inglés Temporal Distortion lndex). La metodología propuesta se fundamenta en las técnicas de Dynomic Time Worping (DTW}, muy utilizadas en problemas de reconocimiento de voz y análisis de señales. Estas técnicas nos proporcionan la alineación óptima de dos series de tiempo mediante la aplicación de optimización dinámica a un problema de ruta mínima. El algoritmo que conlleva el cálculo de este índice realiza transformaciones no lineales en el eje temporal de la serie predicha para alinearla lo máximo posible a la serie medida. Siguiendo con la idea del carácter multidimensional de la evaluación de las predicciones, en esta tesis se presenta un error bidimensional formado por el error temporal u horizontal (TDI) y el error absoluto o vertical (MAE) alcanzado tras las modificaciones del eje temporal. El proceso para evaluar el TDI utiliza una fórmula recursiva que determina el tipo de modificaciones que se pueden realizar en el eje temporal. Por lo tanto, diferentes fórmulas recursivas implicarán diferentes distorsiones temporales. Así, tras la definición del error bidimensional, se desarrolla una familia de funciones recursivas con las que se consigue incluir el criterio de mínimo MAE en el proceso de búsqueda de la ruta mínima y análisis de la distorsión temporal. Esta familia se identifica con las siglas MOF por su significado en inglés: (M)AE (O)ptimization (F)amíly. Tras la definición de la familia MOF se presenta una extensión de la misma que permite, mediante la inclusión de un parámetro de penalización, el control de la cantidad de distorsión temporal aplicada a la serie inicial. La extensión paramétrica se denomina CTD-MOF por su significado en inglés: (C)ontrol (T)emparal (D)istortion (M)AE (O)ptimization (F)amily. Por último, la variación del parámetro en la familia CTD-MOF proporciona una curva de errores, trade-off, que caracterizará el comportamiento de las predicciones, ofreciendo, de esta forma, una nueva manera de comparar los modelos de predicción. A continuación, se cierra la metodología mediante la definición de un índice de error que condensa toda la información de las curvas de errores en un único valor. Se define el error absoluto medio dinámico {DMAE, por sus siglas en inglés Dynamic Mean Absalute Errar) que mejora considerablemente las herramientas disponibles hasta ahora para la evaluación de modelos de predicción. Por último el software desarrollado, se materializa en un paquete de R, que recoge las funciones necesarias para aplicar las propuestas de esta tesis doctoral y facilitar su diseminación.
  • PublicationOpen Access
    Cooperación horizontal en problemas de rutas de vehículos con retornos
    (2017) Belloso Ezcurra, Javier; Faulín Fajardo, Javier; Juan Pérez, Ángel Alejandro; Estadística e Investigación Operativa; Estatistika eta Ikerketa Operatiboa
    En el mundo competitivo y global en que se desarrollan las actividades de las empresas, las prácticas de cooperación entre entidades distintas suponen una gran oportunidad para aumentar la eficiencia en las operaciones. Cuando la cooperación se desarrolla entre participantes que actúan al mismo nivel dentro de la cadena de suministro es llamada cooperación horizontal y para garantizar su validez, debe ser analizada en términos de costes y eficiencia. El propósito principal de esta tesis es conseguir las herramientas necesarias para poder evaluar el impacto y los beneficios potenciales de la puesta en marcha de actividades de cooperación horizontal entre empresas del ámbito de la logística y el transporte cuando realizan labores de distribución y recogida dentro de sus cadenas de reparto y abastecimiento respectivamente. En primer lugar, se hace una revisión de la literatura de las prácticas reales de cooperación horizontal en actividades de logística y transporte. Partiendo de procesos de negocio, se realiza su modelado en forma de problemas de optimización combinatoria. En particular se estudia su relación con el conocido problema de las rutas de vehículos (Vehicle Routing Problem o VRP). En este problema, se considera la optimización de la distribución de materiales entre clientes y depósito central con la creación de modelos de optimización combinatoria. Como resultado de este análisis, se obtienen tres modelos para analizar. Las rutas de vehículos con retornos, las rutas de vehículos con recogidas y entregas, y la consideración de la flota heterogénea. A continuación, con los modelos seleccionados se hace una revisión de la literatura existente como paso anterior a la creación de metodologías que los solucionen. Los tres problemas tratados son considerados como NP-complejos, por tanto, se plantea el diseño de metaheurísticos que aborden estos problemas con las características más reales posibles. Se diseñan distintas metodologías para cada modelo basadas en la aleatoriedad sesgada para solucionar estos problemas de la forma más eficiente, simple y flexible posible. Finalmente, se contrastan los resultados obtenidos por la metodología propuesta, en comparación con las instancias utilizadas por otros algoritmos de la literatura que solucionan los mismos problemas. Se realizan experimentos exhaustivos y los resultados se comparan utilizando herramientas estadísticas. La conclusión es que la metodología propuesta consigue muy buenos resultados ya que mejora las mejores soluciones conocidas de 21 instancias reportadas en la literatura. En resumen, esta tesis doctoral muestra que se han conseguido resultados de alta calidad utilizando algoritmos sencillos basados en la aleatoriedad sesgada que están basados en heurísticos clásicos. Estos algoritmos obtienen resultados competitivos en coste y tiempo y, por tanto, se pueden utilizar para evaluar las economías de escala alcanzadas por las empresas en sus prácticas de cooperación horizontal.
  • PublicationOpen Access
    Hierarchical and spline-based models in space-time disease mapping
    (2017) Adin Urtasun, Aritz; Ugarte Martínez, María Dolores; Goicoa Mangado, Tomás; Estadística e Investigación Operativa; Estatistika eta Ikerketa Operatiboa
    La representación cartográfica de enfermedades (disease mapping) es un área de investigación de gran interés en epidemiología y salud pública. La gran variabilidad inherente a las medidas clásicas de estimación de riesgo como la razón de mortalidad estandarizada, hacen necesario el uso de técnicas estadísticas que estabilicen estas razones. Durante los últimos años se han desarrollado muchos modelos estadísticos para estudiar la distribución geográfica de una enfermedad y su evolución en el tiempo. Sin embargo, la disponibilidad de datos de alta calidad recogidos en muchas regiones y durante largos periodos de tiempo, así como la aparición de nuevos y cada vez más sofisticados modelos, han revelado nuevas dificultades que necesitan ser investigadas a fondo. En el Capítulo 1 se describen algunos modelos espacio-temporales de relevancia para el resto de capítulos abordados en la tesis y se detallan las restricciones necesarias para resolver los problemas de identificación de dichos modelos. El Capítulo 1 también describe la técnica inferencia! Bayesiana utilizada a lo largo de la tesis, basada en aproximaciones de Laplace e integración numérica (conocida como INLA), y su implementación en R. En el Capítulo 2 se han comparado cinco modelos espacio-temporales utilizados en disease mapping. Para poder comparar los diferentes términos de estos modelos, se ha calculado una descomposición del logaritmo de los riesgos estimados definiendo patrones espaciales, temporales y espacio-temporales a posteriori. Los resultados se ilustran con datos de mortalidad por cáncer de encéfalo en las provincias Españolas durante el periodo 1986-2010. Además, se ha realizado un estudio de simulación para comparar el rendimiento de los modelos en términos de sensitividad (habilidad para detectar regiones de alto riesgo verdaderas) y especificidad (habilidad para descartar regiones de alto riesgo falsas). Se concluye que cuando el número de casos esperados es muy pequeño (algo común cuando se analizan enfermedades raras o dominios muy pequeños como municipios), los modelos de P-splines se comportan mejor en términos de detección de áreas de alto riesgo. En el Capítulo 3 se propone una nueva familia de modelos espacio-temporales que incluyen efectos aleatorios para dos niveles espaciales, permitiendo modelizar efectos espaciales y espacio-temporales a diferentes niveles de agregación (como por ejemplo, municipios dentro de provincias o zonas de salud que se ven afectados por políticas de salud similares). Estos modelos han sido utilizados para analizar los datos de mortalidad en los municipios del País Vasco y Navarra durante el periodo 1986-2008. Se ha realizado un estudio de simulación en donde se concluye que si existen diferentes niveles de agregación espacial, los nuevos modelos a dos niveles se comportan mejor que modelos previos propuestos en la literatura. En el Capítulo 4 se presentan nuevos modelos de E-splines que incluyen correlaciones espaciales y temporales desde un enfoque completamente Bayesiano. Concretamente se describen modelos que incluyen B-spline temporales unidimensionales que pueden tener (o no) correlación espacial, así como modelos de B-spline espaciales bidimensionales que pueden tener (o no) correlación temporal. Los resultados se ilustran con datos de mortalidad por cáncer de mama en la España peninsular durante el periodo 1990-2010. Se observa que, en general, utilizar modelos con B-spline temporales distintos para cada área proporciona mejores resultados en términos de ajuste. Sin embargo, cuando el número de áreas aumenta, estos modelos pueden no ser factibles desde un punto de vista computacional. Por el contrario, los modelos de P-spline tridimensionales (previamente propuestos en la literatura y formulados en esta tesis desde un punto de vista completamente Bayesiano) son una alternativa prometedora, obteniendo estimaciones del riesgo precisas en tiempos computaciones mucho más cortos.
  • PublicationOpen Access
    Propuesta metodológica para la elaboración de modelos de simulación de la ocupación de las camas de una Unidad de Cuidados Intensivos
    (2015) Barado Hualde, Julio; Azcárate Camio, Cristina; Mallor Giménez, Fermín; Estadística e Investigación Operativa; Estatistika eta Ikerketa Operatiboa
    En esta investigación se presenta una metodología que ha resultado adecuada para la construcción de modelos válidos de simulación de la ocupación de las camas de una Unidad de Cuidados Intensivos. Esta metodología se ha basado en el desarrollo de un modelo de este tipo con los pacientes ingresados durante un periodo de nueve años en la Unidad de Cuidados Intensivos A del Complejo Hospitalario de Navarra. Los pilares de este desarrollo han sido: la cooperación entre un equipo multidisciplinar, con especialistas en Medicina Intensiva e Investigación Operativa, con el fin de que sean considerados tanto los aspectos clínicos como los técnicos; el seguimiento de pautas para la construcción de modelos ampliamente reconocidas; la exhaustiva revisión de la literatura para recoger lo ya hecho y ahondar en los aspectos no resueltos; la disposición de una exhaustiva y rigurosa base de datos que ha permitido el desarrollo del modelo y su validación; y la utilización de nuevas herramientas en el desarrollo de modelos, como la combinación de simulación con optimización. El modelo construido, muy laborioso desde el punto de vista técnico, se basa sin embargo en variables muy habituales desde el punto de vista clínico: fechas de ingreso y alta, escalas de gravedad, complicaciones infecciosas durante la estancia y desenlace final del paciente. Ello supone que la metodología que hemos seguido fácilmente será extrapolable a otras Unidades de Cuidados Intensivos que, con alta probabilidad, recogerán estos datos de sus pacientes y que también contarán con políticas de gestión de camas para las situaciones de ocupaciones extremas. Por ello, consideramos que la construcción y validación de nuestro modelo supone una propuesta metodológica para la realización de modelos destinados a la ocupación de las camas de las Unidades de Cuidados Intensivos, dando por satisfecho el objetivo principal de este trabajo.