Repository logo
  • Español
  • Euskera
  • English
  • Log In
    New user? Click here to register. Have you forgotten your password?
Repository logo
  • Communities & Collections
  • All of DSpace
  • Español
  • Euskera
  • English
  • Log In
    New user? Click here to register. Have you forgotten your password?
  1. Home
  2. Browse by Author

Browsing by Author "Paternain Dallo, Daniel"

Now showing 1 - 20 of 59
Results Per Page
Sort Options
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Additional feature layers from ordered aggregations for deep neural networks
    (IEEE, 2020) Domínguez Catena, Iris; Paternain Dallo, Daniel; Galar Idoate, Mikel; Institute of Smart Cities - ISC; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa
    In the last years we have seen huge advancements in the area of Machine Learning, specially with the use of Deep Neural Networks. One of the most relevant examples is in image classification, where convolutional neural networks have shown to be a vital tool, hard to replace with any other techniques. Although aggregation functions, such as OWA operators, have been previously used on top of neural networks, usually to aggregate the outputs of different networks or systems (ensembles), in this paper we propose and explore a new way of using OWA aggregations in deep learning. We implement OWA aggregations as a new layer inside a convolutional neural network. These layers are used to learn additional order-based information from the feature maps of a certain layer, and then the newly generated information is used as a complement input for the following layers. We carry out several tests introducing the new layer in a VGG13-based reference network and show that this layer introduces new knowledge into the network without substantially increasing training times.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Aggregation functions to combine RGB color channels in stereo matching
    (Optical Society of America, 2013) Galar Idoate, Mikel; Jurío Munárriz, Aránzazu; López Molina, Carlos; Sanz Delgado, José Antonio; Paternain Dallo, Daniel; Bustince Sola, Humberto; Automática y Computación; Automatika eta Konputazioa; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa
    In this paper we present a comparison study between different aggregation functions for the combination of RGB color channels in stereo matching problem. We introduce color information from images to the stereo matching algorithm by aggregating the similarities of the RGB channels which are calculated independently. We compare the accuracy of different stereo matching algorithms and aggregation functions. We show experimentally that the best function depends on the stereo matching algorithm considered, but the dual of the geometric mean excels as the most robust aggregation.
  • No Thumbnail Available
    PublicationEmbargo
    Análisis, diseño e implemetación de un set-up de captura masiva de imágenes para el entrenamiento de modelos de Deep learning.
    (2021) Hulsman Bordonaba, Iñaki; Galar Idoate, Mikel; Paternain Dallo, Daniel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    Este trabajo está enmarcado dentro del proyecto "Emotional Films" de la Universidad Pública de Navarra. Emotional Films pretende conseguir mediante Deep Learning el desarrollo de un detector de emociones con el que poder identificar la emoción emitida por un espectador ante una película, y en base a esa emoción modificar en tiempo real ciertos elementos del metraje. De esta forma la película se adapta siempre a los gustos de la persona. En este trabajo, se refleja toda la parte de análisis, diseño e implementación del set-up multicámara para la captura de imágenes , las que servirán de entrenamiento para el modelo de detección de emociones. Entre otras cosas, incluye: un estudio de la literatura sobre otros set-ups de captura de imágenes semejantes al que se pretende implementar, un diseño inicial de la estructura y distribución de cámaras, preparación de distintos entornos de iluminación automatizados, diseño e implementación de la aplicación de ordenador principal para la captura de imágenes, estudio y programación de una cámara con detección de profundidad y sus librerías correspondientes y otros primeros pasos referentes a la fase inicial del proyecto.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Application of two different methods for extending lattice-valued restricted equivalence functions used for constructing similarity measures on L-fuzzy sets
    (Elsevier, 2018) Palmeira, Eduardo S.; Bedregal, Benjamin; Bustince Sola, Humberto; Paternain Dallo, Daniel; Miguel Turullols, Laura de; Automatika eta Konputazioa; Institute of Smart Cities - ISC; Automática y Computación; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa
    Based on previous investigations, we have proposed two different methods to extend lattice-valued fuzzy connectives (t-norms, t-conorms, negations and implications) and other related operators, considering a generalized notion of sublattices. Taking into account the results obtained and seeking to analyze the behavior of both extension methods in face of fuzzy operators related to image processing, we have applied these methods so as to extend restricted equivalence functions, restricted dissimilarity functions and Ee,N-normal functions. We also generalize the concepts of similarity measure, distance measure and entropy measure for L-fuzzy sets constructing them via restricted equivalence functions, restricted dissimilarity functions and Ee,N-normal functions
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Aprendizaje profundo aplicado a la generación y transcripción de música
    (2020) Escatín Marcotegui, Ibon; Paternain Dallo, Daniel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    La música es un lenguaje que permite la comunicación de sensaciones y sentimientos de forma no verbal. Como lenguaje, está formada por un conjunto de reglas que permiten construir música que evoque una sensación u otra y si no se aplican correctamente, el resultado puede ser un conjunto de sonidos sin sentido. Este trabajo trata de buscar y comparar las distintas formas en las que se puede representar la música y cuales de ellas son las mas adecuadas para la generación de música. Además se mencionan algunas otras representaciones que a pesar de no dar muy buenos resultados para esta tarea, son útiles para otras tareas como la transcripción de música.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Capas basadas en operadores OWA para Redes Neuronales Convolucionales
    (2020) Domínguez Catena, Iris; Galar Idoate, Mikel; Paternain Dallo, Daniel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    En este trabajo exploramos una nueva forma de ampliar la capacidad de las Redes Neuronales Convolucionales. En concreto, planteamos una nueva t´ecnica para generar informaci´on adicional a partir de la salida de un bloque convolucional de una Red Neuronal Convolucional, empleando para ello operadores OWA a nivel de canal, y usando esta nueva informaci´on para ampliar la entrada de las siguientes capas de la red. Realizamos diversas pruebas con esta nueva t´ecnica, comprobando como afectan diferentes par´ametros a los resultados, incluyendo el punto de inserci´on de la nueva informaci´on, la cantidad de operadores OWA aplicados, o el tipo de m´etrica empleada para ordenar los canales de informaci´on original.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    A comparative study of CO2 forecasting strategies in school classrooms: a step toward improving indoor air quality
    (MDPI, 2025-03-09) Garcia-Pinilla, Peio; Jurío Munárriz, Aránzazu; Paternain Dallo, Daniel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute of Smart Cities - ISC; Gobierno de Navarra / Nafarroako Gobernua
    This paper comprehensively investigates the performance of various strategies for predicting CO2 levels in school classrooms over different time horizons by using data collected through IoT devices. We gathered Indoor Air Quality (IAQ) data from fifteen schools in Navarra, Spain between 10 January and 3 April 2022, with measurements taken at 10-min intervals. Three prediction strategies divided into seven models were trained on the data and compared using statistical tests. The study confirms that simple methodologies are effective for short-term predictions, while Machine Learning (ML)-based models perform better over longer prediction horizons. Furthermore, this study demonstrates the feasibility of using low-cost devices combined with ML models for forecasting, which can help to improve IAQ in sensitive environments such as schools.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    d-Choquet integrals: Choquet integrals based on dissimilarities
    (Elsevier, 2020) Bustince Sola, Humberto; Mesiar, Radko; Fernández Fernández, Francisco Javier; Galar Idoate, Mikel; Paternain Dallo, Daniel; Altalhi, A. H.; Pereira Dimuro, Graçaliz; Bedregal, Benjamin; Takáč, Zdenko; Estatistika, Informatika eta Matematika; Institute of Smart Cities - ISC; Estadística, Informática y Matemáticas; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA13
    The paper introduces a new class of functions from [0,1]n to [0,n] called d-Choquet integrals. These functions are a generalization of the 'standard' Choquet integral obtained by replacing the difference in the definition of the usual Choquet integral by a dissimilarity function. In particular, the class of all d-Choquet integrals encompasses the class of all 'standard' Choquet integrals but the use of dissimilarities provides higher flexibility and generality. We show that some d-Choquet integrals are aggregation/pre-aggregation/averaging/functions and some of them are not. The conditions under which this happens are stated and other properties of the d-Choquet integrals are studied.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Demographic bias in machine learning: measuring transference from dataset bias to model predictions
    (2024) Domínguez Catena, Iris; Galar Idoate, Mikel; Paternain Dallo, Daniel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika
    As artificial intelligence (AI) systems increasingly influence critical decisions in society, ensuring fairness and avoiding bias have become pressing challenges. This dissertation investigates demographic bias in machine learning, with a particular focus on measuring how bias transfers from datasets to model predictions. Using Facial Expression Recognition (FER) as a primary case study, we develop novel metrics and methodologies to quantify and analyze bias at both the dataset and model levels. The thesis makes several key contributions to the field of algorithmic fairness. We propose a comprehensive taxonomy of types of dataset bias and metrics available for each type. Through extensive evaluation on FER datasets, we demonstrate the effectiveness and limitations of these metrics in capturing different aspects of demographic bias. Additionally, we introduce DSAP (Demographic Similarity from Auxiliary Profiles), a novel method for comparing datasets based on their demographic properties. DSAP enables interpretable bias measurement and analysis of demographic shifts between datasets, providing valuable insights for dataset curation and model development. Our research includes in-depth experiments examining the propagation of representational and stereotypical biases from datasets to FER models. Our findings reveal that while representational bias tends to be mitigated during model training, stereotypical bias is more likely to persist in model predictions. Furthermore, we present a framework for measuring bias transference from datasets to models across various bias induction scenarios. This analysis uncovers complex relationships between dataset bias and resulting model bias, highlighting the need for nuanced approaches to bias mitigation. Throughout the dissertation, we emphasize the importance of considering both representational and stereotypical biases in AI systems. Our work demonstrates that these biases can manifest and propagate differently, necessitating tailored strategies for detection and mitigation. By providing robust methodologies for quantifying and analyzing demographic bias, this research contributes to the broader goal of developing fairer and more equitable AI systems. The insights and tools presented here have implications beyond FER, offering valuable approaches for addressing bias in various machine learning applications. This dissertation paves the way for future work in algorithmic fairness, emphasizing the need for continued research into bias measurement, mitigation strategies, and the development of more inclusive AI technologies.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Desarrollo de un modelo de predicción de parámetros clínicos pulmonares mediante sensores de temperatura y humedad usando técnicas de inteligencia artificial
    (2021) Hernández Jaso, Ignacio; Paternain Dallo, Daniel; Galar Idoate, Mikel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    En esta memoria se describe el desarrollo de un modelo de predicción de parámetros clínicos pulmonares mediante la utilización de sensores de temperatura y humedad como alternativa a la espirometría convencional. La toma de datos es realizada durante la respiración en reposo de un sujeto, creando las que denominamos señales espirográficas. La implementación abarcará el preprocesado de los datos para una posterior extracción de características y la construcción, el entrenamiento y la evaluación de modelos de aprendizaje con técnicas de Inteligencia Artificial.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Detección automática de personas mediante Histograma de Gradientes Orientados
    (2017) Catalán Vitas, Daniel; Paternain Dallo, Daniel; Escuela Técnica Superior de Ingenieros Industriales y de Telecomunicación; Telekomunikazio eta Industria Ingeniarien Goi Mailako Eskola Teknikoa
    Los ordenadores se han convertido en algo indispensable en nuestro día a día. Son muy útiles en gran cantidad de áreas de trabajo e investigación porque pueden realizar tareas específicas complejas con mayor precisión y eficiencia que cualquier humano. Sin embargo, todavía no son capaces de realizar eficientemente algunas tareas que requieren de un mayor nivel de inteligencia, como puede ser el reconocimiento vocal, el razonamiento e interpretación lógica, o el análisis visual que los humanos realizamos de forma subconsciente y natural muchas veces a lo largo del día
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Detección automática de pólipos basada en el Histograma de Gradientes Orientados
    (2017) Burgo Ullate, Iván del; Paternain Dallo, Daniel; Jurío Munárriz, Aránzazu; Escuela Técnica Superior de Ingenieros Industriales y de Telecomunicación; Telekomunikazio eta Industria Ingeniarien Goi Mailako Eskola Teknikoa
    La detección automática de pólipos consiste en localizar de la manera más exacta posible la localización de un pólipo en una imagen colorrectal. De esta forma, se pretende servir de ayuda a los profesionales médicos que realizan el diagnóstico de manera visual. En este proyecto se pretende investigar la detección de pólipos mediante la combinación de técnicas de visión artificial y técnicas inteligentes. Se pretende estudiar la técnica de extracción de características sobre imágenes colorrectales, en este caso, el histograma de gradientes orientados. Estas técnicas nos permiten extraer características de los pixeles que nos ayudan en la tarea de clasificar un pixel como perteneciente al pólipo o no. Para la clasificación podríamos utilizar técnicas relacionados con la Minería de Datos, utilizando algún clasificador como pueden ser la SVM (Máquinas de soporte Vectorial) o las redes neuronales
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Discrete IV dG-Choquet integrals with respect to admissible orders
    (Elsevier, 2021) Takáč, Zdenko; Uriz Martín, Mikel Xabier; Galar Idoate, Mikel; Paternain Dallo, Daniel; Bustince Sola, Humberto; Estatistika, Informatika eta Matematika; Ingeniaritza Elektrikoa, Elektronikoaren eta Telekomunikazio Ingeniaritzaren; Institute of Smart Cities - ISC; Estadística, Informática y Matemáticas; Ingeniería Eléctrica, Electrónica y de Comunicación; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa
    In this work, we introduce the notion of dG-Choquet integral, which generalizes the discrete Choquet integral replacing, in the first place, the difference between inputs represented by closed subintervals of the unit interval [0,1] by a dissimilarity function; and we also replace the sum by more general appropriate functions. We show that particular cases of dG-Choquet integral are both the discrete Choquet integral and the d-Choquet integral. We define interval-valued fuzzy measures and we show how they can be used with dG-Choquet integrals to define an interval-valued discrete Choquet integral which is monotone with respect to admissible orders. We finally study the validity of this interval-valued Choquet integral by means of an illustrative example in a classification problem. © 2021
  • No Thumbnail Available
    PublicationEmbargo
    Diseño e implementación de una aplicación móvil multiplataforma para la recogida masiva de datos e imágenes, destinadas al entrenamiento de un modelo de deep learning en el proyecto EmotionalFilms.
    (2021) Sola Expósito, Álvaro; Paternain Dallo, Daniel; Galar Idoate, Mikel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    Este TFG se enmarca en el proyecto EmotionalFilms. El objetivo principal de este TFG es diseñar e implementar una aplicación móvil, funcional en dispositivos con sistema operativo Android e iOS. La aplicación se encargará de recoger datos personales del usuario mediante un formulario. Los rasgos físicos del usuario se recogerán mediante la creación de un avatar virtual. Finalmente, se recogerán las emociones expresadas por un usuario al mostrarle una serie de vídeos. La aplicación va a ser el origen de la mayoría de los datos, y es necesario que se desarrolle de manera correcta, para evitar datos inservibles dentro de la base de datos final. Esta base de datos se usará principalmente para generar un modelo de Deep learning que detecte emociones, aunque también se prevén otros usos en otras áreas como: estudios en sociología y eye tracking.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Diseño y captura de una base de datos para el reconocimiento de emociones minimizando sesgos
    (CAEPIA, 2024) Jurío Munárriz, Aránzazu; Pascual Casas, Rubén; Domínguez Catena, Iris; Paternain Dallo, Daniel; Galar Idoate, Mikel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute of Smart Cities - ISC; Universidad Pública de Navarra / Nafarroako Unibertistate Publikoa; Gobierno de Navarra / Nafarroako Gobernua
    El reconocimiento de emociones a partir de expresiones faciales (FER) es un campo de investigación importante para la interacción persona-máquina. Sin embargo, los conjuntos de datos utilizados para entrenar modelos FER a menudo contienen sesgos demográficos que pueden conducir a la discriminación en el modelo final. En este trabajo, presentamos el diseño y la captura realizados para la creación de una nueva base de datos para FER, donde tratamos de minimizar los sesgos desde el propio diseño. La base de datos se ha creado utilizando diferentes métodos de captura. Para comprobar la reducción de los sesgos alcanzada, analizamos diferentes métricas de sesgo representacional y estereotípico sobre la base de datos generada y la comparamos frente a otras bases de datos estándar en la literatura de FER.
  • No Thumbnail Available
    PublicationEmbargo
    Diseño, implementación y despliegue de una base de datos para la generación de modelos de Deep Learning: análisis de sentimientos vía imagen y seguimiento de la mirada (eye tracking)
    (2021) Donamaría Solchaga, Álvaro; Paternain Dallo, Daniel; Galar Idoate, Mikel; Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación; Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa
    Desarrollo y puesta en funcionamiento del sistema de almacenamiento de información en la parte de Inteligencia artificial dentro del proyecto Emotional Films. La realización de esta parte del proyecto la hemos llevado a cabo en dos secciones: 1. Análisis de requisitos y objetivos del proyecto de cara a diseñar el modelo de Bases de Datos óptimo que nos permita cumplirlos. 2. Implementación del sistema diseñado, así como el despliegue de este en servidores que permitan ofrecer el acceso adecuado a los datos. Una vez desplegado, realización de pruebas de estrés y de escalabilidad sobre el modelo, de cara a minimizar los posibles fallos resultantes de la entrada en funcionamiento del sistema de gestión de almacenamiento de la información. Todo esto sin descartar la posibilidad de tener que realizar cambios en el modelo y en su implementación debido a la redefinición de requisitos o cambios en las decisiones del proyecto.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Dissimilarity based choquet integrals
    (Springer, 2020) Bustince Sola, Humberto; Mesiar, Radko; Fernández Fernández, Francisco Javier; Galar Idoate, Mikel; Paternain Dallo, Daniel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika
    In this paper, in order to generalize the Choquet integral, we replace the difference between inputs in its definition by a restricted dissimilarity function and refer to the obtained function as d-Choquet integral. For some particular restricted dissimilarity function the corresponding d-Choquet integral with respect to a fuzzy measure is just the ‘standard’ Choquet integral with respect to the same fuzzy measure. Hence, the class of all d-Choquet integrals encompasses the class of all 'standard' Choquet integrals. This approach allows us to construct a wide class of new functions, d-Choquet integrals, that are possibly, unlike the 'standard' Choquet integral, outside of the scope of aggregation functions since the monotonicity is, for some restricted dissimilarity function, violated and also the range of such functions can be wider than [0, 1], in particular it can be [0, n].
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    DSAP: analyzing bias through demographic comparison of datasets
    (Elsevier, 2024-10-29) Domínguez Catena, Iris; Paternain Dallo, Daniel; Galar Idoate, Mikel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Universidad Publica de Navarra / Nafarroako Unibertsitate Publikoa ; Gobierno de Navarra / Nafarroako Gobernua
    In the last few years, Artificial Intelligence (AI) systems have become increasingly widespread. Unfortunately, these systems can share many biases with human decision-making, including demographic biases. Often, these biases can be traced back to the data used for training, where large uncurated datasets have become the norm. Despite our awareness of these biases, we still lack general tools to detect, quantify, and compare them across different datasets. In this work, we propose DSAP (Demographic Similarity from Auxiliary Profiles), a two-step methodology for comparing the demographic composition of datasets. First, DSAP uses existing demographic estimation models to extract a dataset's demographic profile. Second, it applies a similarity metric to compare the demographic profiles of different datasets. While these individual components are well-known, their joint use for demographic dataset comparison is novel and has not been previously addressed in the literature. This approach allows three key applications: the identification of demographic blind spots and bias issues across datasets, the measurement of demographic bias, and the assessment of demographic shifts over time. DSAP can be used on datasets with or without explicit demographic information, provided that demographic information can be derived from the samples using auxiliary models, such as those for image or voice datasets. To show the usefulness of the proposed methodology, we consider the Facial Expression Recognition task, where demographic bias has previously been found. The three applications are studied over a set of twenty datasets with varying properties. The code is available at https://github.com/irisdominguez/DSAP.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    An empirical study on supervised and unsupervised fuzzy measure construction methods in highly imbalanced classification
    (IEEE, 2020) Uriz Martín, Mikel Xabier; Paternain Dallo, Daniel; Bustince Sola, Humberto; Galar Idoate, Mikel; Estatistika, Informatika eta Matematika; Institute of Smart Cities - ISC; Estadística, Informática y Matemáticas; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa
    The design of an ensemble of classifiers involves the definition of an aggregation mechanism that produces a single response obtained from the information provided by the classifiers. A specific aggregation methodology that has been studied in the literature is the use of fuzzy integrals, such as the Choquet or the Sugeno integral, where the associated fuzzy measure tries to represent the interaction existing between the classifiers of the ensemble. However, defining the big number of coefficients of a fuzzy measure is not a trivial task and therefore, many different algorithms have been proposed. These can be split into supervised and unsupervised, each class having different learning mechanisms and particularities. Since there is no clear knowledge about the correct method to be used, in this work we propose an experimental study for comparing the performance of eight different learning algorithms under the same framework of imbalanced dataset. Moreover, we also compare the specific fuzzy integral (Choquet or Sugeno) and their synergies with the different fuzzy measure construction methods.
  • Loading...
    Thumbnail Image
    PublicationOpen Access
    Enhancing DreamBooth with LoRA for generating unlimited characters with stable diffusion
    (IEEE, 2024-09-09) Pascual Casas, Rubén; Maiza Coupin, Adrián Mikel; Sesma Sara, Mikel; Paternain Dallo, Daniel; Galar Idoate, Mikel; Estadística, Informática y Matemáticas; Estatistika, Informatika eta Matematika; Institute of Smart Cities - ISC; Universidad Pública de Navarra / Nafarroako Unibertsitate Publikoa, PJUPNA2023-11377
    This paper addresses the challenge of generating unlimited new and distinct characters that encompass the style and shared visual characteristics of a limited set of human designed characters. This is a relevant problem in the audiovisual industry, as the ability to rapidly produce original characters that adhere to specific characteristics greatly increases the possibilities in the production of movies, series, or video games. Our solution is built upon DreamBooth, a widely extended fine-tuning method for text-to-image models. We propose an adaptation focusing on two main challenges: the impracticality of relying on detailed image prompts for character description and the few-shot learning scenario with a limited set of characters available for training. To solve these issues, we introduce additional character-specific tokens to DreamBooth training and remove its class-specific regularization dataset. For an unlimited generation of characters, we propose the usage of random tokens and random embeddings. This proposal is tested on two specialized datasets and the results shows our method¿s capability to produce diverse characters that adhere to a style and visual characteristics. An ablation study to analyze the contributions of the proposed modifications is also developed.
  • «
  • 1 (current)
  • 2
  • 3
  • »
Con la colaboración del Ministerio de Ciencia e Innovación y de la Fundación Española para la Ciencia y la Tecnología (FECYT).

© Universidad Pública de Navarra - Nafarroako Unibertsitate Publikoa

  • Aviso legal
  • Protección de datos
  • Contacto
  • Sugerencias
  • Powered by DSpace