Generación ilimitada de personajes mediante Stable Diffusion con DreamBooth y LoRA

Date

2024

Director

Publisher

CAEPIA
Acceso abierto / Sarbide irekia
Contribución a congreso / Biltzarrerako ekarpena
Versión publicada / Argitaratu den bertsioa

Project identifier

AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2022-136627NB-I00/ES/ recolecta
Gobierno de Navarra//0011-1365-2022-000130

Abstract

Este artículo aborda el reto de generar un número ilimitado de personajes nuevos, y distintos, que engloben el estilo y las características visuales compartidas de un conjunto limitado de personajes diseñados por un humano. Este es un problema de gran relevancia en la industria audiovisual, ya que la capacidad de producir rápidamente personajes originales que se adhieran a unas características específicas aumenta enormemente las posibilidades en la producción de películas, series o videojuegos. Nuestra solución se basa en DreamBooth, un método de ajuste de modelos generativos de texto a imagen ampliamente extendido. Proponemos una adaptación centrada en dos retos principales: lo poco práctico que resulta utilizar prompts detallados de las imágenes para describir los personajes y la complejidad del ajuste de modelos a partir de un conjunto limitado de personajes. Para resolver estos problemas, introducimos en el entrenamiento de DreamBooth tokens adicionales específicos para cada personaje y eliminamos el conjunto de datos de regularización. Para generar personajes de manera ilimitada, proponemos el uso de tokens y embeddings aleatorios. Comprobamos la utilidad de la propuesta utilizando dos conjuntos de datos diferentes. Los resultados obtenidos muestran la capacidad de nuestro método para producir personajes diversos que se adhieren a un estilo y a unas características visuales concretas. Finalmente, desarrollamos un estudio de ablación.

Description

Keywords

Difussion models, Character generation, Few-shot learning, Parameter-efficient fine-tuning, DreamBooth

Department

Estadística, Informática y Matemáticas / Estatistika, Informatika eta Matematika / Institute of Smart Cities - ISC

Faculty/School

Degree

Doctorate program

item.page.cita

Pascual, R., Maiza, A., Sesma-Sara, M., Paternain, D., Galar, M. (2024). Generación ilimitada de personajes mediante Stable Diffusion con DreamBooth y LoRA. En Alonso, A., Guijarro, B., Fontenla, O., Sánchez, N., Pérez, B., Camacho, D., Rabuñal, J. R., Ojeda-Aciego, M., Medina, J., Riquelme, J., Troncoso, A., Onaindia, E., Bugarín, A., Gámez, J. A., Del Jesús Díaz, M. J., Martínez, L., Bellas, F., Guerreiro, S., Rodríguez, A., Benítez, J. A., Marcos M. M. (Eds.), XX Conferencia de la Asociación Española para la Inteligencia Artificial (pp. 29-34). CAEPIA.

item.page.rights

© Los autores, 2024

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.