Integración de modelos de Inteligencia Artificial para análisis de imágenes para un sistema de automatización de procesos en fábrica

Consultable a partir de

2030-07-01

Date

2025

Authors

Pérez Leoz, Maialen

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Grado / Gradu Amaierako Lana

Project identifier

Abstract

Este Trabajo de Fin de Grado explora la viabilidad de un sistema de autoidentificación basado en análisis de imágenes mediante modelos de inteligencia artificial generativa, como alternativa a la tecnología RFID empleada actualmente en entornos industriales. El proyecto se desarrolla en el contexto de la empresa BSH Electrodomésticos, y se integra dentro de su plataforma AutoID, basada en una arquitectura de microservicios. La solución propuesta consiste en una aplicación web móvil para dispositivos handheld ya disponibles en planta, desde la cual se capturan imágenes que son enviadas a un entorno de Google Cloud. Allí, distintos modelos multimodales como GPT-4o y Gemini procesan las imágenes y extraen información relevante de las etiquetas, así como el estado visual del palet. Los resultados se visualizan mediante un monitor desarrollado específicamente para comparar la precisión, eficiencia y tiempos de respuesta de los modelos evaluados. El trabajo analiza además las limitaciones técnicas del hardware utilizado y la capacidad de generalización de los modelos de IA empleados. Finalmente, se presenta una comparativa con el sistema RFID tradicional, evaluando aspectos como coste, precisión y escalabilidad. Los resultados permiten concluir que, si bien existen desafíos, los modelos de IA generativa ofrecen un enfoque prometedor para tareas de identificación y control logístico en entornos industriales automatizados.


This Final Degree Project explores the feasibility of a self-identification system based on image analysis using generative artificial intelligence models as an alternative to the RFID technology currently employed in industrial environments. The project is developed within the context of BSH Home Appliances and is integrated into its AutoID platform, which is built on a microservices architecture. The proposed solution consists of a mobile web application for handheld devices already available in the factories. From these devices, images are captured and sent to a Google Cloud environment, where various multimodal models such as GPT-4o and Gemini process the images, extracting relevant information from the labels and assessing the visual condition of the pallet. The results are displayed through a custom monitoring interface developed to compare the accuracy, efficiency, and response times of the evaluated models. The project also analyzes the technical limitations of the hardware used and the generalization capabilities of the AI models. Finally, a comparison with the traditional RFID system is presented, evaluating aspects such as cost, accuracy, and scalability. The findings lead to the conclusion that, while challenges remain, generative AI models offer a promising approach for identification and logistics control tasks in automated industrial settings.

Description

Keywords

Industria 4.0, Inteligencia Artificial (IA), GPT-4o, Gemini, Modelos multimodales, Análisis de imágenes, Microservicios, RFID, Google Cloud, Cloud Run, Tecnologías de auto identificación (AutoID)

Department

Faculty/School

Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación / Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa

Degree

Graduado o Graduada en Ingeniería en Tecnologías de Telecomunicación por la Universidad Pública de Navarra, Telekomunikazio Teknologien Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan

Doctorate program

item.page.cita

item.page.rights

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.