Date
Authors
Publisher
Project identifier
item.page.impacto
Abstract
Durante los últimos años se ha generalizado el uso de una gran variedad de técnicas de aprendizaje automático para extraer conocimiento de la multitud de datos disponibles en diversos sectores. Estas aplicaciones van desde la medicina, hasta las finanzas, pasando por las recomendaciones de productos, entre otras. Sin embargo, por diversos motivos, ya sean legislativos, éticos o incluso técnicos, no siempre es posible disponer de todos los datos en un único punto para poder aplicar estos algoritmos. Para atajar este problema surge el denominado aprendizaje federado. Esta técnica tiene como objetivo el poder crear un modelo a partir de la información de los agentes participantes, sin que estos tengan que enviar sus propios datos. La forma de generar este modelo es mediante el entrenamiento de modelos locales en cada uno de los agentes y la transmisión de, únicamente, los parámetros de estos modelos. Otro de los problemas que tienen que tratar las diversas técnicas de aprendizaje automático es el tratamiento de la incertidumbre. Entendemos por incertidumbre la (des)confianza que poseemos en torno a la validez de los datos. Esta puede ser debida a desviaciones de los datos de la información real, errores de medición, etc. Una de las propuestas para tratar esta situación es el empleo de la teoría de conjuntos difusos. En esta tesis proponemos algoritmos de aprendizaje federado que gestionan la incertidumbre desde la perspectiva de la teoría de conjuntos difusos. En concreto, proponemos dos algoritmos, uno de ellos supervisado y el otro no supervisado. El algoritmo supervisado se basa en la lógica difusa mediante el uso de reglas si-entonces, mientras que el no supervisado consiste en la utilización de algoritmos de agrupamiento difusos en flujos de datos.
Azken urteotan, ikasketa automatiko teknika ugari erabili dira hainbat sektoretan dauden datu ugarietatik ezagutza ateratzeko. Aplikazio horiek medikuntzatik, finantzaketatik eta produktuen gomendioetatik datoz, besteak beste. Hala ere, hainbat arrazoirengatik, legegileak, etikoak edo teknikoak izan, ezin dira beti datu guztiak puntu bakar batean eduki algoritmo horiek aplikatzeko. Arazo horri aurre egiteko, ikasketa federatua izeneko teknika sortu da. Teknika honen helburua da eredu bat sortzea parte hartzen duten agenteen informaziotik abiatuta, haiek beren datuak bidali beharrik gabe. Eredu hori sortzeko, agente bakoitzean eredu lokalak entrenatu behar dira, eta eredu horien parametroak bakarrik transmititu. Ikasketa automatikoko teknikek aurre egin behar dioten beste arazo bat ziurgabetasunaren kudeaketa da. Ziurgabetasuna datuen baliozkotasunean dugun konfiantza (eza) da. Hau informazio errealeko datuen desbideratzeek, neurketa-erroreek eta abarrek eragin dezakete. Egoera honi aurre egiteko proposamenetako bat multzo lausoaren teoria erabiltzea da. Tesi honetan, ikaskuntza federatuko algoritmoak proposatzen ditugu zeinek ziurgabetasuna multzo lausoen teoriaren ikuspegitik kudeatzen duten. Zehazki, bi algoritmo proposatzen ditugu, bata gainbegiratua eta bestea gainbegiratu gabea. Gainbegiratutako algoritmoa logika lausoan oinarritzen da baldin eta-orduan erreglak erabiliz, eta gainbegiratu gabeko algoritmoak datu-fluxuen kasurako taldekatze lausoak erabiltzen ditu.
Over the last few years, a wide variety of machine learning techniques have been widely used to extract knowledge from the large amount of data available in various sectors. These applications range from medicine, to finance, to product recommendations, among others. However, for a variety of reasons, be they legislative, ethical or even technical, it is not always possible to have all the data available at a single point in order to apply these algorithms. In order to address this problem, an approach known as federated learning has emerged. The aim of this technique is to be able to create a model from the information of the participating agents, without them having to send their own data. The way to generate this model is by training local models in each of the agents and transmitting only the parameters of these models. Another problem that the various machine learning techniques have to deal with is the management of uncertainty. Uncertainty is understood as the (mis) trust we have in the validity of the data. This can be due to deviations of the data from the real information, measurement errors, etc. One of the proposals to address this situation is the use of fuzzy set theory. In this dissertation, we propose federated learning algorithms that manage uncertainty from the perspective of fuzzy set theory. Specifically, we propose two algorithms, one of them supervised and the other unsupervised. The supervised algorithm is based on fuzzy logic through the use of if-then rules, while the unsupervised one is based on the use of fuzzy clustering algorithms to data streams.
Description
Keywords
Department
Faculty/School
Degree
Doctorate program
Industria Zientzietako eta Teknologietako Doktoretza Programa (ED 99/2011)
item.page.cita
item.page.rights
Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.