Show simple item record

dc.creatorGorostizu Albeniz, Iones_ES
dc.date.accessioned2015-03-24T07:32:45Z
dc.date.available2019-07-01T23:00:10Z
dc.date.issued2014
dc.identifier.urihttps://hdl.handle.net/2454/16765
dc.description.abstractLas aplicaciones de manipulación de datos realizan tareas sobre datos extraídos de muy diferentes fuentes, cada una de ellas con sus propias particularidades como, por ejemplo: errores tipográficos, diferentes cantidades de información o atributos distintos. La necesidad de trabajar con estos datos tan heterogéneos suele provocar el problema de tener que identificar distintas filas como el mismo objeto en la vida real, ya que cada origen de datos representa ese objeto de forma distinta. “Record Linkage” (o “Duplicate Detection”) es el término referido a la tarea de encontrar filas que representan una misma entidad entre distintas fuentes, normalmente usando las denominadas “String Similarity Metrics”. Una “String Metric” es una medida que establece la similitud o disimilitud entre dos cadenas de texto o “strings’. Algunas de las “String Metrics” más conocidas son: la distancia de Hamming, la distancia de Levenshtein, la distancia de Jaro-Winkler y la similitud de Jaccard. En este proyecto, se estudian los algoritmos de detección de duplicados más comunes, probando concretamente la solución propuesta por Microsoftes_ES
dc.format.mimetypeapplication/pdfen
dc.language.isospaen
dc.subjectDuplicación de datoses_ES
dc.subjectRecord Linkagees_ES
dc.subjectString Metrices_ES
dc.titleEstudio sobre la detección de duplicados en orígenes de datos heterogéneoses_ES
dc.typeTrabajo Fin de Grado/Gradu Amaierako Lanaes
dc.typeinfo:eu-repo/semantics/bachelorThesisen
dc.date.updated2014-08-13T06:24:02Z
dc.contributor.affiliationEscuela Técnica Superior de Ingenieros Industriales y de Telecomunicaciónes_ES
dc.contributor.affiliationTelekomunikazio eta Industria Ingeniarien Goi Mailako Eskola Teknikoaeu
dc.description.degreeGraduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarraes_ES
dc.description.degreeInformatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoaneu
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessen
dc.rights.accessRightsAcceso abierto / Sarbide irekiaes
dc.embargo.terms2019-07-01es_ES
dc.contributor.advisorTFEGonzález de Mendívil Moreno, José Ramónes_ES


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record