Evaluación de procesos de reconocimiento óptico de caracteres y detección de tablas para la clasificación automática de documentos y su integración en un gestor documental
Date
Authors
Director
Publisher
Project identifier
Abstract
En este trabajo de fin de grado pretendemos desarrollar un algoritmo de detección de tablas en imágenes de documentos, complementando las funcionalidades de una librería de código abierto de reconocimiento de texto en imágenes, con el fin de realizar una clasificación automática de los documentos. Para facilitar las tareas de detección de tablas y reconocimiento de texto aplicaremos una fase previa de preprocesamiento de imágenes. El algoritmo desarrollado será aplicado a documentos escaneados para obtener características (palabras, número de páginas, número de tablas y estructura de las mismas…) que permitan crear un modelo de clasificación de documentos no estructurados mediante redes neuronales. La red neuronal se entrenará con documentos previamente etiquetados y permitirá la predicción de nuevos documentos en el momento de la digitalización de estos. El algoritmo desarrollado completo de preprocesamiento, detección de tablas y de texto y clasificación de imágenes escaneadas se integrará en una plataforma de gestión documental.
Description
Keywords
Department
Faculty/School
Degree
Doctorate program
item.page.cita
item.page.rights
Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.