Desarrollo de una aplicación Big Data sobre AWS para la monitorización de tweets sobre el COVID-19

View/ Open
Date
2021Author
Advisor
Version
Acceso abierto / Sarbide irekia
Type
Trabajo Fin de Máster/Master Amaierako Lana
Impact
|
nodoi-noplumx
|
Abstract
El objetivo de este trabajo es el desarrollo de una aplicación para la monitorización de tweets
sobre el COVID-19.
La aplicación estará dividida en dos partes principales: Una de extracción, tratamiento y
almacenamiento de datos (tweets), en la que se utilizarán herramientas como la API de Twitter
o los clústers de Hadoop de AWS (EMR), y otra que será un sitio web en el que los usuarios
podr ...
[++]
El objetivo de este trabajo es el desarrollo de una aplicación para la monitorización de tweets
sobre el COVID-19.
La aplicación estará dividida en dos partes principales: Una de extracción, tratamiento y
almacenamiento de datos (tweets), en la que se utilizarán herramientas como la API de Twitter
o los clústers de Hadoop de AWS (EMR), y otra que será un sitio web en el que los usuarios
podrán visualizar los resultados del tratamiento de datos de la primera parte.
La red y las máquinas virtuales sobre las que se ejecutaría la aplicación estarían alojadas
en AWS. Para incrementar la disponibilidad y la tolerancia a fallos de la aplicación se hará uso
de herramientas de AWS como los grupos de auto-escalado y los balanceadores de carga. [--]
The aim of this work is the development of an application for monitoring tweets about COVID19.
The application will be separated into two main parts: One of data (tweets) extraction,
treatment and storage, where we will use tools such as the Twitter API or AWS Hadoop clusters
(EMR), and another that will be a website where the users will view the results of the data
processinf of the first p ...
[++]
The aim of this work is the development of an application for monitoring tweets about COVID19.
The application will be separated into two main parts: One of data (tweets) extraction,
treatment and storage, where we will use tools such as the Twitter API or AWS Hadoop clusters
(EMR), and another that will be a website where the users will view the results of the data
processinf of the first part.
The network an virtual machines where the application wil be running will be hoste don
AWS. To increase the availability and fault tolerance of the application, we will used AWS tools
such as auto-scaling groups and load bañancers. [--]
Subject
Big Data,
AWS,
Hadoop,
Twitter,
Covid-19
Degree
Máster Universitario en Ingeniería Informática por la Universidad Pública de Navarra /
Nafarroako Unibertsitate Publikoko Unibertsitate Masterra Informatika Ingeniaritzan