Publication:
Benchmarking distributed systems in the cloud: Yahoo! YCSB

Consultable a partir de

Date

2014

Authors

Nawazish Ali, Sana

Publisher

Acceso abierto / Sarbide irekia
Trabajo Fin de Máster / Master Amaierako Lana

Project identifier

Abstract

El objetivo principal del proyecto es el estudio, aprendizaje y utilización del framework YCSB. Para ello también se realizará un estudio sobre las herramientas Hadoop, HBase y Cassandra y posteriormente su instalación. YCSB es un servicio diseñado para realizar pruebas de rendimiento sobre bases de datos. Permite crear cargas de trabajo para poder analizar el comportamiento de los gestores ante diferentes entornos de cargas de trabajo y poder realizar comparativas de base de datos. Este documento se divide en 5 bloques principales. El primer bloque consiste en una breve introducción de la tecnología estrella: YCSB. En este bloque se realiza un análisis de YCSB como herramienta para realizar la motorización y análisis de carga de trabajo sobre HBase y Cassandra. Este software facilita la obtención de los datos necesarios para la comparativa entre los diferentes sistemas de almacenamiento distribuidos. En el segundo bloque se detallará una descripción de lo que son las bases de datos NoSQL y los diferentes modelos que existen así como las herramientas Open Source disponibles. En este bloque también se lleva a cabo un estudio de las ventajas e inconvenientes que aporta este nuevo paradigma tecnológico, así como los servicios que puede prestar. A continuación, en el tercer bloque se estudia en profundidad la herramienta Hadoop como un sistema que permite procesar y analizar grandes volúmenes de datos. En los siguientes dos bloques se realiza el estudio de HBase y Cassandra como sistemas gestores de almacenamiento de datos en la nube y se muestra el proceso de instalación y configuración de todos los sistemas antes mencionados (Hadoop, HBase, Cassandra e YCSB). Para finalizar y, como bloque principal y objetivo del proyecto, se presentarán los resultados de diversas pruebas de rendimiento y comparativa entre HBase y Cassandra mediante el uso del framework YCSB.

Keywords

Framework YCSB, Hadoop, HBase, Cassandra, Informática en la nube

Department

Ingeniería Matemática e Informática / Matematika eta Informatika Ingeniaritza

Faculty/School

Escuela Técnica Superior de Ingenieros Industriales y de Telecomunicación / Telekomunikazio eta Industria Ingeniarien Goi Mailako Eskola Teknikoa

Degree

Ingeniería Técnica en Informática de Gestión, Kudeaketa Informatikako Ingeniaritza Teknikoa

Doctorate program

Editor version

Funding entities

Los documentos de Academica-e están protegidos por derechos de autor con todos los derechos reservados, a no ser que se indique lo contrario.