Benchmarking distributed systems in the cloud: Yahoo! YCSB
Ver/
Fecha
2014Autor
Director
Versión
Acceso abierto / Sarbide irekia
Tipo
Proyecto Fin de Carrera / Ikasketen Amaierako Proiektua
Impacto
|
nodoi-noplumx
|
Resumen
El objetivo principal del proyecto es el estudio, aprendizaje y utilización del framework YCSB. Para ello también se realizará un estudio sobre las herramientas Hadoop, HBase y Cassandra y posteriormente su instalación. YCSB es un servicio diseñado para realizar pruebas de rendimiento sobre bases de datos. Permite crear cargas de trabajo para poder analizar el comportamiento de los gestores ante ...
[++]
El objetivo principal del proyecto es el estudio, aprendizaje y utilización del framework YCSB. Para ello también se realizará un estudio sobre las herramientas Hadoop, HBase y Cassandra y posteriormente su instalación. YCSB es un servicio diseñado para realizar pruebas de rendimiento sobre bases de datos. Permite crear cargas de trabajo para poder analizar el comportamiento de los gestores ante diferentes entornos de cargas de trabajo y poder realizar comparativas de base de datos.
Este documento se divide en 5 bloques principales.
El primer bloque consiste en una breve introducción de la tecnología estrella: YCSB. En este bloque se realiza un análisis de YCSB como herramienta para realizar la motorización y análisis de carga de trabajo sobre HBase y Cassandra. Este software facilita la obtención de los datos necesarios para la comparativa entre los diferentes sistemas de almacenamiento distribuidos. En el segundo bloque se detallará una descripción de lo que son las bases de datos NoSQL y los diferentes modelos que existen así como las herramientas Open Source disponibles. En este bloque también se lleva a cabo un estudio de las ventajas e inconvenientes que aporta este nuevo paradigma tecnológico, así como los servicios que puede prestar. A continuación, en el tercer bloque se estudia en profundidad la herramienta Hadoop como un sistema que permite procesar y analizar grandes volúmenes de datos. En los siguientes dos bloques se realiza el estudio de HBase y Cassandra como sistemas gestores de almacenamiento de datos en la nube y se muestra el proceso de instalación y configuración de todos los sistemas antes mencionados (Hadoop, HBase, Cassandra e YCSB). Para finalizar y, como bloque principal y objetivo del proyecto, se presentarán los resultados de diversas pruebas de rendimiento y comparativa entre HBase y Cassandra mediante el uso del framework YCSB. [--]
Materias
Framework YCSB,
Hadoop,
HBase,
Cassandra,
Informática en la nube
Departamento
Universidad Pública de Navarra. Departamento de Ingeniería Matemática e Informática /
Nafarroako Unibertsitate Publikoa. Matematika eta Informatika Ingeniaritza Saila
Titulación
Ingeniería Técnica en Informática de Gestión /
Kudeaketa Informatikako Ingeniaritza Teknikoa