Monografias.com > Computación > Programación
Descargar Imprimir Comentar Ver trabajos relacionados

El Benchmark TPC-H en MySQL y Postgress



    Resumen

    Para cualquier Sistema de Informacion el poder procesar
    informacion de manera rapida se ha vuelto una necesidad muy
    importante. Por este motivo se necesita la construccion de base
    de datos con caracteristicas especiales que permitan mejorar los
    procesos, a esta coleccion de bases de datos se le denomina
    Almacenes de Datos (Data Warehouse), estos favorecen el analisis
    y divulgacion eficiente de los datos (especialmente operaciones
    de analisis de datos (OLAP).

    Palabras Clave—Benchmark, Funciones OLAP,
    Almacen de Datos, Benchmark TPC-H.

    1
    INTRODUCCION

    A partir de 1999 en el estandar de SQL incluye
    funcionalidades OLAP, que nos permiten obtener informacion de
    bases de datos multidimensionales que son utiles en la toma de
    decisiones en una empresa u organizacion.

    Para tomar decisiones correctas es necesario implementar
    un benchmark, el cual puede facilitarnos todas las
    especificaciones tecnicas de un ordenador junto con su
    rendimiento ante los diferentes estimulos lo que permite realizar
    comparativas entre diferentes sistemas atendiendo a sus
    especificaciones tecnicas y su rendimiento.

    En esta investigacion se haraun analisis
    comparativo en terminos de la eficiencia de la funciones OLAP de
    los Sistemas Gestores de Bases de Datos (SGBD) MySQL y
    PostgreSQL, para lo cual se tomocomo referencia el modelo logico
    de la base de datos y las consultas incluidas en el benchmark
    TPC-H version 2.8.0, este se centra como apoyo a la toma de
    decisiones involucrando grandes cantidades de datos relativamente
    estables.

    2 CONCEPTOS
    BASICOS

    Para entender mejor de lo que se trata esta
    investigacion, describiremos lo que son Benchmark, Funciones
    OLAP, Almacen de Datos y Benchmark TPC-H.

    2.1 ¿Que
    es un Almacen de Datos?

    Almacen de Datos (Data Warehouse).Es una coleccion de
    datos en la cual se encuentra integrada la informacion de la
    empresa u organizacion. Esta informacion es de utilidad en el
    proceso de toma de decisiones gerenciales.

    Un Data Warehouse es como el expediente de una empresa
    con informacion transaccional y operacional, que es almacenada en
    una base de datos diseñada para favorecer analisis y la
    divulgacion eficientes de datos (especialmente OLAP,
    procesamiento analitico en linea). El almacenamiento de los datos
    no debe usarse con datos de uso actual.

    Los Data Warehouse contienen a menudo
    grandes cantidades de informacion que se subdividen a veces en
    unidades logicas mas pequeñas, llamadas los centros
    comerciales, dependientes de los datos. Generalmente, dos ideas
    basicas dirigen la creacion de un almacen de los
    datos:

    Integracion
    de los datos de bases de datos distribuidas con estructuras
    diferentes, que facilitan una descripcion global y un analisis
    comprensivo en el almacen de los datos.

    Separacion de los datos
    usados en operaciones diarias de los datos usados en el almacen
    de los datos para los propositos de la divulgacion, de la ayuda
    en la toma de decisiones, para el analisis y para
    controlar.

    2.2
    Funcionalidades OLAP

    OLAP. Es el acronimo en ingles de
    procesamiento analitico en linea (On-Line Analytical
    Processing). Es una solucion utilizada en el campo de la
    Inteligencia de Negocios (Business Intelligence), la cual
    consiste en consultas a estructuras multidimensionales (o Cubos
    OLAP) que contienen datos resumidos de grandes Bases de Datos o
    Sistemas Transaccionales (OLTP). Se usa en informes de negocios
    de ventas, marketing, informes de direccion, mineria de datos y
    areas similares.

    La razon de usar OLAP para las consultas es la velocidad
    de respuesta. Una base de datos relacional almacena entidades en
    tablas discretas si han sido normalizadas. Pero esto es
    relativamente lento a la hora de realizar las complejas consultas
    multitabla. Un modelo mejor para busquedas, es una base de datos
    multidimensional. La principal caracteristica que potencia a
    OLAP, es que es lo mas rapido a la hora de hacer
    SELECTS.

    2.3 ¿Que
    es un benchmark?

    En terminos informaticos un benchmark es
    una aplicacion destinada a medir el rendimiento de un ordenador o
    de algun elemento del mismo. Para ello se somete a la maquina a
    una serie de cargas de trabajo o estimulos de distinto tipo con
    la intencion de medir su respuesta ante ellos. De esta forma se
    puede estimar bajo quetareas o estimulos un determinado ordenador
    se comporta de una manera fiable y efectiva o por el contrario se
    muestra ineficiente.

    Esta informacion es muy util a la hora de
    seleccionar una maquina para realizar tareas determinadas en el
    proceso de postproduccion y creacion del producto audiovisual,
    pudiendo elegir la mas adecuada para un proceso determinado. El
    benchmark tambien es util para estimar el nivel de
    obsolescencia de un sistema o en queaspectos tecnicos puede ser
    mejorado su rendimiento, por medio de actualizaciones.

    Por otro lado el benchmark puede facilitarnos todas las
    especificaciones tecnicas de un ordenador junto con su
    rendimiento ante los diferentes estimulos lo que permite realizar
    comparativas entre diferentes sistemas atendiendo a sus
    especificaciones tecnicas y su rendimiento.

    Las comparativas son utiles para determinar
    que caracteristicas tecnicas son las idoneas para conseguir un
    rendimiento optimo en una tarea especifica. Una comparativa
    entre multiples ordenadores de diferentes
    fabricantes (con diferentes especificaciones tecnicas) nos
    permite determinar a priori cuales son mas adecuados para
    determinadas aplicaciones y cuales son mejores para
    otras.

    2.4 Benchmark
    TPC-H

    El Benchmark TPC-H es una prueba de rendimiento a
    sistemas de soporte de decisiones. Consiste en una "suite" de
    negocios orientados a busquedas convenientes y modificaciones
    simultaneas de datos. Las busquedas y la poblacion de datos han
    sido elegidas un amplia relevancia en la industria. Este
    benchmark ilustra las decisiones de los sistemas de respaldo que
    examinan grandes volumenes de datos, ejecutan busquedas con un
    elevado grado de complejidad y responde a situaciones criticas de
    negocios.

    EL PRESENTE TEXTO ES SOLO UNA SELECCION DEL TRABAJO
    ORIGINAL.
    PARA CONSULTAR LA MONOGRAFIA COMPLETA SELECCIONAR LA OPCION
    DESCARGAR DEL MENU SUPERIOR.

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter