Resumen
Para cualquier Sistema de Informacion el poder procesar
informacion de manera rapida se ha vuelto una necesidad muy
importante. Por este motivo se necesita la construccion de base
de datos con caracteristicas especiales que permitan mejorar los
procesos, a esta coleccion de bases de datos se le denomina
Almacenes de Datos (Data Warehouse), estos favorecen el analisis
y divulgacion eficiente de los datos (especialmente operaciones
de analisis de datos (OLAP).
Palabras Clave—Benchmark, Funciones OLAP,
Almacen de Datos, Benchmark TPC-H.
1
INTRODUCCION
A partir de 1999 en el estandar de SQL incluye
funcionalidades OLAP, que nos permiten obtener informacion de
bases de datos multidimensionales que son utiles en la toma de
decisiones en una empresa u organizacion.
Para tomar decisiones correctas es necesario implementar
un benchmark, el cual puede facilitarnos todas las
especificaciones tecnicas de un ordenador junto con su
rendimiento ante los diferentes estimulos lo que permite realizar
comparativas entre diferentes sistemas atendiendo a sus
especificaciones tecnicas y su rendimiento.
En esta investigacion se haraun analisis
comparativo en terminos de la eficiencia de la funciones OLAP de
los Sistemas Gestores de Bases de Datos (SGBD) MySQL y
PostgreSQL, para lo cual se tomocomo referencia el modelo logico
de la base de datos y las consultas incluidas en el benchmark
TPC-H version 2.8.0, este se centra como apoyo a la toma de
decisiones involucrando grandes cantidades de datos relativamente
estables.
2 CONCEPTOS
BASICOS
Para entender mejor de lo que se trata esta
investigacion, describiremos lo que son Benchmark, Funciones
OLAP, Almacen de Datos y Benchmark TPC-H.
2.1 ¿Que
es un Almacen de Datos?
Almacen de Datos (Data Warehouse).Es una coleccion de
datos en la cual se encuentra integrada la informacion de la
empresa u organizacion. Esta informacion es de utilidad en el
proceso de toma de decisiones gerenciales.
Un Data Warehouse es como el expediente de una empresa
con informacion transaccional y operacional, que es almacenada en
una base de datos diseñada para favorecer analisis y la
divulgacion eficientes de datos (especialmente OLAP,
procesamiento analitico en linea). El almacenamiento de los datos
no debe usarse con datos de uso actual.
Los Data Warehouse contienen a menudo
grandes cantidades de informacion que se subdividen a veces en
unidades logicas mas pequeñas, llamadas los centros
comerciales, dependientes de los datos. Generalmente, dos ideas
basicas dirigen la creacion de un almacen de los
datos:
• Integracion
de los datos de bases de datos distribuidas con estructuras
diferentes, que facilitan una descripcion global y un analisis
comprensivo en el almacen de los datos.
• Separacion de los datos
usados en operaciones diarias de los datos usados en el almacen
de los datos para los propositos de la divulgacion, de la ayuda
en la toma de decisiones, para el analisis y para
controlar.
2.2
Funcionalidades OLAP
OLAP. Es el acronimo en ingles de
procesamiento analitico en linea (On-Line Analytical
Processing). Es una solucion utilizada en el campo de la
Inteligencia de Negocios (Business Intelligence), la cual
consiste en consultas a estructuras multidimensionales (o Cubos
OLAP) que contienen datos resumidos de grandes Bases de Datos o
Sistemas Transaccionales (OLTP). Se usa en informes de negocios
de ventas, marketing, informes de direccion, mineria de datos y
areas similares.
La razon de usar OLAP para las consultas es la velocidad
de respuesta. Una base de datos relacional almacena entidades en
tablas discretas si han sido normalizadas. Pero esto es
relativamente lento a la hora de realizar las complejas consultas
multitabla. Un modelo mejor para busquedas, es una base de datos
multidimensional. La principal caracteristica que potencia a
OLAP, es que es lo mas rapido a la hora de hacer
SELECTS.
2.3 ¿Que
es un benchmark?
En terminos informaticos un benchmark es
una aplicacion destinada a medir el rendimiento de un ordenador o
de algun elemento del mismo. Para ello se somete a la maquina a
una serie de cargas de trabajo o estimulos de distinto tipo con
la intencion de medir su respuesta ante ellos. De esta forma se
puede estimar bajo quetareas o estimulos un determinado ordenador
se comporta de una manera fiable y efectiva o por el contrario se
muestra ineficiente.
Esta informacion es muy util a la hora de
seleccionar una maquina para realizar tareas determinadas en el
proceso de postproduccion y creacion del producto audiovisual,
pudiendo elegir la mas adecuada para un proceso determinado. El
benchmark tambien es util para estimar el nivel de
obsolescencia de un sistema o en queaspectos tecnicos puede ser
mejorado su rendimiento, por medio de actualizaciones.
Por otro lado el benchmark puede facilitarnos todas las
especificaciones tecnicas de un ordenador junto con su
rendimiento ante los diferentes estimulos lo que permite realizar
comparativas entre diferentes sistemas atendiendo a sus
especificaciones tecnicas y su rendimiento.
Las comparativas son utiles para determinar
que caracteristicas tecnicas son las idoneas para conseguir un
rendimiento optimo en una tarea especifica. Una comparativa
entre multiples ordenadores de diferentes
fabricantes (con diferentes especificaciones tecnicas) nos
permite determinar a priori cuales son mas adecuados para
determinadas aplicaciones y cuales son mejores para
otras.
2.4 Benchmark
TPC-H
El Benchmark TPC-H es una prueba de rendimiento a
sistemas de soporte de decisiones. Consiste en una "suite" de
negocios orientados a busquedas convenientes y modificaciones
simultaneas de datos. Las busquedas y la poblacion de datos han
sido elegidas un amplia relevancia en la industria. Este
benchmark ilustra las decisiones de los sistemas de respaldo que
examinan grandes volumenes de datos, ejecutan busquedas con un
elevado grado de complejidad y responde a situaciones criticas de
negocios.
EL PRESENTE TEXTO ES SOLO UNA SELECCION DEL TRABAJO
ORIGINAL.
PARA CONSULTAR LA MONOGRAFIA COMPLETA SELECCIONAR LA OPCION
DESCARGAR DEL MENU SUPERIOR.