Este trabajo intenta dar una idea bastante acertada sobre el trabajo con sistemas Data Warehouse, presentando la teoría fundamental que sustenta este tipo de representación y procesamiento de los datos en la actualidad: El Modelo Dimensional (DFM: Dimention Fact Model). Además brinda ejemplos prácticos de cómo llevar a cabo tareas primordiales de un Data Warehouse, como son: La extracción de los datos desde otros sistemas o formatos. Mostrando así las facilidades que brinda la herramienta de transformación de datos de Microsoft SQL Server 2000 (DTS: Data Transformation Service). En otros apartados posteriores trata de resumir el tema de la programación distribuida, las diferentes técnicas de distribución de los datos orientado principalmente a Microsoft SQL Server 2000, las diferentes estrategias para mejorar el hardware de un Data Warehouse y finalmente se aborda el tema de la salva de los datos, mostrando como ejemplo un script de salva incremental.
Data Warehouse no es un término nuevo si no una vieja rutina con un nombre nuevo. El almacenamiento de datos históricos y análisis de estos para tomar decisiones futuras ya era practicado por los aztecas y mallas en su increíble calendario solar. Incluso los egipcios atesoraban registros de las primaveras con amplios desbordamientos del Nilo, que les permitía saber si el año sería de una buena cosecha o no.
El estudio de datos relacionados con la gestión empresarial, empezó cuando todavía la computación no llegaba a dar respuesta a estos problemas. Los directivos estudiaban enormes informes elaborados por comerciales y económicos compuestos de varias páginas de datos escrupulosamente resumidos. El avance de la computación ha hecho el trabajo un poco más fácil. El uso de aplicaciones OLTP (Online Transaction Proccesing) ha traído consigo la recopilación muy rápida de datos que antes era casi imposible obtener, aunque haciendo uso en muchos casos de múltiples sistemas que usan SGBDR(Sistemas Gestores de Bases de Datos Relacionales) diferentes e incompatibles. Esto hace difícil el correlacionar los datos obtenidos desde estos diversos sistemas teniendo que volver al análisis impreso. Así esta nueva teoría viene a resolver un problema viejo usando una nueva técnica: OLAP (Online Analitical Proccesing) Procesamiento Anlítico En Línea.
Existen diversas variantes sobre esta teoría, que definen el futuro desarrollo de este tipo de aplicaciones, pero una de las más aceptadas hasta ahora es el Modelo de Hechos Dimensionales (DFM: Dimention Fact Model), que veremos a continuación para dar comienzo a nuestro estudio.
Para empezar vamos a enunciar una serie de conceptos básicos que nos permitirán entender toda la teoría que seguirá en los restantes apartados de este documento:
Página siguiente ![]() |
Trabajos relacionados
Ver mas trabajos de Programacion |
|
Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.