- Esquemas
del diseño dimensional - Base de
datos fuentes - Interfaces
orientadas a usuarios que extraen información para la
toma de decisiones - Microsoft
SQL Server 2008 - Bibliografía
Categorías
de los Sistemas de Información
Los sistemas de
Información se dividen en dos categorías
(Casares, 2003):
Sistemas operacionales: Son aquellos que tienen como
objetivos reflejar el estado y funcionamiento de la empresa
registrando las transacciones u operaciones diarias, de
aquí que los mismos se conozcan como sistemas de
Procesamiento de Transacciones en Línea
(OLTP).
Sistemas para el soporte de decisiones: Son aquellos que
tienen como objetivos medir y controlar el desarrollo de las
variables importantes del negocio, buscando identificar,
proyectar y predecir tendencias a partir de los datos
acumulados.
Desde que se inició la era de la
computadora, las organizaciones
han usado los datos desde sus
sistemas
operacionales para atender sus necesidades de información. Algunas proporcionan acceso
directo a la información contenida dentro de las
aplicaciones operacionales. Otras, han extraído los datos
desde sus bases de datos
operacionales para combinarlos de varias formas no estructuradas,
en su intento por atender a los usuarios en sus necesidades de
información (Casares, 2003).
Bill Inmon fue uno de los primeros autores en escribir sobre
el tema de almacenes de
datos, define un almacén de
datos en términos de las características del
repositorio de datos (Inmon, 2007):
Orientado a temas: Los datos en la base de datos
están organizados de manera que todos los elementos de
datos relativos al mismo evento u objeto del mundo real queden
unidos entre sí.
Variante en el tiempo: Los
cambios producidos en los datos a lo largo del tiempo quedan
registrados para que los informes que
se puedan generar reflejen esas variaciones.
No volátil: La información no se modifica ni se
elimina, una vez almacenado un dato, éste se convierte en
información de sólo lectura y se
mantiene para futuras consultas.
Integrado: La base de datos contiene los datos de todos los
sistemas operacionales de la
organización y dichos datos deben ser
consistentes.
Los mercados de datos
son subconjuntos de datos de un almacén de datos para
áreas específicas. Desde el punto de vista de
diseño
se aplica en el mercado de datos
todo lo que es aplicable a un almacén de datos (Inmon,
2007).
El Modelo
Dimensional es el más usado en los sistemas de almacenes de
datos, este es diferente al modelo relacional utilizado en los
sistemas OLTP. Este modelo se basa en dimensiones, las cuales
representan categorías de información, atributos
que representan un único nivel dentro de una
dimensión, pueden existir jerarquías de atributos
las cuales expresan relaciones entre diferentes atributos y por
último tablas de hechos, las cuales contienen datos de
interés, que presentan un nivel de
granularidad. La granularidad es el nivel más bajo de
información que será almacenado en la tabla de
hechos. El primer paso al diseñar una tabla de hechos es
determinar la granularidad.
Esquemas del
diseño dimensional
Esquema Estrella: Una tabla de hechos en el centro
conectada con un conjunto de tablas de dimensiones.Esquema Copo de Nieve: Un refinamiento del anterior donde
algunas dimensiones se normalizan en tablas más
pequeñas.Constelación de Hechos: Múltiples tablas de
hechos comparten tablas de dimensión que se visualizan
como una constelación de hechos.
La gestión
administrativa reconoce que una manera de elevar su eficiencia
está en hacer el mejor uso de los recursos de
información que ya existen dentro de la organización. El almacén de datos,
es actualmente, el centro de atención de las grandes instituciones,
porque provee un ambiente para
que las organizaciones hagan un mejor uso de la
información que está siendo administrada por
diversas aplicaciones operacionales (Casares, 2003).
La arquitectura de
un almacén de datos consta de tres niveles (Casares,
2003):
Bases de datos fuentes (producción e
históricos).Una base de datos con datos resumidos extraídos de
las bases de producción (almacén de datos).Interfaces orientadas a usuarios que extraen
información para la toma de decisiones. Las
clásicas son: consultas y reportes, análisis
multidimensional y Minería de Datos.
Base de datos
fuentes
Consiste en bases de datos de producción así como en
históricos de dichas bases. Estas bases de datos pueden
estar implementadas en diferentes tipos de sistemas:
BD-Relacionales, BD-geográficas, BD-textos, archivos, etc.
Una característica común es que almacenan
ítems de datos atómicos, los cuales son relevantes
como datos de producción, pero pueden ser demasiado finos
para servir como base para la toma de
decisiones. Además, la noción de calidad de los
datos en estas bases se basa en la consistencia de dichos
registros,
independientemente de la relevancia que estos tengan dentro del
problema.
Página siguiente |