- Introducción
- Redes
de almacenamiento - Sistemas de almacenamiento
inteligente - Red de
almacenamiento de área local (SAN) - Network Attached Storage
(NAS) - Conclusión
- Bibliografía
Introducción
La información crece en importancia diariamente
en el diario vivir. Irremediablemente nos hemos convertido
dependientes de la información en lo que va corrido del
siglo 21, en un mundo sobre demanda, en el sentido de que
necesitamos la información donde y cuando sea requerido.
Accesamos Internet diariamente en el desarrollo de
búsquedas, participamos en redes sociales, enviamos y
recibimos correos electrónicos, compartimos fotos, videos
y otro sinnúmero de aplicaciones.
Equipados con un número creciente de dispositivos
generadores de contenido, más y más
información es creada por individuos y por diferentes
negocios y, dicha información creada individualmente gana
valor cuando se es compartida con otros. Cuando la
información es creada, reside localmente en PCs, laptops,
dispositivos móviles como, Smart phones, cell phones,
tablets y cámaras y, para compartir esta
información debes ser cargada vía redes a centros
de datos.
La importancia, dependencia y volumen de
información para el mundo de los negocios también
continúa creciendo a pasos agigantados, los negocios
dependen de lo rápido y confiable que puedan accesar los
datos críticos para el negocio como por ej., sistemas de
facturación de las empresas de las
[1]Telcos, [2]e-commerce,
[3]ATMs, diseño de productos,
administración de inventarios, portales Web, tarjetas de
crédito y mercados capitales en general. Esta creciente
dependencia creciente de la información sobre los negocios
ha multiplicado los retos en cuanto a almacenar, proteger y
administrar los datos, es por esto que las redes de
almacenamiento han cobrado inmenso valor durante la
evolución de las tecnologías y desarrollo de nuevos
negocios en la actualidad.
Redes de
almacenamiento
Que es La Data
La [4]Data es una colección de
datos en bruto de los cual se podrían extraer
conclusiones. Cartas escritas a mano, un libro impreso, una
fotografía de la familia, una película en cinta de
video, impresos y copias debidamente firmadas, libros de
contabilidad de un banco, y libretas de un titular de la cuenta
son todos los ejemplos que contienen datos.
Con los avances de los computadores y tecnologías
de la comunicación, la rata de crecimiento de la
creación de datos ha incrementado exponencialmente. Los
siguientes son algunos de los factores que han provocado el
crecimiento exponencial de los datos digitales:
Incremento en la capacidad de procesamiento de
datosBajo costo de almacenamiento digita
Tecnologías de comunicación más
rápidas y accequiblesProliferación de aplicaciones y dispositivos
inteligentes
Tipos de Datos
Figura 1 -; Tipos de
Datos
Los datos puede clasificarse en Datos Estructurados y
Datos no Estructurados dependiendo de cómo es almacenada y
administrada. Los datos estructurados son organizados en filas y
columnas en un formato rígidamente definido de tal manera
que las aplicaciones puedan accesarla y procesarla
eficientemente.
Los datos son no estructurados si sus
elementos no pueden ser almacenados en fila y columnas y por
consiguiente, es difícil su búsqueda y acceso por
parte de aplicaciones.
Como vemos en al gráfico anterior, 90% de los
datos de las empresas son no estructurados.
Big Data
Big Data se refiere a grupos de datos que
por su tamaño y por estar más allá de las
capacidades de herramientas de software para capturar, almacenar,
administrar y procesar, dentro de los límites
aceptables.
Incluye datos estructurados y no
estructurados, generados por diferentes fuentes, cuyo
análisis requiere de nuevas técnicas y herramientas
que provean:
Alto desempeño
Plataformas de procesamiento paralelo
masivo [5]MPP)Herramientas de Análisis
Avanzado
Las herramientas de análisis
avanzado proveen la oportunidad de toma de decisiones sobre la
forma de almacenar, accesar y administrar grandes
volúmenes de datos que con herramientas tradicionales no
podrían realizar.
Que es Información
La información es la inteligencia y conocimiento
derivado de los datos. Los datos, bien sean estructurados o no,
no reflejan ningún propósito a menos de que sean
presentados de una manera que les dé sentido. Los negocios
analizan fuentes de datos para identificar tendencias. Con base
en estas tendencias, una compañía puede planear o
modificar sus estrategias de negocio.
Almacenamiento
Los datos creados por personas o empresas deben ser
almacenados con el propósito de ser fácilmente
accesados para más tarde ser procesados. In un ambiente
computacional, los dispositivos diseñados para almacenar
datos son denominados "Dispositivos de Almacenamiento" o
simplemente almacenamiento. El tipo de almacenamiento utilizado
varía dependiendo del tipo de datos y la frecuencia con la
cual es creada y usada. Ejemplos de dispositivos de
almacenamiento son:
DVDsCD-ROMsTarjetas de memoria en
cámaras digitalesTarjetas de memoria en Teléfonos
CelularesDiscos durosArreglos de DiscosCintasLas empresas cuentan
con varias opciones para el almacenamiento de datos, incluyendo
discos duros internos, arreglos de discos externos y
cintas.
Evolución de la Arquitectura de
Almacenamiento
Históricamente, las compañías
habían centralizado los computadores y los dispositivos
para almacenamiento de información en su centro de datos.
La evolución de los sistemas abiertos, su accequibilidad y
facilidad de implementación hicieron posible a las
organizaciones tener sus propios servidores y sistema de
almacenamiento.
Figura 2 -; Server-Centric to
Information-Centric
En los inicios de estas implementaciones de sistema s
abiertos, el almacenamiento era típicamente interno al
servidor y no podía ser compartido con ningún otro
servidor; esta arquitectura es llamada
[6]Server Centric Storage". En esta
arquitectura los servidores son islas de cómputo y
almacenamiento teniendo límites muy cortos en cuanto a
capacidad de almacenamiento, haciendo indisponible la
información a otros servidores/sistemas.
Para superar esto, la arquitectura de almacenamiento
evolucionó de Server Centric a
[7]Information Centric Storage", en donde
los dispositivos de almacenamiento son administrados centralmente
e independiente de los servidores.
Centro de Datos
Un Centro de Datos es un sitio que contiene
almacenamiento, cómputo, redes y otros recursos de TI para
proveer capacidades de procesamiento de datos
centralizado.
Los elementos centrales de un centro de
datos son:
Aplicaciones
Sistemas de Administración de
Bases de Datos (DBMS)Servidores
Redes
Almacenamiento
Estos elementos centrales trabajan en conjunto para
direccionar todos los requerimientos de procesamiento de
datos.
Características Clave de un Centro
de Datos
Las operaciones ininterrumpidas de un centro de datos
son críticas para la supervivencia y éxito de un
negocio. Mientras las características mostradas en la
siguiente figura son aplicables para todos los elementos de
infraestructura del centro de datos, me centraré en lo
concerniente a sistemas de almacenamiento.
Figura 3 – Características de
un Centro de Datos
Disponibilidad
Disponibilidad de los datos con sistemas de
almacenamiento con arreglos de disco que proporcionen
redundancia.
Seguridad
Políticas, procesos e
integración correcta de los elementos centrales del centro
de datos.
Escalabilidad
Los elementos del centro de datos deberán ser
escalables de acuerdo a los requerimientos del negocio sin
interrumpir la operación. De acuerdo a como el negocio
crece, crece en servidores, aplicaciones, bases de datos, etc.,
por esta razón el sistema de almacenamiento debe estar en
la capacidad de crecer con el negocio con una alta
disponibilidad.
Desempeño
Todos los elementos del centro de datos
deben proveer un desempeño óptimo basado en los
requerimientos de niveles de servicios.
Integridad de los Datos
La integridad de los datos hacen referencia
a los mecanismos, como códigos de corrección de
errores o bits de paridad que garanticen que los datos son
escritos al disco exactamente de la forma como fueron
recibidos.
Capacidad
El centro de datos requiere de recursos de
almacenamiento para almacenar y procesar grandes cantidades de
datos eficientemente. Cuando los requerimientos de capacidad se
crecen, el centro de datos debe estar en capacidad de proveer
capacidad adicional sin interrumpir la disponibilidad de los
datos o con mínima disrupción.
Administrabilidad
Un centro de datos debe proveer una
administración fácil e integrada de sus elementos.
La administración debe ser lograda a través de la
automatización y reducción de intervención
manual en tareas comunes.
Sistemas de
almacenamiento inteligente
Las aplicaciones críticas del negocio requieren
altos niveles de desempeño, disponibilidad, seguridad y
escalabilidad. Un disco es un elemento central que gobierna el
desempeño de cualquier sistema de almacenamiento. Algunas
tecnologías de sistemas de almacenamiento antiguos no
estaban en la capacidad de superar las restricciones de
desempeño debido a las limitaciones del disco y sus
componentes mecánicos. La tecnología RAID hizo una
importante contribución en mejorar el desempeño del
almacenamiento y confiabilidad, pero los discos, aún con
implementaciones de RAID no pudieron cumplir con los
requerimientos de plas aplicaciones actuales.
Con los avances tecnológicos, una nueva
generación de soluciones de almacenamiento conocidas como
sistemas de almacenamiento inteligentes ha evolucionado. Estos
sistemas de almacenamiento inteligentes son arreglos ricos en
características de RAID que proveen capacidades de
procesamiento de I/O altamente optimizadas. Estos arreglos de
Almacenamiento están equipados con capacidades grandes de
memoria cache y múltiples caminos de I/O usando algoritmos
sofisticados para cumplir con los requerimientos de aplicaciones
sensibles a desempeño.
Estos arreglos de almacenamiento tienen un ambiente de
operación que inteligente y óptimamente manejan la
administración, asignación y utilización de
los recursos. El soporte de [8]flash
drives y otras tecnologías de punta, como
aprovisionamiento virtual, y [9]Tiering
dinámico, han agregado una nueva dimensión al
desempeño, escalabilidad y disponibilidad del sistema de
almacenamiento.
En la siguiente figura se muestras los componentes
principales de un sistema de almacenamiento
inteligente.
Figura 4 -; Sistema de Almacenamiento
Inteligente
Front End: Conexión hacia los
Hosts -; ServidoresMemoria Cache: Componente que mejora
ostensiblemente el desempeño en escrituras y
lecturasBack End: Sistema de
interconexión interna desde memoria cache hacia los
discos físicos.Discos Físicos: Conectados
directamente al back-end del controlador de almacenamiento y
proveen almacenamiento de datos persistente.
Red de almacenamiento
de área local (SAN)
Las organizaciones experimentan actualmente un
crecimiento explosivo de la información. Esta
información. Esta información necesita ser
almacenada, protegida, optimizada en acceso y administrada
eficientemente, por lo tanto, una solución de
administración efectiva tiene que proveer lo siguiente. Es
de anotar que algunos términos presentados a
continuación no son traducidos al español por
perder su sentido tecnológico:
Just-in-time to Business
users: Información tiene que estar disponible al
usuario cuando la necesite con 7 x 24 de disponibilidad de
los datos.Flexible and resillient storage
infrastructure: La infraestructura tiene que proveer
flexibilidad y resiliencia.
Direct-Attached-Storage (DAS) es
un tipo de almacenamiento en el cual el servidor o host es su
dueño por tanto es difícil su administración
y el compartir recursos en este dispositivo de almacenamiento.
Los esfuerzos en organizar estos datos dispersos llevaron a la
que emergiera el [10]Storage Area Network
(SAN) que en adelante llamaremos SAN.
Que es una SAN?
Una SAN es una red dedicada de alta
velocidad y desempeño de servidores y dispositivos de
almacenamiento compartidos.
Entre las características de una SAN
tenemos:
Centraliza la administración de
almacenamiento.Habilita compartir recursos de
almacenamiento a través de múltiples
servidoresCumple con las crecientes demandas
eficientemente con una mejor economía a
escalaImplementaciones comunes de SAN
son:
Fibre Channel (FC) SAN: Utiliza
protocolo FCIP SAN: utiliza protocolos basados en
IP
Figura 5 -; Fibre Channel
SAN
Transmisión de datos a alta velocidad es una
característica importante en una red FC. En
comparación con tecnología Ultra- SCSI que es
comúnmente usada en servidores ambiente DAS, FC es un paso
gigante en tecnologías de almacenamiento en red. Las
últimas implementaciones FC de 16GB, ofrecen una tasa de
transferencia de 3200MB/s, cuando Ultra640-SCSI está
disponible con una tasa de transferencia de apenas 640MB/s. La
tecnología FC es mucho más escalable y,
teóricamente una sola red FC puede acomodar
aproximadamente 15 millones de dispositivos.
Nota: FibRE se refiere al procolo, mientras fibER se
refiere al medio de conexión.
Componentes de Una SAN
Una SAN es una red de servidores y almacenamiento
compartido. Los servidores y almacenamiento son los
[11]end-points o dispositivos llamados "nodos".
Una SAN FC consiste de:
Nodos (Servidores y
almacenamiento)Cables -; Patch Cords FC
Conectores
Dispositivos de interconexión
como lo son FC switches o SAN switchesSoftware de administración para
SAN
Topologías de
Conexión
La arquitectura FC soporta tres tipos
básicos de interconectividad:
Point to Point: Dos dispositivos son
conectados directamente entre sí.
Figura 6 -;
Point-to-Point
Fibre Channel Arbitrated Loop (FC-AL):
Los dispositivos están conectados a un loop. Solo un
dispositivo puede realizar una operación a la vez. Si
se presenta un daño en alguno de los dispositivos se
genera una reasignación de direcciones generando
disrupción. Topología utilizada en
implementaciones antiguas o en dispositivos que solo soportan
ese tipo de conexión.
Figura 7 -; FC-AL
Fibre Channel Switched Fabric (FC-SW):
Conforma un fabric sobre el cual todos los dispositivos son
interconectados entre si. Habilita la interconexión de
switches (ISLs) para ampliar cobretura de dispositivos y
ampliar la red SAN. Tambien habilita osibilidades de
conexión metropolitana o MAN (Metropolitan Area
Network).
Figura 8 -; FC-SW
Network Attached
Storage (NAS)
Compartir archivos permite a los usuarios compartir
archivos con otros usuarios quienes pueden tener un
interés común en el contenido. In un ambiente
archivos compartidos, un usuario que crea un archivo determina el
tipo de acceso que se le da a los otros usuarios como lectura,
escritura, ejecución, borrado, etc., y control los cambios
al archivo. Cuando muchos usuario pretenden accesar el mismo
archivo, un esquema de protección es requerido para
mantener la integridad de los datos y, al mismo tiempo, hacer
posible ser compartido.
Protocolos standard cliente-servidor para compartir,
tales como NFS o CIFS (SMB), habilitan al dueño del
archivo configurar el tipo de acceso requerido, como solo-lectura
o, lectura y escritura, a un usuario en particular o grupo de
usuarios. Usando estos protocolos, los clientes montan
[12]file-system remotos los cuales
están dedicados en
[13]file-servers.
En un modelo de compartir archivos peer-to peer (P2P),
se utiliza el tipo de red peer-to-peer. P2P permite a las
máquinas cliente compartir archivos directamente sobre la
red.
Figura 9 -; Evolución de
Compartición de Archivos
Que es una NAS?
NAS ó [14]Network
Attached Storage, es un dispositivos de almacenamiento
dedicado a la compartición de archivos. NAS habilita a los
usuarios a compartir archivos mediante una red IP. Provee las
ventajas de consolidación de servidores, mediante la
eliminación de múltiples file-servers.
Adicionalmente consolida almacenamiento utilizado por clientes
comunes en un punto único.
NAS utiliza protocolos de red y de
File-Sharing para proveer acceso a los datos, incluido TCP/IP
para transferencia de datos, Comon Internet File System (CIFS) y
Network File System (NFS) para servicios de red de
archivos.
NAS habilita a sistemas operativos como
UNIX, LINUX, MAC OS, Windows, VMWare a compartid los mismos datos
sin importar el [15]O.S.
Los sistema basados en NAS, utilizan su
propio sistema operativo, así como hardware y software
para cumplir con los requerimientos de
[16]file-sharing.
Figura 10 -; Servidores de
propósito general vs. NAS
Un dispositivo NAS está optimizado
para funciones de servicios de archivos, como acceso,
recuperación y almacenamiento para aplicaciones y
clientes.
BENEFICIOS DE UNA NAS
NAS ofrece los siguientes beneficios:
Eficiencia Mejorada
NAS despacha mejor desempeño comparado a un
servidor de archivos de propósito general, ya que NAS
está optimizada para esa función.
Flexibilidad Mejorada
Compatible con múltiples sistemas operativos que
pueden accesar simultáneamente la misma data.
Almacenamiento Centralizado
Centraliza el almacenamiento de datos minimizando la
duplicidad de los datos.
Administración
Simplificada
Provee una consola central para administración
eficiente de su propio file system y funcionalidades
adicionales.
Escalabilidad
Escala bien, de acuerdo con diferentes
perfiles de utilización y diferentes tipos de
aplicaciones, debido a su gran desempeño y baja
latencia.
Alta disponibilidad
Ofrece opciones de replicación y
recuperación, habilitando alta disponibilidad de los
datos.
Seguridad Integrada
Asegura la seguridad, autenticación
de usuarios, aseguramiento de archivos en conjunto con esquemas
de seguridad estándar de la industria.
COMPONENTES DE UNA NAS
Figura 11 -; Componentes de una
NAS
Una NAS tiene dos componentes centrales -;
Cabezal NAS y Almacenamiento. En algunas implementaciones el
almacenamiento puede ser externo y compartido con otros hosts -;
servidores.
El cabezal NAS incluye los siguientes
componentes:
CPU y Memoria
Una o más
[17]NICs los cuales proveen conexión a
los clientesUn sistema operativo optimizados para
funcionalidades NASProtocolos de compartición de
archivos como [18]NSF y CIFS
[19]SMB)Protocolos estándar de la
industria para conectividad de back-end hacia los recursos de
almacenamiento como: ATA, SATA, SCSI o FC
El ambiente NAS incluye clientes accesando
un dispositivo NAS sobre una red IP utilizando protocolos para
file-sharing.
Conclusión
Las Redes de Almacenamiento fueron la mejor
solución a los problemas que generaban el tener islas de
procesamiento que incluían su propio almacenamiento. Esto
genera independencia negativa frente a la administración
de datos y más en una infraestructura de centro de datos
en donde la prestación de servicios objeto del negocio
depende de la disponibilidad, confiabilidad y
seguridad.
Las redes de almacenamiento junto con los sistemas de
almacenamiento proveen un servicio con las
características, requerimientos y funcionalidades
necesarias para optimizar la continuidad del negocio.
Tecnologías con FC-SW, NFS, CIFS (SMB) ofrecen
los beneficios necesarios alineados con el tipo de datos que se
pretenda administrar. Para una organización puede ser
factible el uso de SAN para los sistemas centrales con
requerimientos de desempeño y confiabilidad y
disponibilidad extremos. Al mismo tiempo, la organización
puede verse en la necesidad de implementar un sistema de
compartición de archivos como bodega de datos o manejo de
Big Data, para lo cual sería beneficioso implementar un
sistema NAS.
La tecnologías de almacenamiento siguen su
crecimiento exponencial, ya que día a día crecen
los requerimiento respecto a compatibilidad, flexibilidad,
disponibilidad, desempeño y eficiencia; requerimientos que
se convierten en los más interesantes retos para los
fabricantes de almacenamiento como lo son EMC², Hitachi,
IBM, NetApp, entre otros..
Bibliografía
Storage Networking y el almacenamiento sobre internet:
iSCSI, Francisco Matas Albaladejo Documento consultado Diciembre
de 2013
http://www.uv.es/~montanan/redes/trabajos/ISCSI.PDF
Almacenamiento distribuido basado en red (III):
Almacenamiento SAN por red TCP/IP
http://cuchillac.net/archivos/pre_ipv6/3_san-nas/lects/lect1_almacenamiento_SAN.pdf
Simulación concurrente de redes de almacenamiento
de altas prestaciones (SAN, Storage Area Networks)1 À.
Perles, X. Molero, A. Martí, V. Santonja, J.J.
Serrano
http://www.disca.upv.es/aperles/investigacio/seid2000.pdf
Storage Information Systems & Management V2
EMC² Information Systems -; Education Services
2012
Autor:
Angel Alberto Echeverry
Castano
NOMBRE DEL CURSO: STORAGE
NETWORKS
FECHA: Octubre 10 de 2014LUGAR:
Bogotá D.C., Colombia
ATLANTIC INTERNATIONAL
UNIVERSITY
[1] Telcos: empresas de
telecomunicaciones
[2] e-commenrce: comercio
electrónico
[3] ATM: siglas de atomatic Tellr Machine
– Cajero Automático
[4] Data: término inglés usado
para referirse a los datos
[5] MPP – siglas en inglés de
Masive Parallel Processing.
[6] Server Centric Storage: Almacenamiento
centrado en Servidores
[7] Information Centric Storage:
Almacenamiento centrado en la Información
[8] Flash Drives: discos duros de etado
sólido con velocidades de lectura – escritura bastante
altas
[9] Tiering: almacenamiento por capas donde
cada capa es un categoría
[10] Disco Físico: disco duro o de
estado sólido implementado en el arreglo de disco.
[11] Direct attached Storage: Almacenamiento
conectado directamente a servidores o hosts
[12] Storage área Network: Red de Area
de Almacenamiento (SAN)
[13] End-points: puntos extremos de la red de
almacenamiento
[14] File-System: Sitema de archivos que
permite la distribución lógica de los mismos.
[15] File-Server: Servidores dedicados a
compartir archivos
[16] Network Attached Storage: significado de
NAS – dispositivos para compartir archivos
[17] O.S.: siglas de Sistema Operativo
[18] Compartición de Archivos
[19] NISs: Network Interface Cards –
tarjetas de red.