Partes: 1, 2, 3, 4

Debido a estos avances y al incremento cualitativo y cuantitativo, en materia de servicios y nivel de conectividad que han tenido las redes en los últimos años, se deduce la necesidad de conocer el comportamiento del tráfico de una red. Dentro de los elementos, más importantes que se plantean a la hora de la evaluación de las prestaciones de estas, está la modelación del tráfico. De hecho, este según la bibliografía del tema, es el más crítico de los problemas ya que el éxito del análisis depende en gran medida de lo representativo de la realidad, que sean los modelos de tráfico utilizados [24, 38].

Entiéndase por la modelación del tráfico, aquella abstracción matemática, más o menos compleja que trata de imitar alguna o varias características de un tipo de tráfico real o de un flujo de datos en particular [38].

Históricamente la modelación de tráfico tiene sus orígenes en la telefonía convencional y este se ha basado en suponer independencia en los tiempos entre llegadas, fundamentalmente modelos poissonianos [2, 20]. Sin embargo el tráfico de multimedia se ha caracterizado por una elevada variabilidad (burstiness) y una fuerte correlación positiva, Mucho más acentuada que en el tráfico vocal [24]. Estos hechos, provocan, que hoy se cuestiona la validez de los modelos tradicionales y sobre todo la hipótesis de independencia.

Cabe señalar, que aunque el tema de la dependencia temporal está en estudio desde mediado de la década de los sesenta según la bibliografía analizada [38]. Es en el año 1993 que un equipo compuesto por Leland, Taqqu, Willinger y Wilson realiza un trabajo que mostraba tras la observación de exhaustivas mediciones realizadas sobre una red ethernet en Bellcore USA, que el tráfico era de naturaleza autosimilar o fractal [25].

Necesidad de caracterizar el tráfico de Reduniv

La necesidad de conocer el comportamiento del tráfico telemático subyace a toda discusión relacionada con el dimensionamiento, diseño y gestión de las redes de telecomunicaciones.

Tener un modelo que ajuste al comportamiento real de la red es de suma importancia y la Red Universitaria del MES (Reduniv) no se escapa a la regla. A través de este, se pueden analizar fallas, descubrir ataques tanto externos como internos, además de tener una noción sobre la utilización de los enlaces. Empleando el modelo, a través de un proceso de simulación y análisis de este, se puede conocer si la red está operando de forma normal o existe alguna anomalía en su desempeño. De este modo se pueden detectar irregularidades como, dispositivos de interconexión fuera de servicio o segmentos de red que puedan estar inoperantes, etc.

Para modelar el tráfico de una red de datos, se necesita diseñar un modelo matemático que ajuste a los parámetros de esta. Dicho proceso exige dos etapas [6]:

  • Selección de cierto proceso estadístico, (este proceso suele denominarse caracterización).

  • Ajuste del proceso estadístico en cuestión.

De ahí la importancia que tiene el proceso de caracterización del tráfico.

Por otra parte demostrar la presencia de autosimilaridad, en la caracterización del tráfico, estriba en la posibilidad de utilizar un conjunto de modelos existentes para implementar generadores de tráfico sintéticos o usar algunos ya desarrollados, con los cuales estudiar comportamientos en el tráfico mediante un proceso de modelación.

Caracterización, Modelación y Simulación

Se entiende por la caracterización del tráfico, el proceso mediante el cual este es analizado, con el objetivo de describirlo a través de un conjunto reducido de variables, definido como descriptor matemático, que resumen y abstraen sus aspectos más importantes. La función de este modelo, es explicar la relación existente entre la capacidad de la red, la demanda de servicios de los usuarios y el desempeño de la misma en responder a esas demandas [10, 25, 29].

En el proceso de caracterización juega un papel fundamental la verificación del carácter autosimilar del tráfico. Es por eso que en este trabajo se centra una atención especial en los métodos que se utilizan para estimar este aspecto. Sin embargo para caracterizar el tráfico, se miden otros parámetros como: la variabilidad del tráfico (brutiness), la media, el pico y la varianza.

Reduniv

En el año 2004 se comienza a crear la Red Nacional Universitaria del Ministerio de Educación Superior (Reduniv). La misma interconecta los centros adscritos al MES y las Unidades de Ciencia y Técnica (UCT). Ya para el año 2005 la red contaba con más de 10000 computadoras interconectadas a través de una topología de estrella, sobre enlaces Frame Relay, en la red de transporte de datos de ETECSA. Su diseño obedecía a una estructura, que poseía el Nodo Central en el Ministerio de Educación Superior (a partir de ahora MES) y 24 nodos secundarios diseminados por todo el territorio nacional, repartidos en 17 Universidades, 4 centros de Investigación y 3 Facultades de Montañas [21, 22, 23].

Reduniv es una red de Area Amplia (WAN, de sus siglas en inglés). Desde un inicio se concibió para ser básicamente una red de transporte, de administración e inteligencia distribuida. Donde cada Centro de Educación Superior (CES) gestiona y supervisa sus servicios fundamentales (correo electrónico, Internet, ftp, etc.). En la misma los recursos se distribuyen por toda su infraestructura y en el nodo central solo se implementan servicios muy específicos de carácter nacional. Esta cuenta hoy con más de 15000 PC [21, 22, 23].

Por otro lado, Reduniv crece a un ritmo acelerado de más de 2000 PC cada año. Para asimilar un crecimiento de esa magnitud, la red tiene que estar respaldada por una sólida estructura de interconexión, para que no se produzcan cuellos de botellas interminables y enlaces infuncionales. Este tipo de estructura, requiere una ampliación constante de sus capacidades, por lo que se hace necesario un estudio como este, con el fin de poder predecir las mismas. De ahí la importancia de investigar el tráfico de datos que transita por Reduniv, con el fin de estudiar elementos claves como: la seguridad de la información, el diseño e implementación de los servicios, su dimensionamiento y gestión.

Enfoque de la Investigación

Situación problémica

En la actualidad Reduniv ha crecido en servicios y cantidad de equipamiento conectado, incluso ha crecido en interconexión con otras redes académicas como Rimed, Tinored, Infomed, etc. Pero el futuro es ambicioso en términos de comunicaciones, por lo que se hace necesario un estudio serio y profundo del estado de la red y del tráfico de la misma, con vista a predecir entre otras cosas, las demandas futuras.

Los principales problemas afrontados, a parte del crecimiento acelerado de la red son:

  • Se planea incrementar servicios asociados a aplicaciones con video en tiempo real.

  • Por otra parte el número de PCs en las SUM (Sedes Universitarias Municipales) aumenta vertiginosamente.

  • Existe un incremento notable de aplicaciones de mucha carga, como bibliotecas digitales, multimedias, repositorios de Software libre, etc. Lo que pude provocar efectos poco deseados sobre el servicio de la red, como disminución de la calidad o tiempos de respuesta muy elevados, dependiendo de la capacidad de los enlaces y el equipamiento en general.

No obstante, aunque los enlaces aun no están saturados con excepción del ISPJAE, se prevé, que pronto puedan estarlo, esto hace necesario la predicción de las demandas futuras.

Problema a resolver

Como problema a resolver, se pretende caracterizar el tráfico del Nodo Central de la Red Universitaria del Ministerio de Educación Superior, dando continuidad a trabajos realizados con anterioridad [21] con el objetivo de estudiar el tráfico y diseñar dimensionamientos de la red y los enlaces.

Actualidad y necesidad del trabajo

  • En el estudio del arte realizado, no se encontró evidencias de trabajos de este corte en otras redes del país.

  • Este trabajo forma parte de un conjunto de acciones, realizadas para poder implementar la simulación del comportamiento de Reduniv, con vistas a futuros estudios.

  • Los métodos empleados son recientes internacionalmente y aun están en desarrollo. Esto se refleja en las referencias presentadas.

Aportes prácticos esperados

Dentro de los aportes prácticos de este trabajo, está la implementación de los métodos que permitan caracterizar el comportamiento del tráfico. Por otra parte el proceso de caracterización del tráfico del Nodo Central de Reduniv, brinda una idea del comportamiento del mismo a grandes rasgos.

Objeto de estudio

Son los procesos estocásticos estacionarios, la autosimilaridad de estos, además el análisis en series temporales.

Campo de Acción

Análisis de las series temporales que responden a las capturas de tráfico del Nodo Central de Reduniv.

Hipótesis

Es posible que el tráfico perteneciente al Nodo Central de Reduniv, tenga características autosimilares o fractales, aunque no conocemos en que magnitudes y tampoco se tiene idea de cual es el comportamiento con respecto a otros parámetros de caracterización como son: la variabilidad, la varianza y la media.

Objetivos

Objetivos generales:

  • Hacer un análisis de los métodos de caracterización del tráfico, que se consideren de interés.

  • Caracterizar el comportamiento del tráfico del Nodo Central de Reduniv.

Objetivos específicos:

  • Implementar un mecanismo mediante el cual se pueda capturar tanto el tráfico de entrada como de salida del nodo central de Reduniv.

  • Seleccionar y aplicar varios métodos de estimación del parámetro de autosimilaridad (H).

  • Poner a punto una herramienta matemática para el procesamiento estadístico de los datos capturados.

Estructura del Contenido

Marco Teórico

En el capítulo 1 se analizan los conceptos básicos a tener en cuenta para este trabajo, como son los procesos estocásticos: la estacionariedad dentro de los mismos y los procesos ergódicos, como particularidad de los procesos estocásticos estacionarios.

Sobre la base de estos conceptos se introduce el término de autosimilaridad y sus definiciones. También los términos de Dependencia a Largo Plazo (LRD, de sus siglas en inglés) y análogamente Dependencia a Corto Plazo (SRD de su siglas en inglés) y sus efectos sobre series temporales. Se define otra serie de tópicos importantes para la estimación de autosimilaridad como: la densidad espectral de potencia y los procesos de colas pesadas.

Sobre esta cimentación teórica se hace una síntesis de los principales algoritmos o métodos para estimar el parámetro de autosimilaridad.

Metodología Propuesta

El capítulo 2 se dedica a la descripción detallada de los métodos escogidos para determinar la autosimilaridad en las series temporales.

En él se explican paso a paso los algoritmos escogidos para este trabajo y el porque de esta selección, además se presentan los seudo códigos de estos métodos.

Mediciones de Tráfico en el Nodo Central

El capítulo 3 ofrece una descripción del Nodo Central de la Red Universitaria, con un nivel de detalle asequible para este trabajo con el objetivo de ubicarnos en una locación exacta y describir el marco donde se desarrolla esta investigación.

Luego de esto se define el diseño del esquema de mediciones y se describe la implementación de este. Donde se muestran, elementos esenciales para este trabajo, como la escala de medición, el tiempo que se va a medir y los datos a tomar en cuenta. Otros factores de peso son, el esquema de captura y los elementos a utilizar.

También se mostrarán los resultados obtenidos para cada una de las mediciones y por último el tratamiento al que estas van a ser sometidas con el fin de obtener series temporales que se puedan emplear en este trabajo.

Caracterización del Tráfico del Nodo Central de Reduniv

Dentro del capítulo 4 se va a caracterizar el tráfico capturado con respecto a ciertos parámetros, como son: la variabilidad de este, la varianza, la media y los picos. La autosimilaridad, por ser un renglón de más peso se mostrará en un epígrafe aparte, para cada una de las capturas en general y para los protocolos de mayor interés en esta investigación, diversificando estos resultados por los métodos de estimación del parámetro de autosimilaridad.

Marco teórico.

Introducción.

En la actualidad se ha demostrado que el tráfico en las redes de datos por lo general presenta un comportamiento "autosimilar" o "fractal" sobre todo en los servicios vinculados al conjunto de protocolos TCP-IP [3, 8, 18, 25, 40, 42, 45].

La autosimilaridad de un proceso, se halla a través del estadígrafo o parámetro H, que se denomina habitualmente como parámetro Hurst en reconocimiento a la labor del científico H.E. Hurst [41]. También se le conoce como parámetro de autosimilaridad o autosemejanza. El mismo es una medida de la persistencia de las propiedades estadísticas y de la longitud de la dependencia a largo plazo de un proceso estocástico.

Es común ver el término de autosimilaridad ligado a los fractales, si bien es cierto que no son iguales, sí se puede decir que guardan estrecha relación, ya que la geometría fractal se describe a grosso modo como figuras de patrones autosimilares.

Procesos estocásticos, estacionarios y ergódicos.

Por definición el tráfico de datos es un proceso estocástico y solo se puede hablar de autosimilitud en términos estadísticos. Los mismos se caracterizan porque el comportamiento medio de estos a corto plazo, es igual que a largo plazo. Partiendo de esto, se definen otros procesos como los estacionarios y los ergódicos, útiles en esta investigación.

Proceso estocástico.

En la vida encontramos muchos fenómenos aleatorios, cuyos cambios en el tiempo se necesita conocer. Es decir se comportan como variables aleatorias que evolucionan en el tiempo. De este modo, si un proceso en cada instante se comporta como un fenómeno aleatorio, entonces se dice que es un proceso estocástico. Otra forma de enfocar el asunto es, viéndolo como un modelo matemático para un fenómeno que evoluciona de manera impredecible (aleatoria) desde el punto de vista del observador.

Se define un proceso estocástico {X(t), Monografias.comcomo una colección de variables aleatorias que describen la evolución de algún proceso a través de t. De forma tal, que para cada t, X(t) es una variable aleatoria, que puede tomar un valor Xi dentro del espacio de estados del proceso. De forma análoga también se puede definir como aquel conjunto indexado de funciones reales de algún parámetro (en nuestro caso el tiempo) que tiene ciertas propiedades estadísticas y que puede ser descrito por un conjunto indexado de variables aleatorias [31, 37, 43].

A continuación se muestra un ejemplo, para el cual se define el comportamiento de un proceso estocástico Y medido con respeto a un instante t=24 un instante t y un instante t+T, para los cuales la variable aleatoria Y, se comporta con distribución normal. También se observa, la correlación que puede existir entre la variable Yt y la variable Yt+T.

Monografias.com

Figura 1. Evolución de un proceso Estocástico.

Los procesos estocásticos, se definen matemáticamente a través de las siguientes expresiones [31, 37, 43].

Donde el valor esperado, también promedio estadístico, se conoce como, el promedio de las realizaciones en el ensamble o sea en el conjunto de realizaciones de X donde:

Monografias.com(Ec.01)

La varianza del proceso: Monografias.com(Ec.02)

una forma más fácil de calcular la varianza es:

Monografias.com(Ec.03)

La función de correlación del proceso se define para dos variables temporales cualesquiera X1, X2 como:

Monografias.com(Ec.04)

en el caso en que tk = ti se tiene que el valor cuadrático medio del proceso estocástico es una función de una variable temporal.

Monografias.com(Ec.05)

Proceso estacionario.

Al utilizar un modelo estocástico, por lo general se está interesado en predecir el comportamiento del proceso en el futuro y para ello es necesario basarse en la historia del mismo. Estas predicciones no serán correctas a menos que las condiciones futuras sean análogas a las pasadas.

Se define un proceso estocástico como estacionario sí: sus propiedades estadísticas son invariantes ante una traslación del tiempo. Es decir, el mecanismo físico que genera el experimento no cambia con el tiempo.

Un proceso X(t) es estacionario en sentido estricto si la función de densidad de probabilidad conjunta de cualesquiera de sus n variables aleatorias, medidas en instantes t1,...,tn, permanecen constantes cuando transcurre cualquier intervalo de tiempo e, de la forma que se ve a continuación [37, 43, 11].

Monografias.com

Sin embargo esta es una condición muy fuerte ya que implicaría estudiar infinitas funciones.

Por otra parte se entiende que un proceso X(t) es débilmente estacionario si cumple con las siguientes restricciones:

E[X(t)] = &µ (independiente del tiempo) (Ec.06)

Donde µ es la media del proceso

Monografias.comMonografias.com(Ec.07)

(Dependiendo solo de la distancia entre los tiempos considerados)

Proceso ergódico.

De esta forma se llega al concepto de proceso ergódico, que no es más que un proceso estocástico estacionario en el que la media y la varianza se pueden estimar con un número finito de datos, donde los parámetros estadísticos calculados sobre un conjunto de registros posibles son iguales a los correspondientes obtenidos a lo largo del tiempo sobre cualquier registro representativo del proceso.

Se dice que un proceso es ergódico, sí sus promedios estadísticos coinciden con los temporales, entonces sólo se necesita una realización del proceso para conocer los promedios estadísticos. No obstante, la ergodicidad de un proceso es una condición bastante fuerte. En otras palabras, esta condición nos expresa que cualquier medida estadística sobre el proceso se puede realizar sobre el promedio temporal de cualquiera de las funciones muestra del mismo [5, 11, 31, 43]. Probar el carácter ergódico de un proceso aleatorio no es fácil, pero de forma menos restrictiva se puede decir que un proceso es ergódico en la media si cumple con la restricción:

Monografias.com(Ec.08)

Es decir, si el valor esperado del proceso y el promedio temporal de sus funciones muestra son iguales con probabilidad 1. Dicho de forma clara, el promedio en el ensamble coincide con los promedios temporales.

Dado que la media temporal µT no depende del tiempo, para que un proceso sea ergódico en media, es necesario que la media del proceso µx sea constante. Esto es posible, si el proceso, es estacionario cumpliendo con la restricción (Ec.06). &µx= E[X(t)]

De igual forma se puede enunciar, que un proceso es ergódico en la autocorrelación, si se puede definir la autocorrelación temporal del proceso como:

Monografias.com(Ec.09)

Luego, sí se verifica, que RX(t) = E[X(t) X(t + t)].

Entonces se puede construir el proceso Zt(t) = X(t) X(t + t ), donde E[Zt(t)] = RX(t )

Entonces X(t) es ergódico en autocorrelación Zt(t), es ergódico en media.

Autosimilaridad

El término autosimilaridad desciende de la geometría fractal y se define como ciertas figuras que mantienen su apariencia vistas desde diferentes escalas. Se dice que una estructura es autosimilar, si la misma, puede ser cortada arbitrariamente en trozos pequeños, cada uno de los cuales es una réplica de la estructura en sí mismo [41]. Estas figuras geométricas, se describen también como elementos simétricos a cambio de escalas, invariantes a cambios en su escala de análisis o lo que es lo mismo, mantienen su apariencia bajo distintos grados de magnificación. Es decir mantienen una estructura similar frente un amplio rango de escalas. Más rigurosamente pueden definirse como figuras o estructuras donde la parte es semejante al todo, como se muestra a continuación [41].

Monografias.com

Figura 2. Ejemplo de autosimilaridad. A la izquierda una superficie rugosa, creada por la curva de Koch. A la derecha, la evolución de un proceso estocástico.

Parar series temporales, que es el caso que ocupa este trabajo, se dice un proceso Xt continuo en el tiempo, es autosimilar, con parámetro de autosimilaridad (H) si satisface la condición:

Monografias.com

Donde a es la escala temporal.

A la propiedad definida por la ecuación (Ec. 1.1) se le denomina propiedad de escalado y la misma implica que un proceso es autosimilar si un escalado en el tiempo preserva su distribución estadística [13].

Los valores extremos que caracterizan el parámetro de autosimilaridad H son [38, 41, 48].

  • 1. H>1 Para el caso en que se pierde la estacionariedad del proceso [3].

  • 2. H=1 Para procesos completamente autosimilares. A este nivel la aleatoriedad desaparece por tanto carece de interés objetivo (Indicaría un comportamiento determinístico).

  • 3. H=0.5 Para procesos completamente aleatorios, ejemplo de ellos el ruido blanco gaussiano donde la autosemejanza es nula (Comportamientos puramente aleatorios).

  • 4. H<0.5 Estos valores reflejan la antipersistencia en el sistema.

Los valores de 0.5<1 se corresponden con procesos autosimilares que presentan correlación o dependencia a largo plazo (LRD). Es bueno aclarar que conceptualmente hay diferencias entre autosimilaridad y dependencia a largo rango. De hecho existen procesos autosimilares que no presentan LRD y viceversa. Sin embargo bajo la restricción de 0.5<1, existe una doble implicación de autosimilitud y dependencia a largo rango. Esto provoca que muchas veces se usen como conceptos idénticos [3, 38]. Para el análisis de Autosimilaridad, el estadígrafo Hurst (H) solo tiene valores de interés práctico en esta investigación sí (0<1).

Definición de Autosimilaridad en tiempo continuo.

En tiempo continuo se puede definir un proceso como autosimilar a través de la propiedad de escalado definida en (Ec. 1.1). En el caso de un proceso estocástico estacionario X(t), se puede decir que el mismo es estadísticamente autosimilar con parámetro (0.5 < H < 1) sí, Monografias.comy a>0 se cumple que a-HX(at) tiene las mismas propiedades estadísticas que X(t) [48]. Esto se expresa en las condiciones siguientes:

Monografias.comMedia (Ec. 1.2)

Monografias.comVarianza (Ec. 1.3)

Monografias.comAutocorrelación (Ec. 1.4)

El valor del parámetro H es una medida de la persistencia de la dependencia a largo rango del proceso estocástico (LRD). Un valor de H = 0.5 indica la ausencia de autosimilaridad. Cuanto más cerca esté de 1 al valor de H, mayor es el grado de la correlación a largo rango (LRD).

Definición de Autosimilaridad en tiempo discreto.

Si se considera un proceso estocástico estacionario X(t) que se define en los puntos discretos de tiempo de la siguiente forma:

X(t)?{X(t), t=1, 2, 3,.... ....n}

De forma tal, que si se tiene X como la serie estacionaria en el tiempo, se puede definir entonces X(m), como la serie agregada, con nivel de agregación (m): X(m) = { Xk(m), k = 0,1,2,....}, resultante de promediar la serie de tiempo original sobre bloques adyacentes no superpuestos o solapados de tamaño m y se puede expresar como:

Monografias.com(Ec. 1.5)

A manera de ejemplo se puede definir X4 como:

Monografias.com

De esta forma se puede ver la serie agregada a modo de técnica de compresión en la escala de tiempo. Donde X1 se considera la mayor resolución posible (la serie original) y el proceso X4 es el mismo proceso X comprimido por un factor de 4. Promediando sobre cada grupo de 4 puntos, donde se pierde el detalle fino del proceso; mientras que si se mantiene la estadística (media, varianza, correlación, etc.) a través de la compresión estamos en presencia de un proceso autosimilar [21].

La ecuación (Ec.1.5) anterior puede definirse como la serie agregada (con nivel de agregación m), resultante de promediar la serie original Xk (de tamaño N) sobre bloques no solapados de tamaño m. De la cual sale la siguiente definición de autosimilaridad para una serie estacionaria:

Una serie estacionaria Xk se denomina exactamente autosimilar sí para todos los niveles de agregación m se cumple que:

Monografias.com(Ec. 1.6)

Otra definición se pudiera expresar de la siguiente forma:

Un proceso es exactamente autosimilar con parámetro ß (0< ß <1) sí para todo m se cumple que:

Monografias.comVarianza (Ec. 1.7)

Monografias.comAutocorrelación (Ec. 1.8)

Es demostrable que el parámetro ß está relacionado con H de la forma H=1 - (ß/2). Donde ß, sería la pendiente del ajuste lineal de la gráfica logarítmica de X(m), vs m. Además, para un proceso ergódico estacionario, ß=1 y la varianza cae a razón de 1/m, según [3].

Se puede deducir entonces que para procesos autosimilares, la autocorrelación del proceso agregado tiene la misma forma que el proceso original. Esto es un indicador de que el grado de variabilidad y rafagosidad a diferentes escalas de tiempo debería ser el mismo [48]. Otra de las características de la autocorrelación en un proceso autosemejante agregado es que la misma no tiende a (0) a medida que m?8. Este tipo de análisis coincide con el planteamiento, de que una correlación R(t)=0 Monografias.com, es consistente con el Ruido Blanco Gaussiano (un proceso estocástico puramente aleatorio donde H=0.5) [48].

Dependencia a corto y largo plazo.

Dependencia a largo rango (LRD).

Una de las propiedades más significativas de los procesos autosimilares es la dependencia o correlación a largo rango (LRD). La dependencia a largo plazo también recibe otros nombres como efecto Josehp o José en alusión al patriarca bíblico. También este se conoce como fenómeno de persistencia según la terminología de Mandelbrot [24, 41].

"Vienen siete años de gran abundancia en todo Egipto.

Tras ellos seguirán siete años de hambre..."

Génesis, 41:29-30

La parábola bíblica remite a la idea, de que los años de lluvia o los de seca, tienden a agruparse en períodos de sequía o lluviosos. Visto de otra manera un período de crecimiento es seguido de forma análoga de otro. Es decir, en un proceso persistente, sí las fluctuaciones del proceso muestran un incremento en el pasado, entonces se supone un incremento en el promedio de las fluctuaciones en el futuro. Como característica estos procesos tienen valor de (0.5<1). Por otra parte la curva generada por el proceso tiene un aspecto "suave" lo que se puede ver en la figura a continuación [41].

Monografias.com

Figura 3. Curvas generadas por un proceso FBM para distintos valores de H [17].

La característica LRD implica que por muy pequeños que sean los valores de la función de autocorrelación, a medida que aumentamos la escala, su acumulación se hace mayor. Dicho de otra forma, el tráfico medido en un instante de tiempo (t) y el tráfico medido en un instante posterior (t+t0), guardan relación, es decir, no son independientes, aunque (t0), sea muy elevado [6].

Otra de las características de los procesos que presentan dependencia a largo rango es que su función de autocorrelación presenta una caída asintótica de tipo hiperbólico [24]. Tal como se observa en el caso de la figura siguiente.

Monografias.com

Figura 4. Función de Autocorrelación para un proceso FGN con H=0.72 [17].

También la dependencia a largo rango está definida en términos del comportamiento de la covarianza ?(t) [48]. De forma tal que estos procesos presentan una caída hiperbólica de la covarianza de la forma:

Monografias.coma medida que Monografias.com(0 < ß < 1) (Ec. 2.1)

Donde ß es un parámetro conocido y relacionado con el parámetro Hurst de la forma: Monografias.com

Matemáticamente se pueden definir como procesos que exhiben dependencia a largo rango aquellos cuya función de autocorrelación ?(k) es no sumable [24]:

Monografias.com(Ec. 2.2)

El fenómeno de dependencia a largo plazo refleja la persistencia de un proceso autosimilar además, la existencia de ráfagas en todas las escalas de tiempo.

Dependencia a corto rango (SRD).

La dependencia o correlación a corto plazo es conocido como efecto de antipersistencia o efecto Noé (en alusión también al patriarca bíblico). Este efecto, es observado sobre todo en los modelos tradicionales de tráfico.

El nombre de efecto Noé proviene del relato del patriarca que remite a la idea acerca de la desigualdad de las precipitaciones en el Medio Oriente [41].

".en ese día fueron rotas todas las fuentes del gran abismo y fueron abiertas las compuertas del cielo.

Y llovió sobre la tierra cuarenta días y cuarenta noches."

Génesis, 7: 11-12

En un proceso antipersistente se puede observar que un período de crecimiento va seguido de otro de decrecimiento o viceversa. Dentro de sus características principales está que el parámetro H se encuentra entre (0<0.5) y la curva que genera este tipo de procesos, tiene un mayor contenido de picos, por lo que se ve más irregular que la generada por los procesos LRD como se puede observar en la figura (3).

Este tipo de proceso se caracteriza por tener una función de autocorrelación ?(k) sumable en contraste con los procesos (LRD) [24]:

Monografias.com(Ec. 2.3)

Los mismos cumplen con la condición de que su autocovarianza decae al menos tan rápidamente como una exponencial, lo mismo ocurre con sus funciones de autocorrelación [24, 48]:

Monografias.coma medida que ?k??8 (0 < a < 1) (Ec. 2.4)

Es demostrable que para los procesos (SRD) la función de densidad espectral S(?) está acotada en el origen.

Densidad espectral de potencia y autocovarianza.

Se pueden dar expresiones equivalentes de la dependencia a largo rango en el dominio de la frecuencia. Específicamente la densidad espectral de potencia obedece a una ley de potencia cerca del origen [24, 48] de la forma:

Monografias.comsi ??0 (Ec. 3.1)

donde H es el parámetro de autosimilaridad y ? la frecuencia.

La densidad espectral para un proceso estocástico en tiempo discreto se define como:

Monografias.com(Ec. 3.2)

Monografias.com(Ec. 3.3)

donde ?(k) es la función de autocorrelación [24, 48].

De esta forma cuando la densidad espectral de potencia posee un polo en el origen estamos en presencia de un proceso autosimilar que presenta LRD [24, 48] de la forma:

Monografias.com(Ec. 3.4)

En contraste, los procesos SRD están caracterizados por, una densidad espectral de potencia que permanece finita mientras ??0. Esto ocurre cuando H=0.5 [24, 48] como se ve a continuación:

Monografias.com(Ec. 3.5)

Autocovarianza y el espectro de potencia.

El nombre de "función de densidad espectral" se deriva del hecho, de que S(?) es realmente una función de densidad de la varianza del proceso sobre todo el rango de frecuencias que van desde (-p, p).

Según el teorema de Wiener-Kinchine [5], la densidad espectral de un proceso estocástico X(t) definido en un tiempo discreto { X(t), t=0, 1, 2,.... }, se puede estimar, mediante la Transformada de Fourier, sobre un período N de la siguiente forma:

Monografias.com(Ec. 3.6)

Donde IN, se conoce como el espectro muestral, o periodograma, siendo el mismo un estimador obvio del espectro de potencia.

Por otra parte la densidad espectral de potencia o espectro de S(?) se define como la Transformada de Fourier de la autocovarianza ?x(m) (anexo 1). Para el rango de frecuencias ? entre (-p, p) que se describe como:

Monografias.com(Ec. 3.7)

de forma análoga, puede verse como que el inverso de la Transformada de Fourier (anexo 1) del espectro de potencia o la densidad espectral de potencia nos da la autocovarianza ?x(m). Para el rango de frecuencias ? entre (-p, p), se define de la forma que se muestra a continuación:

Monografias.com(Ec. 3.8)

Se puede definir también la autocovarianza de una serie estacionaria X(n),con media µ(x) y varianza Monografias.comcomo [24]:

Monografias.comMonografias.com(Ec. 3.9)

De forma análoga para series finitas de longitud N, el estimador de la autocovarianza viene dado por la autocovarianza muestral. Aprovechando la paridad de la función y tomando solo los valores no negativos de (m) se obtiene la función [24]:

Monografias.com; m=0, 1, 2,....., N-1 (Ec. 3.10)

Distribuciones de cola pesada.

Las distribuciones de cola pesada pueden ser aplicados para caracterizar las densidades de probabilidad que describen el proceso de tráfico como: paquetes a intervalo de tiempo y longitud de ráfagas. Este tipo de distribución en muchos casos acompaña a los procesos estocásticos autosimilares y las mismas cumplen con las siguientes restricciones.

La distribución de una variable aleatoria X se dice que es de cola pesada sí:

Monografias.comdonde x?8 y 0(Ec. 4.1)

Donde la probabilidad (P), de que la variable aleatoria X con una distribución concreta sea mayor que x viene dado por la ecuación anterior (Ec. 4.1).

La distribución de cola pesada más conocida es la de Pareto con parámetros k y a donde (k,a>0), con una densidad y una función de distribución [38, 48]:

Monografias.comsi Monografias.com

Monografias.com(Ec. 4.2)

Monografias.compara (x>k; a>0) (Ec. 4.3)

y el valor de la media es:

Monografias.compara (a>1) (Ec. 4.4)

Donde el parámetro k especifica el mínimo valor que la variable aleatoria puede tomar. El parámetro a determina la media y la varianza de la variable aleatoria.

Para Monografias.comentonces la distribución tiene varianza infinita y si Monografias.comtiene media y varianza infinitas. Debido a esto la probabilidad de valores muy desviados de la media no es menospreciable. Esto provoca tiempos de espera elevados en colas e incluso desbordamientos de buffers [44].

La distribución de colas de Pareto presenta un comportamiento autosimilar para escalas pequeñas de tiempo (del orden de los segundos) según [27], por lo que ha sido comúnmente usada para caracterizar tráfico en redes de telecomunicaciones.

Efectivamente, se puede probar que un proceso cuyos niveles de actividad (tasa media de generación) oscilan de acuerdo a una temporización de colas pesadas presentará características LRD [38].

Procesos Tradicionales y Autosimilares.

Frente a los procesos autosimilares que exhiben correlación a largo plazo, los empleados tradicionalmente en el análisis de prestaciones de redes de comunicaciones no exhiben correlación (por lo general son procesos de renovación) o muestran una estructura de correlación a corto plazo. (básicamente para modelar fuentes de voz y video). Los procesos que exhiben SRD son fundamentalmente de dos tipos: los procesos ARIMA [38] de orden finito y los procesos de Markov con espacio de estados finito. Por otra parte los principales procesos autosimilares empleados son los Ruidos Gaussianos Fraccionales, (FGN, de sus siglas en inglés) y la familia de procesos ARIMA fraccionarios, F-ARIMA [30, 35, 39].

Principales procesos Tradicionales.

  • ARIMA.

Los Procesos Integrados Autorregresivos de Medias Móviles (ARIMA, de sus siglas en inglés) han sido ampliamente aplicados en la modelación estocástica para exhibir SRD debido a su flexibilidad para modelar estructuras de correlación, sobre todo a corto plazo. Estos procesos incluyen tres tipos de procesos diferentes [16, 50]:

  • Los procesos autorregresivos de medias móviles (ARMA, de sus siglas en inglés). La particularidad de estos procesos es que en ellos el valor de la muestra actual X[n] se obtiene a partir de Na valores anteriores de X[n] y Nb valores de un ruido blanco aleatorio W[n] denominado proceso de innovación, como se describen a continuación [7]:

Monografias.com(Ec. 5.1)

Donde Na y Nb se corresponden con los órdenes de la parte AR y MA respectivamente y los coeficientes ai y bi son diseñados para imitar los primeros coeficientes de autocorrelación [7].

  • Los procesos Autorregresivos (AR). Se pueden ver como un filtro todo polos y cuya ecuación se define como [38]:

Monografias.com(Ec. 5.2)

donde w(n) representa los valores de un proceso aleatorio y Na corresponde al orden del proceso AR.

  • Los procesos de Medias Móviles (MA). Se pueden ver como un filtro todo ceros y cuya ecuación se define como [38] :

Monografias.com(Ec. 5.3)

donde w(n) representa los valores de un proceso aleatorio y Nb corresponde al orden del proceso MA.

  • Modelos de Renovación.

Los modelos de renovación son una extensión de los modelos de tráfico sin memoria, en el que los intervalos de tiempo entre llegadas de paquetes son independientes e idénticamente distribuidos (i.i.d.) [38].

El tiempo que falta esperar hasta ver la llegada del próximo paquete depende de hace cuanto tiempo llegó el último paquete. Aunque esta memoria incrementa la complejidad analítica de los procesos generales de renovación con respecto a los procesos sin memoria, sigue siendo nula la correlación entre los tiempos entre llegadas de paquetes consecutivos [38].

  • Procesos Markovianos.

El carácter intermitente del tráfico, es decir por ráfagas desde un principio impuso, la necesidad de introducir correlación en los modelos de tráfico, ya que la llegada de paquetes se encuentra fuertemente correlacionada. En un proceso markoviano, la correlación viene dada por el hecho de que el estado actual depende exclusivamente del estado anterior [2, 20].

En la literatura se han propuesto varios tipos de procesos markovianos, entre los que se pueden destacar las cadenas de Markov [2, 20, 31]; también se pueden citar los procesos BMAP (Batch Markovian Arrival Processes) [2, 19]; que no son más que un caso particular de los Procesos de Llegadas Markovianos (MAP, de sus siglas en inglés). También los Procesos de Poisson Modulados por Markov (MMPP, de sus siglas en inglés) [9, 12, 28, 32, 46] y los procesos semi_markovianos.

Es bueno aclarar que los procesos MMPP bajo ciertas condiciones están siendo empleados en la actualidad para modelar procesos autosimilares y LDR con el objetivo de simplificar los modelos [32, 46].

Principales procesos Autosimilares.

  • FBM y FGN.

Dentro de los procesos estadísticamente autosimilares uno de los más utilizados es el FBM Movimiento Browniano Fraccionario (FBM, de sus siglas en inglés) BH(t), introducido por Mandelbrot [24]. El mismo es considerado como un proceso aleatorio donde BH(0)=0, Según [6, 39, 44]. Por otra parte el mismo posee incrementos estacionarios normalmente distribuidos, con media cero, según [6].

De esta forma se puede entender el movimiento browniano ordinario como un caso especial del FBM con H=0.5.

Los movimientos brownianos fraccionarios, no son estacionarios, pero sí lo son sus incrementos o versión diferenciada. De forma tal, los procesos resultantes de considerar incrementos FBM, se denominan Ruido Gaussiano Fraccionario (FGN). Por tanto, sí X(t), es un proceso FBM, entonces la secuencia de incrementos de Xt viene dada por Xt =BH(t)- BH(t-1). Según [15] los procesos FGN, son procesos gaussianos estacionarios, exactamente autosimilares.

  • F-ARIMA.

Los procesos F-ARIMA, son una generalización de los procesos ARIMA, vistos en el epígrafe 1.5.1.1. Según se muestra en [16, 35] un proceso ARIMA (p,d,q) donde p y q son los coeficientes de la parte AR y MA respectivamente del proceso ARIMA. El mismo está definido por la ecuación:

Monografias.compara Monografias.com(Ec. 5.4)

donde at son las variables aleatorias (i.i.d.), con media nula y varianza sa2, donde Monografias.comy ?(B), son polinomios de orden p y q respectivamente y d es un entero.

Según lo expresado en [24] los procesos ARIMA fraccionarios, F-ARIMA exhiben dependencia a largo rango, LRD si el parámetro d se encuentra entre: (0<d<1/2). Donde d, se relaciona con el parámetro de autosimilaridad H de la forma d=H-1/2.

Procesos tradicionales frente a los autosimilares.

A modo de resumen, los procesos autosimilares se caracterizan por:

  • 1. Una varianza de la media muestral que decrece más lentamente que el inverso del tamaño de la muestra.

Monografias.comcuando m?8, (0<ÃY><1) (Ec. 5.5)

donde ß se relaciona con H de la forma Monografias.com

  • 2. Exhibir dependencia a largo plazo, ya que su función de autocorrelación decrece hiperbólicamente de la forma:

Monografias.comcuando k?8, (Ec. 5.6)

implicando que no sea sumable y que los procesos agregados posean una función de autocorrelación no degenerativa.

Monografias.comy Monografias.comcuando m?8 (Ec. 5.7)

  • 3. Una densidad espectral que posee un polo en el origen.

Monografias.comdonde f = 1- ß, a>0 (Ec. 5.8)

  • 4. Una apariencia visual enormemente "similar" cuando se representan las secuencias agregadas en distintas escalas temporales [25] figura (1).

En contraste, los procesos tradicionales comparten las siguientes características [25]:

  • 1.  Una varianza de la media muestral que decrece proporcionalmente con el inverso del tamaño de la muestra.

Monografias.comcuando m?8, (Ec. 5.9)

  • 2. Exhibir dependencia a corto plazo, ya que su función de autocorrelación decrece exponencialmente,

Monografias.comcuando Monografias.com(0 ) (Ec. 5.10)

implicando que sea sumable y que la función de autocorrelación de la secuencia agregada tienda a cero a medida que aumenta el nivel de agregación, indicando que los procesos agregados tienden a ruido blando. (procesos netamente aleatorios donde H=0.5).

Monografias.comy Monografias.comcuando m?8 (Ec. 5.11)

  • 3. Una densidad espectral de, potencia acotada en el origen.

  • 4. La representación visual de las secuencias agregadas tiende a ruido blanco a medida que aumenta la escala temporal.

Métodos de estimación del parámetro de autosimilaridad H

Un problema fundamental en el análisis de procesos autosimilares o más concretamente de series temporales que exhiben LRD, es la estimación del grado de autosimilaridad. Esta problemática viene dada por la complejidad que introducen los métodos de estimación y por la naturaleza de los mismos. Además esto se agrava cuando los diversos estimadores se aplican sobre series de tráfico real finitas y con posibles problemas de estacionariedad [38].

Los métodos propuestos en la literatura podrían clasificarse en dos grandes grupos:

  • Métodos gráficos de regresión lineal donde se calcula algún estadígrafo Y(x) que se comporta asintóticamente de la forma xaH+b donde (H, es el parámetro de autosimilaridad y a, b son constantes) para un determinado conjunto de valores de x y que por tanto, están basados en obtener por medio de regresión lineal por mínimos cuadrados, la recta que mejor se ajuste (para dichos valores de x) a la representación de log(T(x)) frente a log(x). Pudiendo así obtener H a partir de la pendiente del ajuste de dicha recta [24].

  • Métodos basados en Estimadores de Máxima Verosimilidad (MLE, de sus siglas en inglés) para H, que intentan minimizar las diferencias entre el periodograma de la serie y el espectro teórico de esta [24].

Los métodos del primer grupo son relativamente sencillos y rápidos. Su principal inconveniente reside en tener que estimar un comportamiento asintótico a partir de un número finito de muestras, lo que hace que la estimación del parámetro H dependa considerablemente de la elección de los valores de X [24]. Por tal motivo es fundamental valerse de las representaciones gráficas para, por un lado verificar que el conjunto elegido de valores de X se corresponde con la zona del comportamiento lineal y por otro lado, comprobar de forma gráfica, si la recta es un buen ajuste de los puntos representados.

Es importante destacar que estos métodos permiten obtener una estimación puntual poco exacta del parámetro H, ya que la obtención de intervalos de confianza es enormemente difícil. No obstante son sumamente útiles para detectar la presencia de LRD y hacerse una idea de la magnitud de la misma. Este grupo da cabida a todos los métodos basados en el análisis temporal de las series agregadas, además de otro método basado en la regresión lineal sobre el periodograma.

Por otra parte, los métodos basados en MLE son de un mayor rigor matemático y llevan consigo un mayor coste computacional. Los mismos se basan en la minimización de funciones que suponen previamente una forma al espectro y que introducen siempre cierto sesgo o truncamiento a la medida. Sin embargo son bastante flexibles y eficientes desde el punto de vista de la interferencia estadística y permiten obtener intervalos de confianza para los valores estimados de H [24].

Dentro de los métodos más empleados para la determinación del parámetro H se encuentran los siguientes:

  • El método R/S Plot, perteneciente al primer grupo de estimadores, es decir a los métodos gráficos de regresión lineal. Introducido por Hurst [41], famoso científico en el campo de la hidrología que dedicó su vida a estudiar el Nilo. También conocido como análisis del rango de rescalado (rescaled range analysis). Este método da buenos resultados para series largas y valores de n logaritmicamente equiespaciados. El análisis R/S es capaz también de detectar la existencia de ciclos en las series y determinar la longitud de los mismos, incluso bajo presencia de ruido en los datos [14, 17, 47].

  • El método Varianza-Tiempo o de las varianzas agregadas que pertenece al grupo de los métodos gráficos, probablemente sea el método de regresión lineal más aplicados junto con el R/S Plot, por su fácil implementación además de ser modesto en cuanto a consumo de recursos computacionales. Su principal desventaja estriba en que se necesita que el tamaño de la serie a analizar sea bastante largo. Por otra parte el tamaño de los bloques m no debe ser muy pequeño ya que esto puede afectar los efectos de la estructura de la correlación a corto plazo. De hecho tampoco deben usarse bloques m altos ya que los mismos pueden afectar la estimación de la varianza. En fin en investigaciones realizadas en redes de altas velocidades por [24], se afirma que para m desde el 0.1 hasta el 1% de la muestra da buenos resultados.

  • El método de Higuchi, perteneciente al primer grupo de métodos gráficos de regresión lineal también conocido como método de la dimensión fractal. Se basa, en emplear una ventana deslizante para computar las series agregadas. Esta característica lo hace mucho más intensivo computacionalmente hablando pero da mejores resultados para series cortas.

  • Otro método gráfico es la regresión sobre el periodograma o regresión sobre el dominio espectral. El método fue propuesto inicialmente por Geweke y Porter-Hudak se conoce como estimador GPH [39], aunque de una forma levemente distinta a como se describe y utiliza en este trabajo. El mismo ha sido mejorado por Taqqu y Teverovsky y por Robinson [30, 35, 39, 47].

De los análisis MLE los más recurridos para el cálculo del parámetro Hurst son los que están basados en el método de estimación de Whittle [24]. Su principal desventaja radica en que para poder utilizarlo es necesario conocer la forma paramétrica del espectro de potencia. Por eso este método solo es aplicable a procesos para los cuales esta se halla disponible o es conocida, ejemplo de ello, los procesos FGN y F-ARIMA(p,d,q). También se puede decir que el método es computacionalmente costoso.

La Versión Discreta de Whittle propuesta en el año 1983 por Graf83, es la versión más adecuada cuando se conoce el modelo correcto [24]. La propuesta de este método es aplicar una aproximación de la expresión a minimizar del método original, a través de una suma de Riemann de las frecuencias ?k=(2p/N)*k, con lo cual se alivia el costo computacional.

El método de Whittle Agregado, al cual se le han hecho importantes aportes en los estudios realizados por (Leland et al), en [25]. Es de suma importancia para procesos en los que no se puede asegurar nada acerca de su densidad espectral.

Este método se apoya en el siguiente teorema:

Teorema del límite central para procesos autosimilares.

Sea Xj una serie temporal gaussiana estacionaria, de media cero y sea Y un proceso FGN estándar, entonces cuando m?8 (nivel de agregación).

Monografias.com

Es decir que para el caso de H entre los valores de 1/2<1, las series agregadas, de una serie temporal gaussiana, de varianza finita, cuya función de autocorrelación exhibe una caída hiperbólica con LRD, convergen asintóticamente en distribución a un proceso FGN.

Este teorema, permite suponer que para una serie temporal de tamaño N, cuya función de autocorrelación exhibe una caída hiperbólica con LRD, si m y N/m son lo suficiente grandes y la varianza es finita; el proceso FGN (visto en el epígrafe 1.7.2.1) es una buena aproximación de las secuencias agregadas de dicha serie, incluso aunque esta no sea gaussiana [24].

Básicamente lo que hace este método es suponer que la forma del espectro de las secuencias agregadas tiene la forma del espectro en un proceso FGN y calcular el estimador de Whittle para estas agregaciones en vez de hacerlo para la serie original. Su principal desventaja es que no se puede conocer a priori el nivel de agregación m apropiado para el cálculo.

El otro caso es el estimador de Whittle Local propuesto por Robinson en 1995 [35, 39]. Este es el método que se emplea en este trabajo, se explica detalladamente en el siguiente capítulo. Por ahora se puede decir que el mismo solo especifica la forma paramétrica de la densidad espectral para frecuencias próximas al origen.

Fractales

Los fractales aparecieron en las matemáticas hacia finales del siglo XIX, inicialmente con el nombre de curvas no derivables o no rectificables. Se trataba de curvas o superficies interminablemente plegadas, líneas infinitas compactadas de forma regular sobre una superficie finita. Es decir superficies que no se les puede hallar la tangente o no derivables en ningún punto [36, 41].

El término fractal lo introduce Mandelbrot en la década de los 70 y el mismo proviene del latín fractus "interrumpido o irregular".

"Yo acuñé el nombre de fractal del adjetivo latín Fractus. El correspondiente verbo Latín Frangere significa "romper", crear fragmentos irregulares" Mandelbrot

En su primer intento, Mandelbrot no presentó una definición formal de estos objetos. Simplemente agrupó bajo este nombre a las formas que comparten las características de ser rugosas y autosimilares, situándolas entre los objetos euclidianos y las figuras geométricamente caóticas (anexo 2), las cuales no presentan ningún patrón geométrico regular. Poco después, él mismo, amplió la definición de fractal, tomándolos como el conjunto de formas con dimensión fraccional. Dicho término es aplicable a objetos en el espacio o variaciones en el tiempo que tienen una forma de auto similitud y no pueden ser descritos con una escala de medición de valor entero. En fin la dimensión fractal es una medida de cuan complicada o compleja es una figura auto similar.

Es conocido que la geometría es la rama de las matemáticas que trata las propiedades de los espacios y los objetos. Convencionalmente en la geometría euclidiana la medida del objeto se considera como la longitud elevada a la dimensión. Para todos es sabido que un punto tiene dimensión 0, una recta 1, una superficie plana 2 y un cuerpo sólido 3. Conocidas también como dimensiones topológicas. De esta forma puede verse que:

Superficie = longitud2

Volumen = longitud3

Dimensión Fractal.

El concepto intuitivo de dimensión se puede expresar de una manera muy sencilla bajo la forma de la ley de escala donde a = sD. En algunos fractales clásicos la dimensión fraccionaria se obtiene fácilmente de despejar D de la igualdad anterior de la forma [41].

D = log(a) / log(s). (Ec. 6.1)

Veamos así que por ejemplo la curva de Koch, mostrada a continuación, puede construirse juntando cuatro porciones iguales, siendo la curva total tres veces mayor que cada una de las partes que la forma.

Monografias.com

Figura 5. Desarrollo fractal de iterar la curva de Koch [49].

Fractales y la Autosimilaridad.

La geometría fractal fue creada por el matemático Benoit Mandelbrot cuando investigaba la autosimilitud que se producía en los precios del algodón en un largo período de tiempo.

Podemos definir la autosimilaridad en una estructura si la misma puede ser cortada en trozos pequeños, cada uno de los cuales es una pequeña réplica de la estructura completa [36].

En estricto rigor solo se aplica el concepto de autosemejanza o autosimilaridad a los fractales matemáticos, mientras que en los fractales naturales o físicos se aplica el concepto de autoafinidad (que la parte es semejante al todo, solo en sentido global), ya que su fractalidad es solamente estadística y poseen, en consecuencia, un escalamiento anisotrópico (que no tiene las mismas propiedades en todas las dimensiones de análisis), lo que impide que una parte amplificada de la figura mantenga exactamente las características de la figura como un todo [36, 41].

La DF y la Autosimilaridad

A partir de la definición de autosimilitud se puede calcular la dimensión fractal de un objeto o conjunto fractal. Para llegar a la deducción de la fórmula se parte del proceso de particiones en objetos de dimensiones euclidianas.

Definiendo la dimensión fractal en torno a la autosimilaridad:

Un objeto fractal se puede descomponer en Monografias.comcopias y si una de ellas se amplia n veces, se produce el objeto original. Formalmente se expresa como sigue [49]:

Monografias.com(Ec. 6.2)

donde, n es el factor de ampliación (o de división)

Monografias.comes la dimensión

Monografias.comnúmero de piezas similares que hay en el objeto original

Si se aplica el logaritmo a la ecuación anterior (Ec. 6.2), se obtiene la relación.

Monografias.com(Ec. 6.3)

Donde Monografias.comse denomina como Monografias.comque significa que es la dimensión Haussdorff-Besicovitch. También se le denomina Monografias.comque es la dimensión de auto-similitud; significando con esto que la dimensión de auto similitud es la de Haussdorff en los objetos autosimilares [49].

El aspecto más notable de los objetos fractales es que al manifestarse permiten observar una de sus n dimensiones, lo que podría ser suficiente para reproducir el sistema dinámico por completo, dado que cada porción de la figura presenta una parte del todo. Esto se puede asumir burdamente como que: los sistemas dinámicos van dejando huellas fractales que dan cuenta de las características del sistema en general y de sus partes. Esto ocurre debido a la característica de sibisimilitud (autoafinidad) [41].

Fractales y series temporales.

Íntimamente ligada al concepto de dimensión fractal está la definición del exponente Hurst. La mayoría de los algoritmos para calcular la dimensión fractal estiman dicho exponente, que está relacionado con el comportamiento de la serie a analizar a distintas escalas.

De este modo se puede calcular la dimensión fractal a través del cálculo del estadígrafo H aplicando la ecuación [34, 41]:

Monografias.com(Ec. 6.4)

donde De es la dimensión euclidea (en el caso de las series temporales igual a 2) y H el exponente de Hurst. Que no es más que un cuantificador de la dinámica de la serie temporal. Dándole otro enfoque, distinto al del inicio del capítulo.

El exponente Hurst por demás, es un cuantificador de la dinámica caótica de un sistema a analizar. No obstante la complejidad de estos sistemas, puede ser estimada a través de otros exponentes como la dimensión de la correlación o el exponente Lyapunov (anexo 2).

Conclusiones

A modo de resumen, se puede decir que en este capítulo se han presentado, los conceptos y definiciones más importantes a tener en cuenta en este trabajo. Sobre la base de los conocimientos expuestos con anterioridad, en los próximos capítulos se instrumentarán una serie de algoritmos y análisis, con la finalidad de caracterizar el tráfico del Nodo Central de Reduniv, que es la razón de ser de esta investigación.

Descripción de la metodología propuesta.

Introducción.

De los métodos descritos con anterioridad para determinar el parámetro de autosimilaridad se escogieron tres para realizar este trabajo. De ellos dos pertenecen al primer grupo de los estimadores gráficos de regresión lineal y se escogió un método de máxima verosimilidad MLE. Estos métodos aunque son computacionalmente más costosos y de mayor rigor matemático, dan valores de autosimilaridad más fiables, tal como se vio en el capítulo 1 epígrafe1.8.

Los métodos escogidos para este trabajo fueron:

  • Gráfico R/S

  • Regresión Sobre el Periodograma

  • Whittle Local

Gráfico R/S.

El método R/S Plot fue escogido para este trabajo, por ser pionero en la rama. El mismo es lo suficientemente robusto como para soportar cambios en las distribuciones marginales, además permite detectar comportamientos cíclicos en las series. Este ha sido usado con anterioridad en otros campos como, la medicina, en la búsqueda de patrones de los electrocardiogramas y en las ondas del sueño. El estadígrafo R/S también se ha utilizado en la hidrología con el fin de predecir comportamientos futuros en embalses, ríos, canales, etc. En el transporte ha sido aplicado en el diseño de rutas que eviten la congestión del tráfico [1, 14, 26].

Básicamente el método del rango de rescalado calcula el estadígrafo R/S para diferentes intervalos temporales y permite establecer una relación entre la amplitud del intervalo de desviaciones acumuladas (rango estadístico R) y la desviación estándar de la misma (S), medido para un intervalo de tiempo (t) [1, 14, 26, 45, 47, 48].

De forma tal que si se define un proceso estocástico X(t) en los instantes t=0, 1, 2,...tn, el rango de rescalado de dicho proceso, sobre un intervalo N se define como a continuación [48].

Monografias.com(Ec. 7.1)

donde µ(N) es la media del proceso, medida sobre el período N de forma tal que:

Monografias.com(Ec. 7.2)

Para un proceso autosimilar, el rango de rescalado R/S tiene el siguiente comportamiento, para un intervalo N lo suficientemente grande.

Monografias.com(Ec. 7.3)

Hallando el logaritmo en ambos miembros, se obtiene:

Monografias.com(Ec. 7.4)

Graficando de esta forma R/S vs N en un gráfico log-log se obtiene una recta con pendiente H.

Se puede explicar mejor el método anterior a través del siguiente algoritmo [14]:

  • 1. Si se tiene una serie temporal Xt de tamaño N. La misma se divide en V intervalos de longitud n. Esto cumple con la igualdad Vn=N. Sí se define a cada intervalo Iv con v = 1, 2, 3, ...V. Donde cada elemento de este se denomina como Nk,v con k = 1, 2, 3, ....n. Luego se calcula la media de los elementos de cada subintervalo de longitud n obteniendo así v medias calculadas según:

Monografias.com(Ec. 7.5)

  • 2. Se calculan las desviaciones acumuladas respecto a la media para cada subintervalo, de la forma:

Monografias.compara k = 1, 2, 3, .....n (Ec. 7.6)

  • 3. Se define el rango para cada subintervalo RIv como la diferencia entre el valor máximo y mínimo de Xk,v:

Monografias.com(Ec. 7.7)

  • 4. Se calcula la desviación típica muestral para cada subintervalo Iv:

Monografias.com(Ec. 7.8)

  • 5. Se divide cada rango R por la desviación típica S y se obtiene el valor de R/S para cada intervalo. Luego se calcula el valor medio de R/S para cada intervalo de longitud n:

Monografias.com(Ec. 7.9)

  • 6. Se aumenta la longitud del intervalo hasta el siguiente valor que cumpla con la condición que N/n sea un número entero. Desde el paso uno para todos los valores posibles de n.

Se realiza una regresión de log(n) como variable independiente contra log(R/S)n como variable dependiente. La pendiente de dicha regresión es el valor de H buscado.

Mediante este análisis es posible detectar también ciclos no periódicos y conocer la duración aproximada de dichos ciclos. Para ello se propone la utilización del estadígrafo V, que se define del siguiente modo:

Monografias.com(Ec. 7.10)

Graficando log(n) como variable independiente y V como variable dependiente, se puede observar cualquiera de los resultados a continuación:

  • a) Si el proceso es un movimiento aleatorio donde H=1/2 el gráfico será una línea horizontal.

  • b) Si es un proceso persistente es decir H > ½ se obtendrá una línea creciente.

  • c) Si el proceso es antipersistente es decir H < ½ se obtendrá una línea decreciente.

Si existe un comportamiento cíclico, la pendiente cambia cuando se termina la longitud del ciclo, por lo que es posible conocer la longitud media del mismo.

Para ejemplificar mejor el algoritmo se muestra a continuación el seudo código del método anterior.

Algoritmo 1: Seudo código del método R/S Plot

Entrada: arreglo matricial de los datos de las capturas

  • 1. Entrar lista de valores de las ventanas temporales (n) acorde a la serie

  • 2. Repetir desde el primer valor de la lista anterior hasta el final de la lista

  • a) Calcular la longitud de cada intervalo V de acuerdo al tamaño de la ventana

  • b) Hallar la media m para cada intervalo V usando la ecuación (Ec. 7.5)

  • c) Almacenar las medias m en un arreglo

  • d) Calcular las desviaciones acumuladas para cada intervalo respecto a las medias m almacenadas en el arreglo según (Ec. 7.6)

  • e) Se hallan el máximo y el mínimo de las desviaciones acumuladas para cada intervalo y con ellas se calcula R como en (Ec. 7.7)

  • f) Se calcula S como la desviación típica muestral de cada subintervalo de la forma expuesta en (Ec. 7.8)

  • g) Se obtiene el promedio de los R/S de todos los subintervalos

  • h) Se aumenta la longitud n de los intervalos y se almacena en un arreglo el valor de R/S para cada valor de n

  • 3. Se grafican los valores de los logaritmos de n contra los logaritmos de los valores almacenados de R/S

  • 4. Se ajusta la curva por el método de los mínimos cuadrados y se halla la pendiente del ajuste

Salida: Exponente Hurst (H) igual a la pendiente del ajuste

Si lo que se quiere es hallar comportamientos cíclicos dentro de la serie aplicando el estadígrafo V solo se debe modificar el algoritmo anterior a partir del paso 2. g. Luego calcular v de la forma v es igual a R/S dividido por la raíz de n. Como salida del algoritmo se tiene el gráfico de V contra el logaritmo de n.

Método de Regresión sobre el Periodograma

Como se sabe la transformada de Fourier de la autocovarianza se le conoce con el nombre de "función de densidad espectral de potencia". Este método se escogió, para tener un segundo criterio de comparación con respecto a los resultados arrojados por el R/S Plot.

Aunque en la literatura existen varias definiciones de este espectro, estas tan solo difieren de un factor constante o del rango de la definición. La más popular es la que define el espectro de potencia en el rango Monografias.comusando como constante normalizadora Monografias.com[5, 24]. El nombre de "función de densidad espectral", procede del hecho de que Monografias.comes realmente una función de la densidad de la varianza del proceso, sobre todo el rango de frecuencias Monografias.com[47].

Partes: 1, 2, 3, 4


 Página anterior Volver al principio del trabajoPágina siguiente 

Comentarios


Trabajos relacionados

Ver mas trabajos de Tecnologia

 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.


Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.