Monografias.com > Estadística > Matemáticas
Descargar Imprimir Comentar Ver trabajos relacionados

Correlación




Enviado por Gaby Astudillo



  1. Introducción
  2. Teoría de regresión y correlación
  3. Análisis de correlación
  4. Diagrama de dispersión
  5. Coeficiente de correlación de Pearson
  6. Coeficiente de determinación
  7. Modelos aditivos y sumativos para expresar una serie de tiempo
  8. Índices de precios al consumidor
  9. Conclusión
  10. Bibliografía

Introducción

Se llama Series de Tiempo son mediciones estadísticas a un conjunto de mediciones de cierto fenómeno o experimento registrado secuencialmente en el tiempo.

El primer paso para analizar una serie de tiempo es graficarla, esto permite: identificar la tendencia, la estacionalidad, las variaciones irregulares (componente aleatoria).

Un modelo clásico para una serie de tiempo, puede ser expresada como suma o producto de tres componentes: tendencia, estacional y un término de error aleatorio. En adelante se estudiará cómo construir un modelo para explicar la estructura y prever la evolución de una variable que observamos a lo largo del tiempo.

Unidad III

Teoría de regresión y correlación

El término correlación se utiliza generalmente para indicar la correspondencia o la relación recíproca que se da entre dos o más cosas, ideas, personas, entre otras.

En tanto, en probabilidad y estadística, la correlación
es aquello que indicará la fuerza y la dirección lineal que se
establece entre dos variables aleatorias.

Monografias.com

Se considera que dos variables de tipo cuantitativo presentan correlación la una respecto de la otra cuando los valores de una ellas varíen sistemáticamente con respecto a los valores homónimos de la otra.

Por ejemplo, si tenemos dos variables que se llaman A y B, existirá el mencionado fenómeno de correlación si al aumentar los valores de A lo hacen también los valores correspondientes a B y viceversa.

De todas maneras, vale aclarar que la correlación que pueda darse entre dos variables no implicará por si misma ningún tipo de relación de causalidad. Los principales elementos componentes de una correlación de este tipo serán: la fuerza, el sentido y la forma.

Análisis de correlación

El análisis de correlación emplea métodos para medir la significación del grado o intensidad de asociación entre dos o más variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión. El concepto de correlación está estrechamente vinculado al concepto de regresión, pues, para que una ecuación de regresión sea razonable los puntos muéstrales deben estar ceñidos a la ecuación de regresión; además el coeficiente de correlación debe ser:

  • Grande cuando el grado de asociación es alto (cerca de +1 o -1, y pequeño cuando

  • Es bajo, cerca de cero.

  • Independiente de las unidades en que se miden las variables.

Diagrama de dispersión

Un diagrama de dispersión se emplea cuando existe una variable
que está bajo el control del experimentador. Si existe un parámetro
que se incrementa o disminuye de forma sistemática por el experimentador,
se le denomina parámetro de control o variable independiente = eje de
x y habitualmente se representa a lo largo del eje horizontal. La variable medida
o dependiente = eje de y usualmente se representa a lo largo del eje vertical.
Si no existe una variable dependiente, cualquier variable se puede representar
en cada eje y el diagrama de dispersión mostrará el grado de correlación
(no causalidad) entre las dos variables.

Un diagrama de dispersión puede sugerir varios tipos de correlaciones
entre las variables con un intervalo de confianza determinado. La correlación
puede ser positiva (aumento), negativa (descenso), o nula (las variables no
están correlacionadas). Se puede dibujar una línea de ajuste (llamada
también "línea de tendencia") con el fin de estudiar
la correlación entre las variables. Una ecuación para la correlación
entre las variables puede ser determinada por procedimientos de ajuste. Para
una correlación lineal, el procedimiento de ajuste es conocido como regresión
lineal y garantiza una solución correcta en un tiempo finito.

Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Además, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos.

El diagrama de dispersión es una de las herramientas básicas
de control de calidad, que incluyen además el histograma, el diagrama
de Pareto, la hoja de verificación, los gráficos de control, el
diagrama de Ishikawa y el diagrama de flujo.

Coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson es un índice que
mide la relación lineal entre dos variables aleatorias cuantitativas.
A diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables

El coeficiente de correlación entre dos variables aleatorias X e Y es el cociente

Monografias.com

El valor del índice de correlación varía en el intervalo [-1, +1]:

  • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.

  • Si 0 < r < 1, existe una correlación positiva.

  • Si r = 0, no existe relación lineal. Pero esto no necesariamente
    implica que las variables son independientes: pueden existir todavía
    relaciones no lineales entre las dos variables.

  • Si -1 < r < 0, existe una correlación negativa.

  • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Coeficiente de determinación

En un modelo de regresión lineal el coeficiente de determinación
se interpreta como el porcentaje de variación de la variable dependiente

Monografias.com

El coeficiente de determinación, r2 – la proporción de la variación total en la variable dependiente Y que está explicada por o se debe a la variación en la variable independiente X.

El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores de 0 a 1.

Ejemplo:

Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo, está preocupado por el costo de los libros. Para tener un panorama del problema elige una muestra de 8 libros de venta en la librería. Decide estudiar la relación entre el número de páginas del libro y el costo. Calcule el coeficiente de correlación.

Monografias.com

r =.614 (verifique)

Pruebe la hipótesis de que no existe correlación en la población. Use .02 de nivel de significancia.

Paso 1: H0 la correlación en la población es cero. H1 la correlación en la población es distinta de cero.

Paso 2: H0 se rechaza si t>3.143 o si t 2 es

Monografias.com

Dónde:

  • El coeficiente a representa el grado de disminución de peso, un factor de suavizado constante entre 0 y 1. Un descuentos a mayor edad observaciones más rápido. Por otra parte, a se puede expresar en términos de períodos de tiempo N, donde a = 2 / (N +1). Por ejemplo, N = 19 es equivalente a a = 0.1. La vida media de los pesos (el intervalo en el que la disminución de peso por un factor de dos) es de aproximadamente N / 2,8854 (a menos de 1% si N> 5).

  • Y t es la observación en un período de tiempo t.

  • S t es el valor de la EMA, en cualquier período de tiempo t.

S 1 es indefinido. S 2 puede ser inicializado en un número de maneras diferentes, por lo general mediante el establecimiento de S 2 Y 1, aunque existen otras técnicas, tales como el establecimiento de S 2 a un promedio de los primeros 4 o 5 observaciones. La importancia de S 2 de inicialización de efecto sobre la media móvil resultante depende de a, a valores menores que la elección de los valores de S 2 relativamente más importante a más grande que, desde un a descuentos superiores mayores observaciones más rápido.

Esta formulación está de acuerdo con Hunter (1986).

Monografias.com

Esta es una suma infinita de términos disminuyendo.

Los períodos de N en un N-día EMA sólo
especificar el factor a. N no es un punto de parada para el cálculo
en la forma en que se encuentra en un SMA o WMA.
Para N suficientemente grande, la primera de datos N puntos
en un EMA representan alrededor del 86% del peso total en el cálculo:

Monografias.com

La fórmula de energía por encima de da un valor de partida
para un día determinado, después de lo cual los primeros días
se muestra la fórmula puede ser aplicada a los sucesivos. La cuestión
de hasta qué punto volver a ir para un valor inicial depende, en el peor
de los casos, en los datos. Si hay grandes valores de los precios p en
los datos de edad, entonces van a tener un efecto sobre el total, aunque su
ponderación es muy pequeña. Si uno asume los precios no varían
demasiado violentamente a continuación, sólo la ponderación
puede ser considerada. El peso se omite por detener después de los términos
k es

Monografias.com

Modelos aditivos y sumativos para expresar una serie de tiempo

Los métodos descritos en esta sección representan una generalización
de la regresión múltiple (que es un caso especial de modelos lineales
generales). En concreto, en la regresión lineal, un ajuste lineal por
mínimos cuadrados se calcula para un conjunto de variables explicativas
o X, para predecir una variable dependiente Y. La ecuación de regresión
lineal conocido con predictores m, para predecir una variable dependiente Y,
se puede plantear como:

Y = b 0 + b 1 X * 1 +… M + a * b * X m

Donde Y representa el (los valores pronosticados de la) variable dependiente, X 1 a m X representan los valores de m para las variables de predicción, y b 0 y b 1 a m b son los coeficientes de regresión estimados por regresión múltiple. Una generalización del modelo de regresión múltiple sería la de mantener el carácter aditivo de la modelo, pero para sustituir los términos simples de la ecuación lineal b * i X i con f i (X i) donde f i es una función no paramétrica del predictor X i. En otras palabras, en lugar de un coeficiente único para cada variable (término aditivo) en el modelo, en los modelos de un aditivo sin especificar (no paramétrica) la función se estima para cada predictor, para lograr la mejor predicción de los valores de las variables dependientes.

INDICES ESTACIONALES EN UNA SERIE DE TIEMPO

Medida del efecto estacional en una serie de tiempo. Un índice estacional arriba de 1 indica un efecto positivo (el dato mayor que el marcado por la tendencia), un índice estacional de 1 indica que no hay efecto estacional y un índice estacional menor que 1 indica un efecto negativo (el dato es menor que el indicado por la tendencia).

Las fluctuaciones estacionales son variaciones que se repiten regularmente en un periodo de un año. Existen 2 objetivos generales para aislar el componente estacional de una serie cronológica. El primero es eliminar ese patrón a fin de estudiar las fluctuaciones cíclicas. La segunda finalidad es identificar factores estacionales, de esta manera que se puedan considerar en la toma de decisiones. Por ejemplo si una compañía productora se da cuenta de que existen fluctuaciones estacionales en la demanda de un determinado, producto, es posible que desee ajustar sus presupuestos, mano de obra e inventarios, teniendo esto en mente. Por lo general tales ajustes resultan muy costosos. Por ejemplo, compañía puede buscar un producto complementario. El cual presente variaciones estacionales en su de manda opuesta alas del mismo. La demanda de equipo de calefacción.

Para probar y encarar los patrones estacionales, es necesario identificar y determinar primero la extensión de estas variaciones. La Técnica más difundida para el análisis estacional es el método de la razón al promedio móvil.

NUMEROS INDICES

Un número índice es un número que expresa la variación relativa del precio, la cantidad o el valor, en comparación con un periodo base. Ejemplo

La oficina de censo de estados unidos informa que el número de granjas de ese país disminuyo de 3157857, en 1964, a aproximadamente 1200000, en el año 2000. ¿Cuál es el índice correspondiente a la cantidad de granjas en el año 2000, con base en el número en 1964?

El índice es 38.0 que se obtiene de:

Cantidad de granjas en el año 2000; 1200000

P = ———————————————- (100) = —————– (100) = 38.0

Cantidad de granjas en 1964; 3157857

Esto indica que la cantidad de granjas en 2000 era 38% de la cantidad de granjas en 1964. En otras palabras, la cantidad de granjas en estados unidos disminuyó 62.0% (lo cual proviene de 100-38) en ese periodo.

El índice también sirve para comparar un artículo con otro. En 1999 la población en la propicia de Colombia británica era de 4023100 y en Ontario era 11513800. ¿Cuál es la proporción de la población en Columbia británica comparada con la población de Ontario?

El índice de población de Columbia británica es 34.9 que se obtiene mediante la formula

Población de Columbia británica 4023100

P = ——————————————- (100) = ————— (100) = 34.9

Población de Ontario 11513800

¿Por qué convertir los datos en índices?

Un índice es una forma de expresar una variación en un grupo heterogéneo de elementos. Los índices nos permiten expresar una variación en precio, cantidad o valor, como un porcentaje. Por ejemplo, el índices de precios al consumidor (IPC) abarca, una serie de artículos, incluyendo pelotas de golf, podadoras de césped, hamburguesas, servicios funerarios y honorarios de dentistas Los precios se expresa en bolívares por libra, caja, yarda, y otras muchas unidades.

Convertir los datos en índices también facilita la evaluación de la tendencia en una serie compuesta por números excepcionalmente grandes.

INDICES PONDERADOS Y NO PONDERADOS

  • Índices No Ponderados: En muchos casos se desea combinar varios elementos y elaborar un índice para comparar el costo de un grupo de artículos en dos diferentes periodos. Por ejemplo, si se desea un índice para elementos relacionados con los gastos de uso y mantenimiento de un automóvil, los elementos del índice podrían incluir llantas, cambios de aceites y precios de la gasolina. O tal vez interese un índice de gastos de estudiantes universitario. Este índice podría comprender el costo de libros, colegiatura, vivienda, alimentación y entretenimiento. Existen muchas maneras de combinar los elementos para determinar el índice.

  • Índices Ponderados: Existen dos métodos para calcular un índice de precios ponderados: el método de Laspeyres y el de Paasche, los cuales difieren solo en el periodo utilizado para la ponderación.

  • El Índice De Precios De Laspeyres

Emplea las ponderaciones del periodo base; es decir, los precios y las cantidades originales de los artículos comparados se utilizan para hallar el cambio porcentual respecto a un periodo o intervalo de tiempo, tanto en precio como en cantidad consumida, dependiendo del problema. El método de paasches utiliza las ponderaciones del año actual para el denominador del índice ponderado.

Monografias.com

  • Índice De Precios De Paasche

El índice de Paasche es una alternativa. El procedimiento es similar, pero en vez de usar los pesos periodos base, se emplean los pesos del año actual.

Monografias.com

¿Cómo se decide que índice usar? ¿Cuándo es más apropiado el de Laspeyres, y cuando el de Paasche?

  • Laspeyres

Ventajas requiere datos de cantidad solo del periodo base. Esto permite una mejor comparación conforme pasa el tiempo. Los cambios en el índice pueden atribuirse a cambios en el precio.

Desventajas no refleja cambios en los patrones de compra conforme pasa el tiempo. Además, podría ponderar en más los artículos cuyos precios aumentan.

  • Paasche

Ventajas debido a que se utilizan cantidades del periodo actual, refleja los hábitos actuales de compra.

Desventajas requiere datos de cantidad de cada año, lo cual puede ser difícil de obtener. Debido a que se emplean diferentes cantidades cada año, es imposible atribuir cambios en el índice únicamente a cambios en el precio. Tienden a ponderar en más los artículos cuyos precios han bajado. Requieren que los precios se calculen cada año.

Índices de precios al consumidor

El (IPC) mide los cambios en los precios de una canasta básica fija de artículos y servicios en el mercado, de un periodo a otro.

El IPC cumple con varias funciones importantes. Permite a los consumidores determinar el grado de deterioro de su poder adquisitivo por el aumento de los precios. A este respecto es un criterio para la revisión de sueldos y salarios, pensiones y otros tipos de ingresos, a fin de mantener el paso con los cambios en los precios. Igualmente importante, es un indicador económico de la tasa de inflación.

El índice incluye cerca de 400 elementos, y unos 250 inspectores recopilan mensualmente los datos de los precios. Los precios se obtienen de más de 21000 establecimientos de comercio al menudeo, y de 60000 unidades habitacionales en 91 áreas urbanas del país. Los precios de cunas para bebes, pan, cerveza, cigarros, gasolina, cortes de cabellos, tasa de interés hipotecario, honorarios médico, impuestos y cargos por uso de salas para cirugías, son solo algunos de las elementos que se incluyen en lo que se ha dominado con frecuencia canasta básica de bienes y servicios que se consumen.

Usos especiales del índice de precios al consumidor:

  • Ingreso real: Determina el poder de compra de la unidad monetaria, y para evaluar el aumento del costo de vida.

Monografias.com

  • Poder adquisitivo del dinero:

Monografias.com

  • Ventas deflacionadas: Importante para mostrar la tendencia en ventas reales.

Monografias.com

Conclusión

La serie de tiempo en estadística es un procesamiento de señales, y econometría, una serie temporal es una secuencia de puntos de datos, medidos típicamente a intervalos de tiempo sucesivos, y espaciados (con frecuencia) de forma uniforme.

El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de datos, extrayendo información representativa, tanto referente a los orígenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro.

De hecho uno de los usos más habituales de las series de datos temporales es su análisis para predicción y pronóstico. Por ejemplo de los datos climáticos, o de las acciones de bolsa, o las series pluviométricas.

Bibliografía

PÁGINAS WEB:

www.monografias.com/trabajos30/series-de-tiempo/series-de-tiempo.

www.scribd.com/doc/2255206/Correlacion-Series-de-Tiempo.

LIBRO:

Introducción A La Estadística Para Administración Y Dirección De Empresas.

Autor: José Miguel Casas Sánchez.

Editorial: Universitaria Ramón Areces.

Berenson, Mark y LEVINE, David 1991 estadística para la administración y economía. Conceptos y aplicaciones. Editorial MC. Graw- Hill. Interamericana. ISBM: 968-713-2. México

LIND, MARCHAL, MASON 2004 Estadística para Administración y Economía (onceava edición) Grupo editor Alfa omega ISBN: 970-15-0974-9 México D.F.

 

 

 

Autor:

Gaby Astudillo

 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter