Monografias.com > Matemáticas
Descargar Imprimir Comentar Ver trabajos relacionados

Regresión y correlación




Enviado por Sandra Baca Garcia



    1. Marco
      Teórico
    2. Desarrollo de un
      Ejercicio
    3. Bibliografía
    1. Introducción
      A
      continuación, desarrollare el grado de relación
      entre dos o mas variables
      en lo que llamaremos análisis de
      correlación
      , Para representar esta
      relación utilizaremos una representación
      gráfica llamada diagrama de
      dispersión,
      estudiaremos un modelo
      matemático para estimar el valor de
      una variable basándonos en el valor de otra, en lo que
      llamaremos análisis de regresión.
      y, finalmente Desarrollaremos un ejercicio aplicando lo
      aprendido, donde utilizaremos datos
      verdaderos de una empresa
      de servicios
      turísticos.

      Ecuación de regresión
      Múltiple
      .- La forma general de la
      ecuación de regresión múltiple con dos
      variables independientes es:

      Y' = a +
      b1X1 +
      b2X2

      X1,X2 :
      Variables Independientes

      a : es la ordenada del punto de
      intersección con el eje Y.
      b1 : Coeficiente de Regresión (es la
      variación neta en Y por cada unidad de

      variación en X1.).
      b2 : Coeficiente de Regresión (es el
      cambio
      neto en Y para cada cambio

      unitario en X2).

      Prueba Global.- esta prueba investiga
      básicamente si es posible que todas las variables
      independientes tengan coeficientes de regresión neta
      iguales a 0.

    2. Marco Teórico
      A fin de
      facilitar la comprensión del presente trabajo
      definiremos algunos conceptos basicos.
      Análisis de Correlación
      .- Es el conjunto de técnicas estadísticas empleado para medir la
      intensidad de la asociación entre dos variables.
      El principal objetivo
      del análisis de correlación consiste
      en determinar que tan intensa es la relación entre dos
      variables. Normalmente, el primer paso es mostrar los datos
      en un diagrama
      de dispersión.
      Diagrama de
      Dispersión
      .- es aquel
      grafico que representa la relación entre dos
      variables.
      Variable Dependiente.- es la variable
      que se predice o calcula. Cuya representación es
      "Y"
      Variable Independiente.- es la variable
      que proporciona las bases para el calculo. Cuya
      representación es:
      X1,X2,X3…….
      Coeficiente de Correlación.-
      Describe la intensidad de la relación entre dos
      conjuntos
      de variables de nivel de intervalo. Es la medida de la
      intensidad de la relación lineal entre dos
      variables.
      El valor del coeficiente de correlación puede tomar
      valores
      desde menos uno hasta uno, indicando que mientras más
      cercano a uno sea el valor del coeficiente de
      correlación, en cualquier dirección, más fuerte
      será la asociación lineal entre las dos
      variables. Mientras más cercano a cero sea el
      coeficiente de correlación indicará que
      más débil es la asociación entre ambas
      variables. Si es igual a cero se concluirá que no
      existe relación lineal alguna entre ambas
      variables.
      Análisis de regresión.- Es
      la técnica empleada para desarrollar la
      ecuación y dar las estimaciones.
      Ecuación de Regresión.- es
      una ecuación que define la relación lineal
      entre dos variables.
      Ecuación de regresión Lineal: Y’ = a + Bx
      Ecuación de regresión Lineal Múltiple:
      Y’ = a + b1X1 +
      b2X2 +
      b3X3…
      Principio de Mínimos Cuadrados.-
      Es la técnica empleada para obtener la ecuación
      de regresión, minimizando la suma de los cuadrados de
      las distancias verticales entre los
      valores verdaderos de "Y" y los valores pronosticados
      "Y".
      Análisis de regresión y
      Correlación Múltiple
      .- consiste en
      estimar una variable dependiente, utilizando dos o más
      variables independientes.

      Y

      X1

      X2

      AÑO

      VENTAS

      GASTOS DE
      PUBLICIDAD

      COMISIONES
      DE VENDEDORES

      2000

      264000

      550

      15840

      2001

      384000

      590

      19250

      2002

      400200

      680

      26013

      2003

      422400

      700

      16896

      2004

      543000

      750

      16290

      ANÁLISIS DE DATOS:
      Se van a
      utilizar las siguientes variables:
      Variables Independientes:
      1.- Gastos de
      Publicidad

      2.- Comisión de vendedores

      Variable dependiente:

      Ventas

      Utilizando el Excel
      obtenemos los siguientes datos.

      Estadísticas de
      la Regresión

      Coeficiente de correlación
      múltiple

      0.92092

      Coeficiente de determinación
      R2

      0.84810

      R2 ajustado

      0.69619

      Error típico

      54887.83156

      Observaciones

      5

      De aquí se puede decir:
      – De acuerdo al valor del coeficiente de correlación
      múltiple, podemos afirmar que la variable
      X1 (Gastos de Publicidad) y X2
      (Comisión de vendedores) se encuentran asociadas en
      forma directa de una manera muy fuerte con la variable
      dependiente Ventas, en un 92%.
      – De acuerdo al Coeficiente de determinación
      R2, podemos decir que el 85% de las ventas pueden
      ser explicadas por los gastos de publicidad y las comisiones
      de los vendedores.

      A N Á L I S I S D E
      V A R I A N Z A

      Grados de
      libertad

      Suma de
      cuadrados

      Prom. de los
      cuadrados

      F

      Valor crítico de
      F

      Regresión

      2

      33640459893

      16820229947

      5.5832

      0.15190282

      Residuos

      2

      6025348107

      3012674053

      Total

      4

      39665808000

       

      Coeficientes

      Error
      típico

      Estadístico
      t

      Probab.

      Inf.
      95%

      Sup.
      95%

      Inferior
      95.0%

      Sup.
      95.0%

      Intercepción

      -289315.16

      242459.39

      -1.193

      0.35513

      -1332534.446

      753904.118

      -1332534.446

      753904.118

      GSTOS DE PUBLICID.

      1123.49

      336.22

      3.342

      0.07908

      -323.1275965

      2570.108

      -323.128

      2570.108

      COM. DE VENDED.

      -2.27

      6.55

      -0.346

      0.76245

      -30.45400257

      25.922

      -30.454

      25.922

      De aquí se desprende la ecuación de
      regresión múltiple:

      Y = – 289315 + 1123 X1 – 2.27
      X2

      Prueba Global: Verificación de la
      validez del modelo de regresión Múltiple.
      Formulación de Hipótesis:
      Hp: B1 = B2 = 0
      Ha: B1 B2 0

      Si se acepta la hipótesis
      planteada, significa que ninguno de los factores
      (X1,X2) son relevantes para explicar
      los cambios en Y.
      De acuerdo a la tabla de análisis de la varianza
      F calculado es 5.58 y el p-valor
      es 0.15, de lo cual podemos decir que La
      hipótesis planteada se rechaza y se acepta la
      hipótesis alternativa, por que el F calculado
      es mayor que el p-valor.
      Hasta ahora se ha demostrado que algunos, pero no
      necesariamente todos los coeficientes de regresión, no
      son iguales a cero y, por o tanto son útiles para las
      predicciones. El siguiente paso consiste en probar
      individualmente las variables para determinar cuales
      coeficientes de regresión pueden ser cero y cuales
      no.
      Del análisis mediante Excell tenemos el siguiente
      cuadro.

      VENTAS VS GASTOS DE PUBLICIDAD

      Estadísticas de la
      regresión

      Coeficiente de correlación
      múltiple

      0.915976333

      Coeficiente de determinación
      R^2

      0.839012642

      R^2 ajustado

      0.785350189

      Error típico

      46136.36902

      Observaciones

      5

       

      A N Á L I S I S D E
      V A R I A N Z A

      GL

      Suma de
      cuadrados

      Prom. de los
      cuadr.

      F

      p-Valor

      Regresión

      1

      33280114360

      33280114360

      15.6350

      0.028865932

      Residuos

      3

      6385693640

      2128564547

      Total

      4

      39665808000

       

      Coeficientes

      Error
      típico

      Estadíst. t

      Probab.

      Inf.
      95%

      Sup.
      95%

      Inf.
      95%

      Sup.
      95%

      Intercepción

      -324444.428

      185054.64

      -1.7532

      0.1778

      -913371.43

      264482.58

      -913371.43

      264482.58

      GASTOS DE PUBLICIDAD

      1111.8722

      281.19389

      3.9541

      0.0289

      216.9869

      2006.7575

      216.9869

      2006.7575

      VENTAS VS COMISIÓN DE VENDEDORES

      Estadísticas de la
      regresión

      Coeficiente de correlación
      múltiple

      0.003317293

      Coeficiente de determinación
      R^2

      1.10044E-05

      R^2 ajustado

      -0.333318661

      Error típico

      114986.0448

      Observaciones

      5

       

      ANÁLISIS DE VARIANZA

      GL

      Suma de
      cuadrados

      Prom. de los
      cuadrados

      F

      Valor crítico de
      F

      Regresión

      1

      436499.6307

      436499.6307

      3.30137E-05

      0.9957763

      Residuos

      3

      39665371500

      13221790500

      Total

      4

      39665808000

       

      Coeficientes

      Error
      típico

      Estadíst. t

      Probabilidad

      Inferior
      95%

      Superior
      95%

      Inferior
      95.0%

      Superior
      95.0%

      Intercepción

      404199.6521

      262605.1563

      1.539191605

      0.22138434

      -431527.9414

      1239927.246

      -431527.9414

      1239927.246

      COM. DE VENDEDORES

      -0.07846366

      13.65594537

      -0.00574575

      0.9957763

      -43.53781731

      43.38088999

      -43.53781731

      43.38088999

      De acuerdo a los cuadros podemos decir:
      – La variable que mas relación tiene con las Variable
      Dependiente es decir las ventas

      es la variable Gastos de Publicidad ya que su R2
      "Coeficiente de determinación" es

      79%.
      – En cuanto a la variable Comisiones de vendedores podemos
      decir que no tiene

      relación relevante con las Ventas ya que su
      Coeficiente de determinación es casi

      nulo 0.001% .

    3. Desarrollo
      de un Caso.
      Una agencia de Viajes desea
      saber la relación que hay entre las ventas, el
      presupuesto
      destinado a publicidad, y
      las comisiones de los vendedores para esto presenta los
      siguientes datos. Realice los análisis
      respectivos.
    4. Bibliografía.
      a)
      LIND, Douglas y MARCHAL, William y MASON, Robert.
      Estadística para administración y economia.
      Alfaomega. Colombia
      11ava edición. 2004 Cap.13 y 14
      b) CORDOVA, Jorge Herramientas Estadísticas
      para la Gestión en Salud
      . JC ediciones.
      Versión electrónica (formato CD) Mayo
      2003.
      c) HILDEBRAND, David y OTT, Lyman.
      Estadística Aplicada a la administración y a la economia.
      Adidison wesley Iberoamericana sa. 1997. Cap. 13,14 y
      15.

     

     

    Ing. Sandra Ysolina Baca Garcia

    UNIVERSIDAD INCA
    GARCILASO DE LA VEGA
    ESCUELA DE
    POSTGRADO
    "MAESTRÍA EN CIENCIAS EN
    INGENIERÍA DE SISTEMAS Y
    COMPUTACIÓN"

    Lima, Noviembre del 2005

    CURSO : Modelos
    Estadísticos

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter