Agregar a favoritos      Ayuda      Português      Ingles     

Regresión y correlación

Enviado por Sandra Baca Garcia



  1. Marco Teórico
  2. Desarrollo de un Ejercicio
  3. Bibliografía
  1. Introducción
    A continuación, desarrollare el grado de relación entre dos o mas variables en lo que llamaremos análisis de correlación, Para representar esta relación utilizaremos una representación gráfica llamada diagrama de dispersión, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión. y, finalmente Desarrollaremos un ejercicio aplicando lo aprendido, donde utilizaremos datos verdaderos de una empresa de servicios turísticos.

    Ecuación de regresión Múltiple.- La forma general de la ecuación de regresión múltiple con dos variables independientes es:

    Y' = a + b1X1 + b2X2

    X1,X2 : Variables Independientes

    a : es la ordenada del punto de intersección con el eje Y.
    b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de

    variación en X1.).
    b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio

    unitario en X2).

    Prueba Global.- esta prueba investiga básicamente si es posible que todas las variables independientes tengan coeficientes de regresión neta iguales a 0.

  2. Marco Teórico
    A fin de facilitar la comprensión del presente trabajo definiremos algunos conceptos basicos.
    Análisis de Correlación .- Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
    El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
    Diagrama de Dispersión.- es aquel grafico que representa la relación entre dos variables.
    Variable Dependiente.- es la variable que se predice o calcula. Cuya representación es "Y"
    Variable Independiente.- es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
    Coeficiente de Correlación.- Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
    El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.
    Análisis de regresión.- Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
    Ecuación de Regresión.- es una ecuación que define la relación lineal entre dos variables.
    Ecuación de regresión Lineal: Y’ = a + Bx
    Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
    Principio de Mínimos Cuadrados.- Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y".
    Análisis de regresión y Correlación Múltiple.- consiste en estimar una variable dependiente, utilizando dos o más variables independientes.

    Y

    X1

    X2

    AÑO

    VENTAS

    GASTOS DE PUBLICIDAD

    COMISIONES DE VENDEDORES

    2000

    264000

    550

    15840

    2001

    384000

    590

    19250

    2002

    400200

    680

    26013

    2003

    422400

    700

    16896

    2004

    543000

    750

    16290

    ANÁLISIS DE DATOS:
    Se van a utilizar las siguientes variables:
    Variables Independientes:
    1.- Gastos de Publicidad

    2.- Comisión de vendedores

    Variable dependiente:
    - Ventas

    Utilizando el Excel obtenemos los siguientes datos.

    Estadísticas de la Regresión

    Coeficiente de correlación múltiple

    0.92092

    Coeficiente de determinación R2

    0.84810

    R2 ajustado

    0.69619

    Error típico

    54887.83156

    Observaciones

    5

    De aquí se puede decir:
    - De acuerdo al valor del coeficiente de correlación múltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisión de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%.
    - De acuerdo al Coeficiente de determinación R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.

    A N Á L I S I S D E V A R I A N Z A

    Grados de libertad

    Suma de cuadrados

    Prom. de los cuadrados

    F

    Valor crítico de F

    Regresión

    2

    33640459893

    16820229947

    5.5832

    0.15190282

    Residuos

    2

    6025348107

    3012674053

    Total

    4

    39665808000

     

    Coeficientes

    Error típico

    Estadístico t

    Probab.

    Inf. 95%

    Sup. 95%

    Inferior 95.0%

    Sup. 95.0%

    Intercepción

    -289315.16

    242459.39

    -1.193

    0.35513

    -1332534.446

    753904.118

    -1332534.446

    753904.118

    GSTOS DE PUBLICID.

    1123.49

    336.22

    3.342

    0.07908

    -323.1275965

    2570.108

    -323.128

    2570.108

    COM. DE VENDED.

    -2.27

    6.55

    -0.346

    0.76245

    -30.45400257

    25.922

    -30.454

    25.922


    De aquí se desprende la ecuación de regresión múltiple:

    Y = - 289315 + 1123 X1 - 2.27 X2


    Prueba Global: Verificación de la validez del modelo de regresión Múltiple.
    Formulación de Hipótesis:
    Hp: B1 = B2 = 0
    Ha: B1 B2 0

    Si se acepta la hipótesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y.
    De acuerdo a la tabla de análisis de la varianza F calculado es 5.58 y el p-valor es 0.15, de lo cual podemos decir que La hipótesis planteada se rechaza y se acepta la hipótesis alternativa, por que el F calculado es mayor que el p-valor.
    Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresión, no son iguales a cero y, por o tanto son útiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresión pueden ser cero y cuales no.
    Del análisis mediante Excell tenemos el siguiente cuadro.

    VENTAS VS GASTOS DE PUBLICIDAD

    Estadísticas de la regresión

    Coeficiente de correlación múltiple

    0.915976333

    Coeficiente de determinación R^2

    0.839012642

    R^2 ajustado

    0.785350189

    Error típico

    46136.36902

    Observaciones

    5

     

    A N Á L I S I S D E V A R I A N Z A

    GL

    Suma de cuadrados

    Prom. de los cuadr.

    F

    p-Valor

    Regresión

    1

    33280114360

    33280114360

    15.6350

    0.028865932

    Residuos

    3

    6385693640

    2128564547

    Total

    4

    39665808000

     

    Coeficientes

    Error típico

    Estadíst. t

    Probab.

    Inf. 95%

    Sup. 95%

    Inf. 95%

    Sup. 95%

    Intercepción

    -324444.428

    185054.64

    -1.7532

    0.1778

    -913371.43

    264482.58

    -913371.43

    264482.58

    GASTOS DE PUBLICIDAD

    1111.8722

    281.19389

    3.9541

    0.0289

    216.9869

    2006.7575

    216.9869

    2006.7575


    VENTAS VS COMISIÓN DE VENDEDORES

    Estadísticas de la regresión

    Coeficiente de correlación múltiple

    0.003317293

    Coeficiente de determinación R^2

    1.10044E-05

    R^2 ajustado

    -0.333318661

    Error típico

    114986.0448

    Observaciones

    5

     

    ANÁLISIS DE VARIANZA

    GL

    Suma de cuadrados

    Prom. de los cuadrados

    F

    Valor crítico de F

    Regresión

    1

    436499.6307

    436499.6307

    3.30137E-05

    0.9957763

    Residuos

    3

    39665371500

    13221790500

    Total

    4

    39665808000

     

    Coeficientes

    Error típico

    Estadíst. t

    Probabilidad

    Inferior 95%

    Superior 95%

    Inferior 95.0%

    Superior 95.0%

    Intercepción

    404199.6521

    262605.1563

    1.539191605

    0.22138434

    -431527.9414

    1239927.246

    -431527.9414

    1239927.246

    COM. DE VENDEDORES

    -0.07846366

    13.65594537

    -0.00574575

    0.9957763

    -43.53781731

    43.38088999

    -43.53781731

    43.38088999


    De acuerdo a los cuadros podemos decir:
    - La variable que mas relación tiene con las Variable Dependiente es decir las ventas

    es la variable Gastos de Publicidad ya que su R2 "Coeficiente de determinación" es

    79%.
    - En cuanto a la variable Comisiones de vendedores podemos decir que no tiene

    relación relevante con las Ventas ya que su Coeficiente de determinación es casi

    nulo 0.001% .

  3. Desarrollo de un Caso.
    Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
  4. Bibliografía.
    a)
    LIND, Douglas y MARCHAL, William y MASON, Robert. Estadística para administración y economia. Alfaomega. Colombia 11ava edición. 2004 Cap.13 y 14
    b) CORDOVA, Jorge Herramientas Estadísticas para la Gestión en Salud. JC ediciones. Versión electrónica (formato CD) Mayo 2003.
    c) HILDEBRAND, David y OTT, Lyman. Estadística Aplicada a la administración y a la economia. Adidison wesley Iberoamericana sa. 1997. Cap. 13,14 y 15.

 

 

Ing. Sandra Ysolina Baca Garcia


UNIVERSIDAD INCA GARCILASO DE LA VEGA
ESCUELA DE POSTGRADO
"MAESTRÍA EN CIENCIAS EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN"

Lima, Noviembre del 2005

CURSO : Modelos Estadísticos


Comentarios


Trabajos relacionados

  • Distribución Normal

    Distribución Normal. Función de densidad. La distribución binomial. Esta distribución es frecuentemente utilizada en l...

  • Estructura y funcionamiento del Programa Raíces

    Carlos alberto PérezEl programa esta compuesto por la función principal raices y 9 subfunciones: Raices (principal; Cuad...

  • El poder del Solver

    Ejemplo de cómo usar "SOLVER". En estos tiempos donde se habla de la tecnología, información, sociedad del conocimient...

Ver mas trabajos de Matematicas

 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.


Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Iniciar sesión

Ingrese el e-mail y contraseña con el que está registrado en Monografias.com

   
 

Regístrese gratis

¿Olvidó su contraseña?

Ayuda