Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Estadística Aplicada a la Tasación (página 2)



Partes: 1, 2

 

1.- Forma Directa

De la ecuación de la
recta:

Si y , se
obtienen a partir de las ecuaciones
normales:

Aplicando normales Y sobre X se tiene:

 

El Coeficiente de Regresión es

De la misma manera la recta de regresión de "X"
sobre "Y" será dada de la siguiente manera:

Donde: y se
obtienen a partir de las ecuaciones normales:

Aplicando normales X sobre Y se tiene:

2.- Forma Indirecta del Método
de los Mínimos Cuadrados
.

El fundamento de este método es de las
desviaciones de X respecto a su media aritmética.
X

Ecuación de y sobre
x Ecuación de y sobre
x

Donde:

x , y = desviaciones

X = media aritmética

Y = media aritmética

  1. Regresión Múltiple: Este tipo se
    presenta cuando dos o más variables
    independientes influyen sobre una variable dependiente.
    Ejemplo: Y = f (x, w, z …. k).

Por ejemplo: Podría ser una regresión de
tipo múltiple:

Una Empresa de
desarrollo
de software
establece relacionar sus Ventas en
función del numero de pedidos de los
tipos de
software que desarrolla (Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10
proyectos en el
presente año.

En la Tabla representa Y (Ventas miles de S/.) e X
(Nº pedidos de sistemas), W (Nº de pedidos de
Aplicaciones Educativas) y Z (Nº de pedidos de
Automatizaciones empresariales).

Y

440

455

470

510

506

480

460

500

490

450

X

50

40

35

45

51

55

53

48

38

44

W

105

140

110

130

125

115

100

103

118

98

Z

75

68

70

64

67

72

70

73

69

74

Objetivo: Se presentara primero el
análisis de regresión
múltiple al desarrollar y explicar el uso de la
ecuación de regresión múltiple, así
como el error estándar múltiple de
estimación. Después se medirá la fuerza de la
relación entre las variables independientes, utilizando
los coeficientes múltiples de
determinación.

Análisis de Regresión
Múltiple

Dispone de una ecuación con dos variables
independientes adicionales:

Se puede ampliar para cualquier número "m" de
variables independientes:

Para poder
resolver y obtener y en una
ecuación de regresión múltiple el cálculo
se presenta muy tediosa porque se tiene atender 3 ecuaciones
que se generan por el método de mínimo de
cuadrados:

Para poder resolver se puede utilizar programas
informáticos como ejemplo Microsoft
Excel.

El error estándar de la regresión
múltiple

Es una medida de dispersión la
estimación se hace más precisa conforme el grado
de dispersión alrededor del plano de regresión se
hace mas pequeño.

Para medirla se utiliza la formula:

Y: Valores
observados en la muestra

: Valores estimados a partir a partir de la
ecuación de regresión

n: Número de datos

m: Número de variables
independientes

El coeficiente de determinación
múltiple

Mide la tasa porcentual de los cambios de Y que
pueden ser explicados por , y

simultáneamente.

III.- APLICACIÓN DE
REGRESIÓN MÚLTIPLE

Mediante el siguiente problema se puede ilustrar la
aplicación de Regresión Múltiple: En la
Facultad de Ingeniería
de Sistemas y Computo de una Universidad se
quiere entender los factores de aprendizaje de
los alumnos que cursan la asignatura de PHP, para lo cual
se escoge al azar una muestra de 15
alumnos y ellos registran notas promedios en las asignaturas de
Algoritmos,
Base de Datos
y Programación como se muestran en el
siguiente cuadro.

Alumno

PHP

Algoritmos

Base de Datos

Programación

1

13

15

15

13

2

13

14

13

12

3

13

16

13

14

4

15

20

14

16

5

16

18

18

17

6

15

16

17

15

7

12

13

15

11

8

13

16

14

15

9

13

15

14

13

10

13

14

13

10

11

11

12

12

10

12

14

16

11

14

13

15

17

16

15

14

15

19

14

16

15

15

13

15

10

Lo que se busca es construir un modelo para
determinar la dependencia que exista de aprendizaje reflejada en
las notas de la asignatura de PHP, conociendo las notas de las
asignaturas Algoritmos, Base de Datos y
Programación.

Se presentara la siguiente ecuación a
resolver:

Utilizando las formulas de las ecuaciones normales a los
datos se obtendrán los coeficientes de regresión o
utilizando Regresión de Análisis de datos, en la
Hoja de Calculo de Excel se puede
calcular también los coeficientes de
regresión:

Por lo tanto se puede construir la ecuación de
regresión que buscamos:

El Error Estándar de Regresión
Múltiple

Mediante esta medida de dispersión se hace
más preciso el grado de dispersión alrededor del
plano de regresión, se hace más
pequeño.

Para calcularla se utiliza la formula
siguiente:

En los resultados de Excel se llama error
típico
y para explicar la relación del
aprendizaje de PHP que se viene desarrollando es de
0,861

El coeficiente de determinación
múltiple (r2)

Utilizaremos para determinar la tasa porcentual de Y
para ser explicados las variables múltiples, utilizando la
siguiente formula:

El 69.70% del aprendizaje del Curso de PHP puede ser
explicado mediante las notas obtenidas por las asignaturas de
Algoritmos, Base de Datos y Programación.

IV.- APLICACIONES A LA TASACIÓN
DE INMUEBLES

De igual forma para esta aplicación se utiliza la
función estadística llamada "ESTIMACION LINEAL", de
"Microsoft
EXCEL", hoja de
cálculo, para Windows, la
cual efectúa los cálculos de regresión
lineal simple y múltiple.

La función "ESTIMACIÓN LINEAL" arroja como
resultado una matriz que
describe una ecuación del tipo:

Y = m1
X1 + m2 X2 +
m3 X3 + ……. + mn
Xn + b

Donde el valor Y
dependiente es una función de los valores
Xi independientes. Los valores mi son
coeficientes que corresponden a cada valor de
Xi y b es un valor constante.

Estimación lineal también puede devolver
estadísticas de regresión, de esta
forma arroja lo siguiente:

La metodología asume que existe una
relación lineal entre cada una de las variables
independientes con la variable dependiente que se
considere.

Para interpretar de una mejor forma la información que se presentará, antes
se definirán algunos elementos que contienen los cuadros a
presentar.

R2: Coeficiente de determinación o
error cuadrático.

F: Estadístico utilizado para verificar la
correlación entre la variable dependiente y las variables
independientes, como un todo.

m i : Coeficiente de cada variable
independiente en la ecuación de
regresión.

b : Constante de la ecuación de
regresión.

t i : Estadístico utilizado para
comprobar la importancia de cada una de las variables
independientes en la explicación del fenómeno en
estudio o de la variable dependiente.

Ejemplo de Regresión lineal múltiple
para tasar un edificio

Suponga que un programador comercial está
pensando en adquirir un grupo de
pequeños edificios de oficinas en un distrito comercial
conocido.

El programador puede utilizar el análisis de
regresión lineal múltiple para estimar el valor de
un edificio de oficinas en un área determinada
basándose en las variables siguientes.

Variable

Indica

Y

Valor tasado del edificio de oficinas

x1

Superficie en metros cuadrados

x2

Número de oficinas

x3

Número de entradas

x4

Antigüedad del edificio en
años

Este ejemplo supone que existe una relación de
línea recta entre cada variable independiente
(x1, x2, x3, y x4) y
la variable dependiente (Y), el valor de los edificios de
oficinas en esa área.

Se elige al azar una muestra de 11 edificios de oficinas
de 1.500 edificios posibles y obtiene los datos siguientes.
"Media entrada" significa una entrada sólo para
entregas.

La fórmula a utilizar es:

=ESTIMACION.LINEAL(conocido_y,
conocido_x,VERDADERO,VERDADERO)

Nota: La fórmula del ejemplo debe escribirse como
fórmula matricial, con CTRL+MAYÚS+ENTRAR. Si la
fórmula no se introduce en formato matricial, no
dará el resultado deseado.

Cuando se introduce como una matriz, se devuelven las
siguientes estadísticas de regresión. Utilice esta
clave para identificar las estadísticas
deseadas.

El ejemplo puede resultar más fácil si lo
copia en una hoja de cálculo en blanco, de la forma
siguiente:

A

B

C

D

E

1

Superficie
(x1)

Oficinas
(x2)

Entradas
(x3)

Antigüedad
(x4)

Valor tasado
(y)

2

2.310

2

2

20

142.000

3

2.333

2

2

12

144.000

4

2.356

3

1,5

33

151.000

5

2.379

3

2

43

150.000

6

2.402

2

3

53

139.000

7

2.425

4

2

23

169.000

8

2.448

2

1,5

99

126.000

9

2.471

2

2

34

142.900

10

2.494

3

3

23

163.000

11

2.517

4

4

55

169.000

12

2.540

2

3

22

149.000

Función de Excel

=ESTIMACIÓN.LINEAL(E2:E12,A2:D12,VERDADERO,VERDADERO)

Cuando se introduce como una matriz, se devuelven las
siguientes estadísticas de regresión. Utilice esta
clave para identificar las estadísticas
deseadas.

Ahora puede obtenerse la ecuación de
regresión múltiple, y = m1*x1
+ m2*x2 + m3*x3 +
m4*x4 + b, utilizando los valores
obtenidos:

Edad

Entradas

Oficinas

Superficies

A

B

C

D

E

15

-234,2372

2.553,2107

12.529,77

27,64

52.317,83

16

13,2680

530,6692

400,0668382

5,429374042

12237,3616

17

0,99675

970,5785

#N/A

#N/A

#N/A

18

459,7537

6

#N/A

#N/A

#N/A

19

1.732.393.319,2293

5.652.135,3162

#N/A

#N/A

#N/A

(x4)

(x3)

(x2)

(x1)

b

 

y = 27,64*x1 +
12.530*x2 + 2.553*x3 – 234,24*x4
+ 52.318

Ahora el programador puede calcular el valor tasado de
un edificio de oficinas en la misma zona con 2.500 metros
cuadrados, tres oficinas, dos entradas y una antigüedad de
25 años, utilizando la ecuación
siguiente:

y = 27,64*2.500 + 12.530*3 + 2.553*2 – 234,24*25 +
52.318 = 158.261 $

Para el análisis de los resultados presentados en
la tabla anterior se utiliza la distribución F para determinar si
todas las variables son significativas y la distribución
t, para determinar la importancia de cada una de las
variables independientes en el análisis de
regresión.

Utilización del Estadístico
t

Para medir el grado de significación de las
variables independientes en cada una de las variables
dependientes se utilizó el estadístico t,
para los siguientes parámetros:

  • Grados de Libertad
  • G.L. = n – (k+ 1) =
    6
  • Donde k = Número de variables independientes
    en el análisis de regresión (4)
  • y n = Número de datos considerados
    (11)
  • Intervalo de confianza del 95 %, dado por ( 1 –
    a ), donde a = 0,05

Es una prueba hipotética determinará si
cada coeficiente es útil para estimar el valor tasado de
un edificio de oficinas del ejemplo. Por ejemplo, para probar si
el coeficiente de antigüedad tiene significado
estadístico, divida -234,24 (coeficiente de la pendiente
de antigüedad) entre 13,268 (el error estándar
estimado de los coeficientes de antigüedad en la celda A15).
El siguiente es el valor t observado:

t4 = m4 ÷ se4 =
-234,24 ÷ 13,268 = -17,7

Los valores de t para cada variable
serán:

Variable

valor t
observado

Superficie

5,1

Número de
oficinas

31,3

Número de
entradas

4,8

Edad

17,7

Se realiza un contraste de hipótesis:

H0 : mi = 0

H1 : mi  0

Si se consulta una tabla de un manual de
estadística, observará que el valor t
crítico, de dos colas, con 6 grados de libertad y
alfa = 0,05 es 2,447. Este valor crítico puede encontrarse
también utilizando la función DISTR.T.INV de Excel.
DISTR.T.INV (0,05.6) = 2,447. Puesto que el valor absoluto de
t1 = 17,7, es superior a 2,447; la antigüedad es
una variable importante para estimar el valor tasado de un
edificio de oficinas. El significado estadístico de cada
una de las demás variables independientes puede probarse
de forma similar, con los valores de t obtenidos para cada una de
las variables independientes.

Si el valor absoluto de t es suficientemente alto, puede
deducirse que el coeficiente de la pendiente es útil para
calcular el valor tasado del edificio de oficinas del
ejemplo.

En este caso con un nivel de significación de
= 0,05, todos los valores tienen un valor
absoluto superior a 2,447; por tanto, todas las variables
utilizadas en la ecuación de regresión son
útiles (individualmente significativas en la
explicación de la variable dependiente) para predecir el
valor tasado de los edificios de oficinas de esta
área.

Utilización del Estadístico
R2 y F

En el ejemplo, el coeficiente de determinación, o
r2, es 0,99675 (consultar la celda A17 en el resultado
de ESTIMACION.LINEAL), que indicaría una relación
marcada entre las variables independientes y el precio de
venta.

Puede utilizarse el estadístico F para
determinar si estos resultados, con un valor r2 tan
alto, se produjeron por azar. Suponga por un momento que en
realidad no existe relación entre las variables, pero que
ha extraído una muestra peculiar de 11 edificios de
oficinas que hace que el análisis estadístico
demuestre una relación marcada.

F (estadístico) y df (Grados de Libertad) en la
salida ESTIMACION.LINEAL se pueden utilizar para determinar la
probabilidad
de que se produzca por azar un valor F más elevado. F se
puede comparar con los valores críticos de las tablas de
distribución F.

En el contraste de hipótesis, para
verificar si el grupo de variables independientes explican el
fenómeno en forma conjunta se utilizó el
estadístico F, con los siguientes
parámetros:

  • Grados de Libertad

1 = k = 4 (G.L. para el
numerador)

2 = n – (k+ 1) = 6 (G.L. para el
denominador)

Donde k = Número de variables independientes
en el análisis de regresión (4) y n =
Número de observaciones considerados (11)

  • Intervalo de confianza del 95 %, dado por ( 1 –
     )

 = 0,05

En el ejemplo, GL = 6 (celda B18) y F = 459,7537
(celda A18).

El valor crítico de F es 4,53 (en la tabla),
puesto que F = 459,7537 es mucho más elevado que 4,53, es
extremadamente improbable que un valor F tan elevado se produzca
por azar. (Con Alfa = 0,05, la hipótesis de que no hay
relación entre las variables independientes y la variable
dependiente hay que rechazarla cuando F sobrepasa el nivel
crítico, 4,53). Con DISTR.F
(F,1,2) de
Excel se puede obtener la probabilidad de que se produzca al azar
un valor F superior, o se la probabilidad de que un valor F tan
elevado se produzca por azar. DISTR.F(459,753674. 4. 6) =
1,37E-7, una probabilidad extremadamente pequeña. Recuerde
que es vital utilizar los valores correctos de
1 y 2 calculados
anteriormente. Con lo cual se concluye que las variables
independientes en conjunto son significativas para explicar el
comportamiento
de la variable dependiente.

Otro Ejemplo de Regresión lineal
múltiple para tasar un terreno
(tomado de Stumps Marco
Aurelio. Metodología para la Tasación de Inmuebles.
1 a Ed. en español,
Miguel Camacaro Ediciones, Caracas, Venezuela.2006)

Suponga que un se desea tasar un inmueble de 360
m2 en un sector calificado como seis (6), a siete (7)
Km. de distancia al centro comercial de la ciudad. Los datos
obtenidos de un conjunto de terrenos vendidos en la región
son los siguientes:

Utilizando la Función de Excel, y suponiendo que
existe una relación de línea recta entre cada
variable independiente (x1, x2 y
x3) y la variable dependiente (Y), el valor de los
edificios de oficinas en esa área.

=ESTIMACION.LINEAL(conocido_y,
conocido_x,VERDADERO,VERDADERO)

Cuando se introduce como una matriz, se devuelven las
siguientes estadísticas de regresión. Utilice esta
clave para identificar las estadísticas
deseadas.

Para obtener la ecuación de regresión
siguiente:

Y = 52.331,3996 + 49,9363 x
Área – 7.341,0634 x Distancia + 2.277,1421 x
Local

Para el análisis de los resultados también
se utilizará la distribución F para
determinar si todas las variables son significativas y la
distribución t, para determinar la importancia de
cada una de las variables independientes en el análisis de
regresión.

Utilización del Estadístico
t

Para medir el grado de significación de las
variables independientes en cada una de las variables
dependientes se utilizó el estadístico t,
para los siguientes parámetros:

  • Grados de Libertad
  • G.L. = n – (k+ 1) =
    8
  • Donde k = Número de variables independientes
    en el análisis de regresión (3) y n =
    Número de datos considerados (12)
  • Intervalo de confianza del 95 %, dado por ( 1 –
    a ), donde a = 0,05

Los valores de t para cada variable
serán:

Variable

valor t
observado

Área

14,45

Distancia

11,33

Local

7,62

Se realiza una contraste de hipótesis, tal como
se realizó con el ejemplo anterior, y se consulta una
tabla de un manual de estadística, observará que el
valor t crítico, de dos colas, con 8 grados de libertad y
alfa = 0,05 es 2,306. Este valor crítico puede encontrarse
también utilizando la función DISTR.T.INV de Excel.
DISTR.T.INV (0,05.8) = 2,306. Puesto que el valor absoluto de
t1 = 14,45, es superior a 2,306; el área es una
variable importante para estimar el valor tasado del terreno. El
significado estadístico de cada una de las demás
variables independientes puede probarse de forma similar, con los
valores de ti obtenidos para cada una de las variables
independientes.

Si el valor absoluto de t es suficientemente alto, puede
deducirse que el coeficiente de la pendiente es útil para
calcular el valor tasado del terreno en el ejemplo.

En este caso con un nivel de significación de
= 0,05, todos los valores tienen un valor
absoluto superior a 2,306; por tanto, todas las variables
utilizadas en la ecuación de regresión son
útiles (individualmente significativas en la
explicación de la variable dependiente) para predecir el
valor tasado del terreno.

Utilización del Estadístico
R2 y F

En el ejemplo, el coeficiente de determinación, o
r2, es 0,9894 (consultar las estadísticas de
regresión en el resultado de ESTIMACION.LINEAL), que
indicaría una relación marcada entre las variables
independientes y el precio de venta.

Puede utilizarse el estadístico F para
determinar si estos resultados, con un valor r2 tan
alto, se produjeron por azar. Suponga por un momento que en
realidad no existe relación entre las variables, pero que
ha extraído una muestra peculiar de 12 terrenos vendidos
que hace que el análisis estadístico demuestre una
relación marcada.

F (estadístico) y df (Grados de Libertad) en la
salida ESTIMACION.LINEAL se pueden utilizar para determinar la
probabilidad de que se produzca por azar un valor F más
elevado. F se puede comparar con los valores críticos de
las tablas de distribución F.

En el contraste de hipótesis, para verificar si
el grupo de variables independientes explican el fenómeno
en forma conjunta se utilizó el estadístico F, con
los siguientes parámetros:

  • Grados de Libertad

1 = k = 3 (G.L. para el
numerador)

2 = n – (k+ 1) = 8 (G.L. para el
denominador)

Donde k = Número de variables independientes
en el análisis de regresión (3) y n =
Número de observaciones considerados (12)

  • Intervalo de confianza del 95 %, dado por ( 1 –
     )

 = 0,05

F = 250,1882 (consultar las
estadísticas de regresión en el resultado de
ESTIMACION.LINEAL)

Realizando el contraste de hipótesis, tal como se
efectuó en el ejemplo anterior, y se consulta una tabla de
un manual de estadística, observará que el valor
crítico de F es 4,07 (en la tabla), puesto que F =
250,1882 es mucho más elevado que 4,07, es extremadamente
improbable que un valor F tan elevado se produzca por azar. (Con
Alfa = 0,05, la hipótesis de que no hay relación
entre las variables independientes y la variable dependiente hay
que rechazarla cuando F sobrepasa el nivel crítico, 4,07).
Con
DISTR.F(F,1,2)
de Excel se puede obtener la probabilidad de que se produzca al
azar un valor F superior, o se la probabilidad de que un valor F
tan elevado se produzca por azar. DISTR.F(250,1882. 3. 8) =
3,03145E-8, una probabilidad extremadamente pequeña.
Recuerde que es vital utilizar los valores correctos de
1 y 2 calculados
anteriormente. Con lo cual se concluye que las variables
independientes en conjunto son significativas para explicar el
comportamiento de la variable dependiente.

Con lo cual el terreno se puede tasar de la siguiente
forma:

Y = 52.331,3996 + 49,9363 x
Área – 7.341,0634 x Distancia + 2.277,1421 x
Local

Y = 52.331,3996 + 49,9363 x 330
– 7.341,0634 x 7 + 2.277,1421 x 6

BIBLIOGRAFÍA

  • Damodar Gujarati. Econometría Básica.
    Ed. en
    español, Mc GRAW- HILL LATINOAMERICANA,
    Bogotá, Colombia.1998.
  • Stumps Marco Aurelio. Metodología para la
    Tasación de Inmuebles. 1 a Ed. en
    español, Miguel Camacaro Ediciones,
    Caracas, Venezuela.2006.
  • Shao Stephen, Estadística para Economistas y
    Administradores de Empresas. Ed.
    Herrero Hermanos. México.1970.
  • Microsof Excel. Ayuda de la Función
    ESTIMACION.LINEAL de Regresión Lineal
    Múltiple.
  • http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml
  • Torino H . Resumen del
    libro de Estadísticas de Berenson
    y Levine

Dirección: http://

www.mografias.com/trabajos13
/beren/beren.shtml
)

dirección: http://www.mografias.com/trabajos7/beren/beren.shtml)

  • El Rincón Del Vago, SL C Toro 76,2º
    Salamanca (España)

Dirección:
http://htlm.rincondelvago.com/estadistica/html)

  • arte
  • Galdos Cálculo y Estadística III
    Edición Única. Grupo La Republica.
    Lima Perú;2005.
  • Cannavos G.
    Probabilidad y Estadística
    Aplicación y
    métodos. Ed. en
    español Mc GRAW- HILL/INTERAMERICANA
    DE MEXICO.1995.

Valores de F para las probabilidades
seleccionadas

Valores de F para las probabilidades
seleccionadas

Valores de F para las probabilidades
seleccionadas

 

Ing. Cruz Lezama Osaín

Ingeniero Industrial – Especialista en Finanzas
–Magíster en Gerencia,
Mención Finanzas

Especialista en Operaciones y
Producción – Diplomado en Formación
y Desarrollo Docente

ASESORÍA TÉCNICA Y GERENCIAL ENTRENAMIENTO Y
FORMACIÓN

 

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter