Ponderación de Referenciales por medio del Análisis de Regresión
Logística Múltiple
2. Introduccion al analisis de regresion
logistica
3. Demostracion del metodo para el caso de
variables dicotomicas
4. Aplicación de la correlacion logistica
en la ponderacion de los
referenciales
5. La regresion logistica
multiple
6. Bibliografia
Para la implementación del Método de
Aproximación al Mercado (marketing
approach) es necesario la localización de inmuebles
comparables al objeto del avalúo a fin de cumplir el
axioma: "Inmuebles Similares de Venderán en un Mercado
Abierto a Precios
Similares".
La fuente principal de Datos Comparables
o Referenciales (en Venezuela) son
las Oficinas Subalternas de Registro
Público de la localidad donde se ubique el bien inmueble
objeto del avalúo; sin embargo existen otras fuentes tales
como lo son las Notarías, las Oficinas Municipales de
Catastro y la Prensa.
Nos referimos a las Notas del Registro como la fuente
principal de Datos Referenciales ya que los mismos son "datos
ciertos" que cualquier persona puede
consultar y evidenciar, ya que la información es pública y los mismos
son certificados por un funcionario público (Registrador),
que además de verificar quienes son los otorgantes
(vendedor y comprador), comprueba la tradición legal del
inmueble.
El problema fundamental de las Notas de Registro,
consiste en que una parte significativa de las operaciones de
Compra-Venta
protocolizadas, pueden estar sub-valoradas en función de
la evasión fiscal de los
otorgantes. Sin embargo, desde hace unos pocos años esta
costumbre de protocolizar por menos del valor, ha
disminuido considerablemente en función de el Nuevo
Régimen de Indexación implementado por el Estado
Venezolano para el cálculo
del Impuesto Sobre la
Renta y la reciente autonomía de los Registros
Públicos.
Ante el hecho anterior, pareciese que la prensa tiende a
generar referenciales o comparables mas confiables que los que se
pudiesen localizar en una Oficina
Subalterna de Registro Público; sin embargo la realidad es
otra: En los avisos de prensa, solo se indica el precio que una
de las partes "aspira" por su inmueble, no indicando el precio
definitivo pactado o concertado por "ambas partes" en la
operación de compra-venta.
Por lo tanto, observamos que ambas fuentes (Registro y
Prensa), tienen "fortalezas" y "debilidades", pudiendo concluir
que: "Debería existir una ponderación entre ambas,
de la que resultase una opinión de valor mas afinada que
la de tomar individualmente cada una de ellas".
El objetivo de esta monografía
consiste en presentar una hipótesis sobre el manejo simultáneo
de referenciales provenientes del Registro y de la Prensa
mediante la técnica del Análisis de
Regresión Logística Múltiple con la
finalidad de verificar la teoría
anterior
2. Introduccion
al analisis de regresion logistica
El análisis de regresión logística
es la técnica para el estudio de la relación entre
una o mas variables
independientes (X1, X2,X3….Xn) y una variable dependiente de
tipo dicotómica.
Se define como variable dicotómica aquella que
solo admite dos categorías que definen opciones o características mutuamente excluyentes u
opuestas tales como (Y=SI , Y=NO); (Y=0 , Y=1), (Y=Encendido ,
Y=Apagado).
Un modelo de
regresión logística permite estimar o predecir la
probabilidad
de que un individuo posea una característica (Y=Registro ,
Y=Oferta) en
función de una determinada o unas determinadas
características individuales (X1=Precio Unitario, X2=Edad,
X3=Area …..Xn).
La diferencia fundamental entre el modelo de
regresión lineal y de regresión logística es
que el primero predice el valor medio de la variable dependiente
(Y) a partir de una o mas variables independientes (X1, X2, X3
… Xn); mientras que el segundo permite predecir la
proporción de una de las dos categorías de la
variable dependiente dicotómica (Y=SI , Y=NO) en
función de una o mas variables independientes (X1, X2, X3
… Xn).
La probabilidad, por definición, solo puede
incluir un valor comprendido entre 0 y 1; por lo tanto hay que
desarrollar un modelo matemático que pueda estimar
valores de
P(Y=1) dentro del rango real de 0 a 1.
El modelo matemático que mejor estima tal
probabilidad, debido a que restringe los valores a
su rango 0 < < 1, es el siguiente:
Este modelo comúnmente presenta una forma de "S",
limitada en el eje de las Ordenadas entre los valores 0 y
1
El modelo antes descrito se denomina Función
Logística.
Sustituyendo por la expresión: P(Y=1) .o
sea la probabilidad de que el Precio Unitario de un Referencial
cualesquiera de la serie se corresponda a un "Valor de Prensa",
se obtendrá que la Función Logística
vendrá representada por el modelo No Lineal
siguiente:
Este es el momento de interpretar el significado de esta
función en base a la problemática de los
referenciales obtenidos en el Registro y los obtenidos a
través de la Prensa:
En teoría los Referenciales de Prensa y Registro
deberían ser muy similares para cumplir con el axioma del
mercado (inmuebles similares se venderán a precios
similares). Sin embargo no siempre sucede así, tal como
antes se ha explicado.
P(Y=1) de cada referencial de la serie obtenida en la
Oficina de Registro, se interpretará como la probabilidad
de que el Precio Unitario de cada uno de ellos se equipare con
los Precios Unitarios de la Prensa.
Para el caso de un referencial de registro, una P(Y=1) =
0.65 indica que, la probabilidad de ese referencial de Registro
en equipararse con la serie de referenciales de Prensa es del
65%.
El mismo razonamiento es válido para los
referenciales de Prensa, una P(Y=1) = 0.80, indica que el
referencial de Prensa tiene una Probabilidad del 80% de ser
equiparado a su propia serie (como en realidad es).
Para el mismo referencial de prensa, la Probabilidad
Complementaria (Y=0) = 0.20 = 1-P(Y=1) = 1-0.80; indica que, la
probabilidad de un referencial de Prensa en equipararse con la
serie de referenciales de Registro es del 20%.
3. Demostracion
del metodo para el caso de variables dicotomicas
En el siguiente ejemplo se desarrollará la
metodología aquí explicada. Se
estudiará un Modelo de Regresión Logística
Simple, o sea una variable dicotómica [ (Y=0) ; (Y=1) ]
dependiente y una variable independiente (X).
Se tiene una serie de referenciales obtenidos de dos
fuentes:
correspondientes todos a Precios Unitarios de
Apartamentos en Propiedad
Horizontal en el casco central de la ciudad de Cumaná,
Estado Sucre.
El primer paso, consiste en la Identificación de
la Variable Dicotómica Dependiente: En este caso se
asignará como P(Y=1) a los datos obtenidos de la prensa y
se asignará como P(Y=0) a los datos obtenidos de la
Oficina de Registro.
La Unica Variable Independiente del modelo de
regresión será el Precio Unitario de Apartamentos
(X), expresado en Bs/M2.
Seguidamente se clasificarán y ordenarán
los datos de la manera siguiente:
Una vez examinado los datos anteriores, hay que destacar
lo siguiente:
- Los Datos fueron clasificadas de acuerdo con su
origen - Los Datos fueron ordenadas de menor a mayor de
acuerdo al valor de la variable independiente (X) - Las Variables Dicotómicas Dependientes fueron
definidas Y=1 si el dato es tomado de la Prensa, ó Y=0
si el dato es tomado de la Oficina de Registro
La representación gráfica de estas series
es la siguiente:
El análisis de Regresión Logística,
no es lineal; por lo tanto hay que utilizar un paquete
estadístico dedicado, capaz de resolver este tipo de
correlación no lineal. Para este ejemplo se
utilizará el módulo "Nonlineal Regression",
incluído en el software StatGraphics 5.0
para DOS, sin embargo es posible resolver este tipo de
regresiones con otros programas.
En primer lugar se preparan los datos a enterar al
sowftware estadístico:
VARIABLE | VARIABLE |
INDEPENDIENTE | DICOTOMICA |
Bs/M2 | DEPENDIENTE |
(X) | (Y) |
160,000 | 1 |
190,000 | 1 |
200,000 | 1 |
210,000 | 1 |
210,000 | 1 |
220,000 | 1 |
190,000 | 1 |
100,000 | 0 |
110,000 | 0 |
110,000 | 0 |
130,000 | 0 |
140,000 | 0 |
160,000 | 0 |
130,000 | 0 |
Análisis de la Salida del Programa
Estadístico:
Las dos salidas anteriores se interpretan de la
siguiente manera:
en el modelo de Regresión
Logística:se sustituyen los valores de los parámetros
a y b del modelo:- El modelo de correlación logística
quedará conformado de la siguiente manera: - R-Squared = 0.779348, se refiere al coeficiente de
regresión; indicando que el modelo no-lineal explica el
fenómeno (probabilidad de que un referencial sea de
registro o prensa) en un 78%, indicando que la
correlación existe.
4. Aplicación de la
correlacion logistica en la ponderacion de los
referenciales
En el punto anterior, se estudió paso a paso la
obtención del Modelo de Correlación
Logística de dos series de referenciales.
En este ejemplo numérico, se aplicará el
método estudiado a fin de obtener en un avalúo real
la ponderación entre los referenciales de la prensa y los
referenciales del registro a fin de generar un valor ponderado en
proporción a las dos series de datos.
Se desea obtener el valor de una parcela de terreno de
1,500 M2 en el sector conocido como Los Villarroel, Municipio
Autónomo Díaz del Esto Nueva Esparta.
Clasificación y Orden de los Datos
Referenciales:
Corrección por Area:
Corrección por Actualización
Cálculo del Valor Unitario Promedio de cada
Serie:
Cálculo de los pesos de cada Serie aplicando la
metodología de Regresión
Logística:
Serie Sin Corregir:
Salidas del Paquete Estadístico:
Modelo de Correlación
Logística:
Representación Gráfica:
Cálculo de la Ponderación (Registro vs.
Prensa)
Seguidamente se procederá a calcular los pesos
proporcionales correspondiente al Promedio Corregido de la serie
de Referenciales de Registro y de la serie de Referenciales de
Prensa.
Se calculará la Probabilidad P(Y=1)
correspondiente al Promedio Corregido de la Serie de
Referenciales de Prensa:
P(Y=1) = 0.8854
Se interpretará P(Y=1) = 0.8854, como la
Probabilidad de que el Promedio Corregido de la Serie de
Referenciales de Prensa sea efectivamente un Valor de Prensa; por
lo tanto su Probabilidad Complementaria P(Y=0) será 1 –
P(Y=1) = 1 – 0.8854 = 0.1146.
Por lo tanto los Pesos Proporcionales para cada uno de
los Promedios (Referenciales de Registro y Referenciales de
Prensa) serán:
Cálculo del Valor del Terreno:
5. La regresion logistica
multiple
Toda la teoría vista hasta ahora
(Regresión Logística Simple), aplicada a Dos (2)
Variables, una independiente y la otra dependiente y
dicotómica, es válida en el caso de la
Regresión Logística Múltiple.
La Regresión Logística Múltiple
podrá expresarse de la siguiente manera:
Este modelo genera una Probabilidad (del 0 al 1) en base
a múltiples variables independientes.
Debido a que una de las variables independientes,
necesariamente debe ser el Precio Unitario y si también se
seleccionara la Variable Independiente Area; se podría
presentar problemas de
Multicolinealidad entre esas dos variables, por estar una
función de la otra.
En estos casos es obligatorio el uso de la Matriz de
Correlación para determinar si efectivamente las dos
variables independientes estuviesen
autocorrelacionadas.
El paquete estadístico, deberá poder generar
la Matriz de Correlación a fin de poder detectar problemas
de Multicolinealidad entre las variables independientes. En caso
de que no fuera así, es preferible no enterar en el modelo
la Variable Independiente Area.
Ejemplo de la aplicación del
Método:
Se necesita saber el Valor de un Apartamento con un
área de 75 M2, tiene 5 años de haberse
construído y que está ubicado en la
urbanización Bella Vista de la ciudad de
Maracaibo.
Se obtuvieron los siguientes referenciales de
apartamentos con áreas muy similares, tomados de la
Oficina Subalterna del 1er. Circuito del Dtto. Maracaibo y del
periódico "Panorama":
Expresado En Miles De
Bolivares
Corrección por Depreciación y Obsolescencia:
PRENSA
Calculo de los Valores Unitarios Promedio
Corregidos:
Cálculo de la Ponderación (Registro vs.
Prensa)
Seguidamente se procederá a calcular los pesos
proporcionales correspondiente al Promedio Corregido de la serie
de Referenciales de Registro y de la serie de Referenciales de
Prensa.
Serie sin Corregir:
Y = 0 : Registro
Y = 1 : Prensa
Salidas del Paquete Estadístico:
Análisis de las Salidas del Paquete
Estadístico
Donde: X1: Variable Precio Unitario
X2: Variable Edad
- El modelo de Correlación Logística
Múltiple es: - No existe Multicolinealidad entres las Variables
Independientes. - El Coefieciente de Determinación indica que el
fenómeno es explicado por las Variables X1, X2 y Y en un
88.18%.
Se calculará la Probabilidad P(Y=1)
correspondiente al Promedio Corregido de la Serie de
Referenciales de Prensa y a la Edad del Edificio:
P(Y=1) = 0.99
Se interpretará P(Y=1) = 0.99, como la
Probabilidad de que el Promedio Corregido de la Serie de
Referenciales de Prensa sea efectivamente un Valor de Prensa; por
lo tanto su Probabilidad Complementaria P(Y=0) será 1 –
P(Y=1) = 1 – 0.99 = 0.01.
Por lo tanto los Pesos Proporcionales para cada uno de
los Promedios (Referenciales de Registro y Referenciales de
Prensa) serán:
En Miles de Bolívares por
M2
Cálculo del Valor del Apartamento:
Representación Gráfica:
Alvarez Caceres, R., Estadística multivariante y no
paramétrica con SPSS, Madrid, Editorial Díaz
Santos,1994.
Carrasco, J. L. y Hernan, M. A., Estadística
multivariante en las ciencias de la
vida, Madrid, Editorial Ciencia 3,
1993.
Hosmer, D. W.; TABER, S y Lemeshow, S., Applied logistic
regression, New York, Editorial John Wiley, 1989
Jovell, A. J., Análisis de regresión
logística, Madrid, Ediciones del Centro de Investigaciones
Sociológicas, 1995
Kleinbaum, D.G., Logistic regression. A self-learning
text, New York, Editorial Springer-Verlag, 1994
Piol Puppio, R., Herramientas
estadísticas básicas, 2da. parte:
Análisis de variables múltiple, Soitave, 1990 –
1997
Autor:
Ing. Roberto Piol Puppio
SOITAVE 260
Caracas, 6 de Abril de 1998