INTRODUCCIÓN

De acuerdo con cifras del DANE, resultantes de las Encuestas Nacionales de Calidad de vida de 2020, de 51.52 millones de habitantes solo el 42,1% de colombianos cuentan como una vivienda propia. El resto de los cuales opta por opciones de arrendamiento. Considerando la cotidianidad de lo anterior, se realizará un modelo de regresión lineal múltiple que pretenda estudiar las variaciones en el pago por arrendamiento que realizan los colombianos, considerando el tipo de vivienda, el estrato y la cantidad de habitaciones de esta. Los datos serán extraídos de la Gran Encuesta integrada de Hogares (datos sobre hogares y viviendas diciembre de 2022).

ggplotly(p)

MODELO

Las variables tomadas son: - Pago por arrendamiento(P5140) - Tipo de vivienda (P4000): a) Casa b) Apartamento - Estrato socieconómico para tarifa de energía (P4030S1A1): a) 1 Bajo - Bajo b) 2 Bajo c) 3 Medio - Bajo d) 4 Medio e) 5 Medio – Alto f) 6 Alto g) 9 No sabe o cuenta con planta eléctrica - Incluyendo sala-comedor ¿de cuántos cuartos en total dispone este hogar? (P5000)
## 
## Call:
## lm(formula = P5140 ~ as.factor(P4000) + as.factor(P4030S1A1) + 
##     P5000, data = viv_arrend)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2596307  -123549   -20605    85167 21403594 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             100338      17230   5.823 5.96e-09 ***
## as.factor(P4000)2        14790       9295   1.591    0.112    
## as.factor(P4030S1A1)2    98288      10594   9.278  < 2e-16 ***
## as.factor(P4030S1A1)3   279439      11966  23.353  < 2e-16 ***
## as.factor(P4030S1A1)4   566614      17638  32.124  < 2e-16 ***
## as.factor(P4030S1A1)5   883819      31692  27.887  < 2e-16 ***
## as.factor(P4030S1A1)6  2080945      54819  37.960  < 2e-16 ***
## P5000                    80067       4740  16.893  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 407400 on 9093 degrees of freedom
## Multiple R-squared:  0.3032, Adjusted R-squared:  0.3027 
## F-statistic: 565.4 on 7 and 9093 DF,  p-value: < 2.2e-16

SIGNIFICANCIA

Debe verificarse que las variables regresoras tengan un valor significativo de explicación para la variable regresada, razón por la cuál deben adelantarse la siguientes pruebas de hipótesis

Regla de decisión:

\(H_0i\): \(β_i\) = 0 \(H_αi\): \(β_i\) != 0 α = 0.05

Se rechaza \(H_0\) para casi todos los \(β_i\), exceptuando el de apartamentos. Con lo cuál podemos afirmar que existe suficiente evidencia estadísitica para corroborar que todas las variables son significativas excepto tipo de vivienda.

Prueba F de Fischer de significancia global:

\(H_0i\): \(β_1\) = \(β_2\) = \(β_3\) = \(β_4\) = \(β_5\) = \(β_6\) = \(β_7\) = 0 \(H_αi\): Al menos un β es significativo α = 0.05

Se rechaza \(H_0\), al menos una variable del modelo. De lo anterior afirmamos que, existe al menos una variable que aporta a la explicación del precio de los apartamentos.

##PRUEBAS SOBRE LOS RESIDUALES

Prueba gráfica:

Prueba de normalidad:

\(H_0\): u_i ~ N( 0, \(σ^2\) ) \(H_α\): Los errores no se distribuyen normalmente α = 0.05

## 
##  Jarque Bera Test
## 
## data:  linear_model$residuals
## X-squared = 425251240, df = 2, p-value < 2.2e-16

Se rechaza \(H_0\), los errores no se distribuyen normalmente, por lo tanto, no se puede hacer inferencia estadística sobre el estimador MCO. Adicionalmente,el modelo solo trabaja bien para realizar pronósticos sobre los datos de la muestra.

##Prueba de varianza constante:

\(H_0\): Varianza constante (Errores homocedásticos) \(H_α\): Varianza no constante (Errores heterocedásticos) α = 0.05

## 
##  studentized Breusch-Pagan test
## 
## data:  linear_model
## BP = 191.43, df = 7, p-value < 2.2e-16

Se rechaza \(H_0\), los errores son heterocedásticos. Podría realizarse una transformación en la forma funcional del modelo o estimarlo mediante MCG para correguir heterocedasticidad.

INTERPRETACIONES

\(β_1\): Esta variable no es significativa, pero si lo fuese, se interpretaría de la siguiente forma: Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de un apartamento sea $14790 mayor que el de una casa, independientemente del estrato, ceteris paribus.

\(β_2\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 2 sea $98288 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.

\(β_3\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 3 sea $279439 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.

\(β_4\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 4 sea $566614 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.

\(β_5\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 5 sea $883819 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.

\(β_6\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 6 sea $2080945 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.

\(β_7\): Ante un incremento de 1 en el número de cuartos en una vivienda se espera que el precio de arrendamiento de la misma incremente en 80067, independientemente del tipo de la vivienda y del estrato, ceteris paribus.

\(β_0\): Ya que el coeficiente del intercepto es significativo y su error estándar no es muy grande, se puede realizar una interpretación sobre su valor de la siguiente forma: Una vivienda de estrato 1 con una habitación tendría un costo de arrendamiento estimado de 100338.

\(R^2\): El modelo captura un 30,32% de la variación total del precio de arrendamiento de una vivienda en Colombia, dejando sin explicar el 69,68%