INTRODUCCIÓN
ggplotly(p)
##
## Call:
## lm(formula = P5140 ~ as.factor(P4000) + as.factor(P4030S1A1) +
## P5000, data = viv_arrend)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2596307 -123549 -20605 85167 21403594
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 100338 17230 5.823 5.96e-09 ***
## as.factor(P4000)2 14790 9295 1.591 0.112
## as.factor(P4030S1A1)2 98288 10594 9.278 < 2e-16 ***
## as.factor(P4030S1A1)3 279439 11966 23.353 < 2e-16 ***
## as.factor(P4030S1A1)4 566614 17638 32.124 < 2e-16 ***
## as.factor(P4030S1A1)5 883819 31692 27.887 < 2e-16 ***
## as.factor(P4030S1A1)6 2080945 54819 37.960 < 2e-16 ***
## P5000 80067 4740 16.893 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 407400 on 9093 degrees of freedom
## Multiple R-squared: 0.3032, Adjusted R-squared: 0.3027
## F-statistic: 565.4 on 7 and 9093 DF, p-value: < 2.2e-16
Debe verificarse que las variables regresoras tengan un valor significativo de explicación para la variable regresada, razón por la cuál deben adelantarse la siguientes pruebas de hipótesis
Regla de decisión:
\(H_0i\): \(β_i\) = 0 \(H_αi\): \(β_i\) != 0 α = 0.05
Se rechaza \(H_0\) para casi todos los \(β_i\), exceptuando el de apartamentos. Con lo cuál podemos afirmar que existe suficiente evidencia estadísitica para corroborar que todas las variables son significativas excepto tipo de vivienda.\(H_0i\): \(β_1\) = \(β_2\) = \(β_3\) = \(β_4\) = \(β_5\) = \(β_6\) = \(β_7\) = 0 \(H_αi\): Al menos un β es significativo α = 0.05
Se rechaza \(H_0\), al menos una variable del modelo. De lo anterior afirmamos que, existe al menos una variable que aporta a la explicación del precio de los apartamentos.##PRUEBAS SOBRE LOS RESIDUALES
\(H_0\): u_i ~ N( 0, \(σ^2\) ) \(H_α\): Los errores no se distribuyen normalmente α = 0.05
##
## Jarque Bera Test
##
## data: linear_model$residuals
## X-squared = 425251240, df = 2, p-value < 2.2e-16
Se rechaza \(H_0\), los errores no se distribuyen normalmente, por lo tanto, no se puede hacer inferencia estadística sobre el estimador MCO. Adicionalmente,el modelo solo trabaja bien para realizar pronósticos sobre los datos de la muestra.
##Prueba de varianza constante:
\(H_0\): Varianza constante (Errores homocedásticos) \(H_α\): Varianza no constante (Errores heterocedásticos) α = 0.05
##
## studentized Breusch-Pagan test
##
## data: linear_model
## BP = 191.43, df = 7, p-value < 2.2e-16
Se rechaza \(H_0\), los errores son heterocedásticos. Podría realizarse una transformación en la forma funcional del modelo o estimarlo mediante MCG para correguir heterocedasticidad.
\(β_1\): Esta variable no es significativa, pero si lo fuese, se interpretaría de la siguiente forma: Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de un apartamento sea $14790 mayor que el de una casa, independientemente del estrato, ceteris paribus.
\(β_2\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 2 sea $98288 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.
\(β_3\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 3 sea $279439 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.
\(β_4\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 4 sea $566614 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.
\(β_5\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 5 sea $883819 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.
\(β_6\): Dado un número de cuartos para la vivienda, se espera que el precio de arriendo de una vivienda de estrato 6 sea $2080945 mayor que el de una de estrato 1, independientemente del tipo, ceteris paribus.
\(β_7\): Ante un incremento de 1 en el número de cuartos en una vivienda se espera que el precio de arrendamiento de la misma incremente en 80067, independientemente del tipo de la vivienda y del estrato, ceteris paribus.
\(β_0\): Ya que el coeficiente del intercepto es significativo y su error estándar no es muy grande, se puede realizar una interpretación sobre su valor de la siguiente forma: Una vivienda de estrato 1 con una habitación tendría un costo de arrendamiento estimado de 100338.
\(R^2\): El modelo captura un 30,32% de la variación total del precio de arrendamiento de una vivienda en Colombia, dejando sin explicar el 69,68%