## # A tibble: 26 x 2
## Area_contruida precio_millon
## <dbl> <dbl>
## 1 86 250
## 2 118 385
## 3 130 395
## 4 181 419
## 5 86 240
## 6 98 320
## 7 170 480
## 8 96 268
## 9 85 240
## 10 170 450
## # ... with 16 more rows
En la siguiente tabla y el siguiente gráfico podemos evidenciar que la menor y la mayor aréa construida son 80 y 195 respectivamente. También podemos evidenciar que el área construída y el precio son directamente proporcionales (cuando la varaiable independiente aumenta, también lo hace la variable dependiente).
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 80.0 86.0 97.0 115.7 130.0 195.0
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 240.0 251.2 305.0 332.1 395.0 480.0
En la siguiente tabla podemos evidenciar que el coeficiente de correlación es de 0.91, lo cual nos indica que las variables están altamente relacionadas. Esto lo podemos corroborar con el siguiente gráfico en el que vemos que la variables son directamente proporcionales.
## [1] 0.9190295
En la siguiente tabla podemos evidenciar que \(R^2=0,8381\), lo cual nos muestra que el valor de cada área es de alrededor de $2,124.
\(\beta_0=86,234\) nos muestra que el valor mínimo para la menor área posible será de $86,234 millones.
La ecuación es \(y_i=2.214+86.234*preciomillon+e_i\)
##
## Call:
## lm(formula = precio_millon ~ Area_contruida)
##
## Residuals:
## Min 1Q Median 3Q Max
## -51.673 -25.612 -6.085 24.875 67.650
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.234 22.479 3.836 0.000796 ***
## Area_contruida 2.124 0.186 11.422 3.45e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared: 0.8446, Adjusted R-squared: 0.8381
## F-statistic: 130.5 on 1 and 24 DF, p-value: 3.45e-11
Debido a que en el intervalo no se incluye el 0 (1.740, 2.507), podemos decir que la muestra es significativa.
## [1] 1092.173
## [1] 1.740199 2.507801
Según la siguiente tabla, debido a que \(R^2=0,8381\) tiene un valor cercano a 1, podemos concluir que efectivamente el modelo se ajusta a la variabilidad de los datos.
##
## Call:
## lm(formula = precio_millon ~ Area_contruida)
##
## Residuals:
## Min 1Q Median 3Q Max
## -51.673 -25.612 -6.085 24.875 67.650
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.234 22.479 3.836 0.000796 ***
## Area_contruida 2.124 0.186 11.422 3.45e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared: 0.8446, Adjusted R-squared: 0.8381
## F-statistic: 130.5 on 1 and 24 DF, p-value: 3.45e-11
Según la seguiente tabla, en promedio el precio para un área de \(110m^2\) es de $319.8706 millones. Sin embargo, un precio justo para este área oscilaría entre los $306.3133 y los $333.4279 millones.
## fit lwr upr
## 1 319.8706 306.3133 333.4279
Según el siguiente gráfico, la distribución es casi idealya que se aproximan a una distribución normal.
## 1 2 3 4 5 6 7
## -18.895336 48.137608 32.649962 -51.672533 -28.895336 25.617018 32.691142
## 8 9 10 11 12 13 14
## -22.135041 -26.771366 2.691142 -31.019307 47.245540 21.104664 -26.771366
## 15 16 17 18 19 20 21
## -18.135041 -18.895336 -18.895336 32.649962 14.154080 -1.151513 67.649962
## 22 23 24 25 26
## -11.019307 22.649962 14.732752 -50.408120 -37.308858
Estos dos puntos no se realizan ya que la distribución es casi ideal, entonces no se puede hacer una comparación del el ajuste y tampoco de los supuestos del modelo inicial y el transformado.