A) Estimación de la ecuación hedónica de los precios de ventas de las propiedades usando solamente las características de la casa y el lote a través de una regresión lineal:

## 
## Call:
## lm(formula = Y ~ ., data = x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -261320  -30393   -7214   20431  834726 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.086e+03  1.574e+04  -0.133 0.894601    
## livarea      1.156e+02  9.705e+00  11.914  < 2e-16 ***
## lotarea      4.582e+00  5.814e-01   7.881 8.71e-15 ***
## bathrms      6.767e+03  5.398e+03   1.253 0.210327    
## fireplce    -6.432e+03  5.086e+03  -1.265 0.206264    
## poolbin      2.255e+04  6.188e+03   3.644 0.000283 ***
## spabin       3.400e+04  1.508e+04   2.255 0.024364 *  
## parkspce     1.967e+03  2.059e+03   0.956 0.339462    
## age          1.532e+03  1.981e+02   7.731 2.67e-14 ***
## stories     -2.890e+04  6.175e+03  -4.680 3.28e-06 ***
## bedrms      -1.501e+03  2.063e+03  -0.728 0.467001    
## rooms       -5.403e+03  2.479e+03  -2.179 0.029552 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 63200 on 968 degrees of freedom
## Multiple R-squared:  0.4338, Adjusted R-squared:  0.4274 
## F-statistic: 67.43 on 11 and 968 DF,  p-value: < 2.2e-16

B) Interpretación del coeficiente “LOTAREA”

## [1] "Se espera que en promedio, para cada aumento de una unidad en el área del lote (en pies cuadrados) haya un aumento de $4.582 en el precio de las casas, manteniendo constantes todas las demás variables predichas del modelo. Este coeficiente es significativo a un nivel de confianza muy alto dado que el valor de p asociado (8.71e-15) es extremadamente bajo, lo que indica una alta confianza en la relación entre el área del lote y el precio de las casas."

C) ¿Cómo considera que los parques locales podrían afectar el precio de las casas?

## [1] "Consideramos que los parques locales afectan positivamente el precio de las casas ya que, al generar mayor valor agregado éstas se vuelven más demandables, por tanto el precio tiende a subir entre mayor sea el metro cuadrado por habitante, pues a la vez a los dueños del proyecto, el m2 adicional es un costo de capital. Además, la calidad ambiental es percibida por las personas como un factor relevante en la decisión de compra por lo que la disposición a pagar (DP) tiende a ser mayor."

D) Agregando el porcentaje del área compuesta por parques locales, se estima nuevamente a través de una regresión lineal simple.

## 
## Call:
## lm(formula = Y ~ ., data = Xp)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -251227  -30319   -7471   19245  834795 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.726e+03  1.564e+04   0.110 0.912097    
## livarea      1.148e+02  9.627e+00  11.928  < 2e-16 ***
## lotarea      4.210e+00  5.836e-01   7.213 1.10e-12 ***
## bathrms      5.235e+03  5.367e+03   0.975 0.329575    
## fireplce    -2.454e+03  5.134e+03  -0.478 0.632708    
## poolbin      2.213e+04  6.138e+03   3.606 0.000327 ***
## spabin       3.442e+04  1.496e+04   2.301 0.021581 *  
## parkspce     1.648e+03  2.043e+03   0.807 0.420100    
## age          1.469e+03  1.971e+02   7.452 2.03e-13 ***
## stories     -2.743e+04  6.134e+03  -4.472 8.67e-06 ***
## bedrms      -1.361e+03  2.046e+03  -0.665 0.506015    
## rooms       -5.710e+03  2.460e+03  -2.321 0.020486 *  
## pctlprk      2.444e+04  5.895e+03   4.145 3.69e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 62670 on 967 degrees of freedom
## Multiple R-squared:  0.4437, Adjusted R-squared:  0.4368 
## F-statistic: 64.28 on 12 and 967 DF,  p-value: < 2.2e-16
## [1] "la interpretación sería que por cada aumento del 1% en el porcentaje de área total de tierra destinada a parques locales, se espera un aumento de $24,440 en el precio de las casas, manteniendo constantes todas las demás variables del modelo. Además, tiene un alto grado de significancia. Sin embargo, con una incertidumbre con respecto al coeficiente estimado de 5,895 por lo tanto, el resultado se podría encontrar dentro del intervalo de confianza de (13,654, 34,234)."
## [1] "Ahora bien, el coeficiente estimado es altamente probable que contenga sesgo, pues no se han incluido todas las variables relevantes en el modelo lo que puede estar causando omision de variables relevantes o también presencia de endogeneidad en el modelo. A la vez, se esta asumiendo una distribución normal en los errores, estimando por OLS. Por último, existe el riesgo de multicolinealidad, es decir, una correlación entre variables predichas lo que puede hacer que los coeficientes estimados sean sesgados."

E) Agregando una variable Dummy, la ciudad de “paloalto”, California.

## 
## Call:
## lm(formula = Y ~ ., data = XD)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -252666  -28561   -6187   18273  839063 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -5.049e+02  1.508e+04  -0.033 0.973294    
## livarea      1.107e+02  9.295e+00  11.915  < 2e-16 ***
## lotarea      4.412e+00  5.632e-01   7.834 1.24e-14 ***
## bathrms      8.206e+03  5.186e+03   1.582 0.113918    
## fireplce    -5.641e+03  4.964e+03  -1.136 0.256139    
## poolbin      2.288e+04  5.919e+03   3.866 0.000118 ***
## spabin       3.851e+04  1.443e+04   2.669 0.007737 ** 
## parkspce     1.487e+03  1.970e+03   0.755 0.450532    
## age          1.236e+03  1.920e+02   6.439 1.89e-10 ***
## stories     -2.590e+04  5.918e+03  -4.376 1.34e-05 ***
## bedrms      -1.405e+03  1.973e+03  -0.712 0.476541    
## rooms       -4.940e+03  2.374e+03  -2.081 0.037682 *  
## pctlprk      2.362e+04  5.685e+03   4.155 3.54e-05 ***
## paloalto     9.925e+04  1.153e+04   8.605  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 60430 on 966 degrees of freedom
## Multiple R-squared:  0.4833, Adjusted R-squared:  0.4764 
## F-statistic: 69.51 on 13 and 966 DF,  p-value: < 2.2e-16
## [1] "Al incluir una variable Dummy como por ejemplo la ciudad de Palo Alto, refleja el efecto específico de la ciudad de Palo Alto en el precio de venta de las propiedades, permitiendo capturar y controlar las diferencias promedio entre Palo Alto y las demás ciudades. Ahora bien, no necesariamente implica que se estén controlando factores específicos como ubicación geográfica, características socioeconómicas o demanda del mercado inmobiliario. Estos factores podrían estar relacionados con la ciudad de Palo Alto, pero la inclusión de la variable dummy por sí sola no proporciona esa información precisa sobre los factores controlados en el modelo. Si bien se podria extrapolar ciertas conclusiones acerca de la ciudad y sus caracteristicas, ésto no sería totalmente correcto."

F) Agregando efectos fijos

## 
## Call:
## lm(formula = Y ~ ., data = Xff)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -152323  -18211   -4240   11926  866857 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -5.893e+04  2.325e+04  -2.535 0.011404 *  
## livarea      8.330e+01  8.833e+00   9.430  < 2e-16 ***
## lotarea      2.974e+00  5.338e-01   5.572 3.27e-08 ***
## bathrms      3.012e+03  4.747e+03   0.635 0.525826    
## fireplce    -2.772e+03  4.531e+03  -0.612 0.540759    
## poolbin      1.421e+04  5.397e+03   2.632 0.008613 ** 
## spabin       1.561e+04  1.320e+04   1.183 0.237212    
## parkspce     1.118e+03  1.798e+03   0.622 0.534295    
## age          6.442e+02  1.993e+02   3.233 0.001266 ** 
## stories     -1.182e+04  5.455e+03  -2.166 0.030560 *  
## bedrms      -1.204e+03  1.795e+03  -0.671 0.502653    
## rooms       -2.505e+03  2.174e+03  -1.152 0.249581    
## pctlprk      1.550e+02  5.675e+03   0.027 0.978215    
## herf80       2.681e+05  1.490e+05   1.799 0.072345 .  
## medy80      -5.023e-01  1.166e+00  -0.431 0.666658    
## medage80     1.725e+03  5.257e+02   3.281 0.001072 ** 
## timecntr     4.647e+02  8.741e+02   0.532 0.595110    
## timesj       1.352e+03  4.092e+02   3.305 0.000984 ***
## timeappl    -3.620e+03  6.296e+02  -5.749 1.21e-08 ***
## timelock     1.248e+03  5.318e+02   2.346 0.019172 *  
## prkexppc     3.668e+02  2.216e+02   1.655 0.098218 .  
## totexppc     1.869e+00  1.475e+01   0.127 0.899203    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 54680 on 958 degrees of freedom
## Multiple R-squared:  0.5806, Adjusted R-squared:  0.5714 
## F-statistic: 63.14 on 21 and 958 DF,  p-value: < 2.2e-16
## [1] "pctlprk disminuye a 1.550e+02 (recuerdese que en el primer modelo solo con las caracteristicas de las viviendas, el lote y pctlprk el resultado de éste último nos dió 2.444e+04), además que no es significativo. Esto indica que una vez que se controlan las características específicas de cada ciudad como factores de localización y de vecindarios, la relación entre pctlprk y el precio de las viviendas se vuelve menos pronunciada."

Ciudad y Efectos fijos

## 
## Call:
## lm(formula = Y ~ ., data = Xfc)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -149770  -18168   -3696   11750  863535 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.581e+04  2.764e+04  -0.934 0.350553    
## livarea      7.831e+01  8.741e+00   8.959  < 2e-16 ***
## lotarea      2.678e+00  5.375e-01   4.983 7.43e-07 ***
## bathrms      2.767e+03  4.683e+03   0.591 0.554792    
## fireplce    -2.851e+03  4.509e+03  -0.632 0.527369    
## poolbin      1.217e+04  5.315e+03   2.291 0.022201 *  
## spabin       1.755e+04  1.299e+04   1.351 0.177041    
## parkspce     1.098e+03  1.767e+03   0.621 0.534433    
## age          4.615e+02  1.987e+02   2.323 0.020410 *  
## stories     -9.049e+03  5.387e+03  -1.680 0.093335 .  
## bedrms      -1.088e+03  1.765e+03  -0.616 0.537793    
## rooms       -1.609e+03  2.142e+03  -0.751 0.452747    
## pctlprk     -1.678e+03  5.765e+03  -0.291 0.771105    
## paloalto     7.586e+04  4.284e+04   1.771 0.076918 .  
## saratoga     2.549e+04  1.532e+04   1.664 0.096357 .  
## losaltos     1.030e+05  2.406e+04   4.280 2.06e-05 ***
## gilroy       1.972e+04  2.248e+04   0.877 0.380656    
## herf80       2.749e+05  1.595e+05   1.724 0.085099 .  
## medy80      -7.858e-01  1.228e+00  -0.640 0.522370    
## medage80     1.461e+03  5.245e+02   2.785 0.005464 ** 
## timecntr    -1.512e+03  9.320e+02  -1.623 0.104986    
## timesj       8.429e+02  5.984e+02   1.408 0.159329    
## timeappl    -2.375e+03  6.800e+02  -3.492 0.000501 ***
## timelock     1.833e+03  6.357e+02   2.884 0.004017 ** 
## prkexppc     5.498e+02  3.616e+02   1.520 0.128785    
## totexppc    -2.911e+01  1.617e+01  -1.801 0.072045 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 53730 on 954 degrees of freedom
## Multiple R-squared:  0.5967, Adjusted R-squared:  0.5861 
## F-statistic: 56.46 on 25 and 954 DF,  p-value: < 2.2e-16