2/6/2020

Descripción

En este documento se presentará la solución al Caso C&A, utilizando la tecnica de regresión, el caso es el siguiente:

PROBLEMA

Hace dos días, Isabella recibió una carta urgente del presidente de la Lonja de bienes raícesen Cali, pues había recibido quejas de dos personas que habían ofrecido y vendido suscasas a través de C&A en el mes anterior. El presidente informó a Isabella de estas quejasy le dió la oportunidad de responder los demandantes.

Las dos personas que acusan a C&A de ofrecer sus casas a menor precio para acelerarlas ventas argumentan que una de las casa estaba ubicada en la zona sur de la ciudad,tenia cuatro años de construida, 2190 pies cuadrados, y se vendió en \(\$88,5\) mil dólares. Lasegunda casa se ubica en el norte de la ciudad, tenia nueve años de construida, \(1848\) piescuadrados, y se vendió en \(\$79,5\) mil dólares. Las dos casas en cuestión tenían tres cuartos.Los dos propietarios creen que podían haber recibido mas dinero por sus casas si \(C\&A\) las hubiera ofrecido a su verdadero precio comercial.

Análisis

Para empezar debemos saber cuales son las variables o las columnas que definen el precio de la casa, para lo cual hacemos uso de la tecnica de regresión, obteniendo en primera medida los parametros:

  • Intercepto
  • Mes
  • Área
  • Sur

Dando como resultado en la primera pasada la función lineal:

\[ Precio = 18824.57 - 2946.16*(mes) + 34.69*(area) + 21280.36*(sur) \]

Pero como sabemos que el mes no es una variable, sino que hace parte de una información, debemos sacarlo de dicha función, quedando el precio definido como:

\[ Precio = 18824.57 + 34.69*(area) + 21280.36*(sur) \]

Análisis

Fórmula

\[ Precio = 18824.57 + 34.69*(area) + 21280.36*(sur) \]


Despues de obtener dichos valores realizamos el procedimiento paso a paso, en el cual obtenemos que las variables que definen el precio son el área y el sur, para luego generar un modelo con solo esas variables; esto da como resultado lo siguiente:

\[ Precio = 17344.796 + 34.628*(area) + 21771.880*(sur) \]


De estos podemos concluir que:

  1. Si la casa se encuentra ubicada en el sur presenta un aumento de su precio en \(\$ 21771.880\).
  2. Por cada área construida la casa aumenta su precio en \(\$ 34.628\)

Solución del problema

Con la nueva fórmula obtenida empezamos a resolver dicho problema, hallando los valores de casa una de las 2 casas por sus caracteristicas correspondientes. Obteniendo lo siguiente

\[ Precio = 17344.796 + 34.628*(area) + 21771.880*(sur) \\ \]

Nombre Fórmula Total
Casa 1 valor \(17344.796 + 34.628(2190) + 21771.880\) \(114951.996\)
Casa 2 valor \(17344.796 + 34.628(1848)\) \(81337.34\)
Casa 1 ganancias \(\text{Casa 1}*0.97 - 88500\) \(23003.44\)
Casa 2 ganacias \(\text{Casa 2}*0.97 - 79500\) \(-602.7802\)

Solución del problema

Con la nueva fórmula obtenida empezamos a resolver dicho problema, hallando los valores de casa una de las 2 casas por sus caracteristicas correspondientes. Obteniendo lo siguiente

Conclusiones

Podemos concluir que:

  1. La casa 1 presenta un valor de 114951.996 dólares, y fue vendida por un valor de 88500 dólares, para lo que esta persona tiene razón al momento de hacer le reclamo, ya que si calculamos el precio del condominio restandole el \(3\%\), obtenemos un valor de 111503.4, y vemos que es muy diferente al precio obtenido por el cliente, generando así para este una perdida de 23003.44 dólares.

  2. La casa 2 presenta un valor de 81337 dólares y fue vendida por un valor de 79500 dólares, para lo que esta persona no tiene ningún derecho en realizar reclamo, ya que si calculamos el precio del condiminio quitandole el \(3\%\) de comisión obtenemos un valor de \(-602.7802\) dólares, con lo cual vemos que este vendedor le dio de más al cliente.

Recomendaciones

  1. Con la persona a la cual se le realizo el proceso de venta de la casa 1, se le debe reembolsar la cantidad de 23003.44 dólares, para evitar futuras demandas, además buscar corregir ese tipo de errores para que no vuelvan a ocurrir, esto permitirá que no exista perdida de clientela y realzar un debido proceso con dicho agente de ventas encargado de ese caso.

  2. Con la persona que se realizo el proceso de venta de la casa 2, se le deben mostrar las cantidades obtenidas en este informe, para así demostrarle que no hubo ningún tipo de timación con el valor de su casa, sino que fue una venta justa.

Anexo Parte 1

Se adjunta el código y las pruebas realzadas para solucionar esta problematica.

library("readxl")
library("MASS")
library("lmtest")
library("ggplot2")
db = read_excel("C://Users//juani//Documents//UNIVERSIDAD//SEMESTRE V//Probabilidad y Estadistica//R//C&A//CasasyApartamentos.xlsx",
                range = "A1:G64")

round(cov(db), 3)
round(cor(db), 3)

# Estimación
modelo1 = lm(precio ~ mes + area + cuartos + anios + sur + norte, data = db)
summary(modelo1)

# Diagnostico
coefficients(modelo1)
yhat = fitted(modelo1)
u = residuals(modelo1)
anova(modelo1)
round(vcov(modelo1), 3)

Anexo Parte 2

Se adjunta el código y las pruebas realzadas para solucionar esta problematica.

# Paso a paso: adelante

modelo2 = lm(precio ~ area + cuartos + anios + sur + norte, data = db)
step = stepAIC(modelo2, direction = "both")
step$anova
summary(modelo2)

modelo3 = lm(precio ~ area + sur, data = db)
summary(modelo3)

u = modelo3$residuals

# Examen de normalidad
shapiro.test(u)

# Supuesto de no autocorrelación
# Prueba de D-W  -AUTOCORRELACION
# Ho: los errores no estan autocorrelacionados
dwtest(modelo3)

Anexo Parte 3

Se adjunta el código y las pruebas realzadas para solucionar esta problematica.

# Supuesto de homoscedasticidad
# Prueba de Goldfeld-Quandt
# Ho: no existe heteroscedasticidad
gqtest(modelo3)

# Supuesto de correcta especificación
# Prueba de especificacion
# Prueba RESET
resettest(modelo3, power=2, type = "regressor")

Precio1 = 17344.796 + 34.628*(2190) + 21771.880
Precio2 = 17344.796 + 34.628*(1848) 

Descuento1 = Precio2*0.03
Descuento2 = Precio1*0.03
Casa1 = c(Precio1, 88500)
Casa2 = c(Precio2, 79500)
t1 = matrix(c(Casa1, Casa2), nrow = 2)
colnames(t1) = c("Casa 1", "Casa 2")

Anexo Parte 4

Se adjunta el código y las pruebas realzadas para solucionar esta problematica.

par(bg = "transparent")
par(fg = "white")
par(col.axis = "white")
par(font.lab = 1)
bpl1 = barplot(t1, ylim = c(0, 120000), beside = TRUE,
        main = "Comparación de precios casas", col = c("red", "gray"),
        col.main = "white")

text(bpl1, t1, format(t1), cex = 0.7, pos=1, col=c("white","black"))
grid()