Exploratorio del Area construida
attach(datos_vivienda)
summary(Area_contruida)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 80.0 86.0 97.0 115.7 130.0 195.0
hist(Area_contruida, col = "#a0c39f",
xlab = "Area construida (metros cuadrado)",
ylab = "Frecuencia",
main = "Histograma del area construida")

promedioArea <- mean(Area_contruida)
medianaArea <- median(Area_contruida)
desv_Est_Area <- sd(Area_contruida)
boxplot(Area_contruida, horizontal = TRUE,
main = "Boxplot para Area",
col = "lightblue",
pch = 19, notch = TRUE)
points(promedioArea,
1,
pch = 19,
col = c("red", "purple"))
legend("topright",
title = "Convención",
legend = c("Promedio", "Error estandard"),
col = "red",
pch = c(19, NA),
lty = c(NA, 1))
arrows(promedioArea - desv_Est_Area / sqrt(nrow(datos_vivienda)), 1,
promedioArea + desv_Est_Area / sqrt(nrow(datos_vivienda)), 1,
angle = 90,
length = 0.1,
code = 3,
col = "red")

describe(Area_contruida)
## Area_contruida
## n missing distinct Info Mean Gmd .05 .10
## 26 0 14 0.987 115.7 38.68 85.0 85.5
## .25 .50 .75 .90 .95
## 86.0 97.0 130.0 170.0 178.2
##
## lowest : 80 85 86 87 89, highest: 130 134 170 181 195
##
## Value 80.00 85.00 86.00 87.00 89.00 96.00 98.00 118.00 118.42
## Frequency 1 2 5 2 1 2 1 1 1
## Proportion 0.038 0.077 0.192 0.077 0.038 0.077 0.038 0.038 0.038
##
## Value 130.00 134.00 170.00 181.00 195.00
## Frequency 4 1 3 1 1
## Proportion 0.154 0.038 0.115 0.038 0.038
Se puede observar que el promedio de Area en metros cuadrados es de 115.7 y la mediana 97.0 por lo tanto se puede concluir ademas de manera grafica con el histograma que los datos no tienen una distribucion simetrica.
Del histograma se puede ver que la mayoria de los datos estan acumulados entre 80 y 100 metros cuadrados, lo cual se confirma cuando en la tabla describe se observa que el dato mas frecuente es 85 metros cuadrados con 5 observaciones.
En el boxplot se puede apreciar que los datos no son simetricos debido a que la mediana no se muestra en el centro de la grafica, se muestra el promedio con el error estandar del mismo, ademas de mostrar los datos organizados por cuartiles mostrando asi que no existe ningun dato atipico.
Exploratorio de el Precio por millon
attach(datos_vivienda)
summary(precio_millon)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 240.0 251.2 305.0 332.1 395.0 480.0
hist(precio_millon, col = "orange",
xlab = "Precio por millon (Pesos Colombianos)",
ylab = "Frecuencia",
main = "Histograma del precio por millon")

promedioPrecio <- mean(precio_millon)
medianaPrecio <- median(precio_millon)
desv_Est_Precio<- sd(precio_millon)
boxplot(precio_millon, horizontal = TRUE,
main = "Boxplot para Precio",
col = "lightblue",
pch = 19, notch = TRUE)
points(promedioPrecio,
1,
pch = 19,
col = c("red", "purple"))
legend("topright",
title = "Convención",
legend = c("Promedio", "Error estandard"),
col = "red",
pch = c(19, NA),
lty = c(NA, 1))
arrows(promedioPrecio - desv_Est_Precio / sqrt(nrow(datos_vivienda)), 1,
promedioPrecio + desv_Est_Precio / sqrt(nrow(datos_vivienda)), 1,
angle = 90,
length = 0.1,
code = 3,
col = "red")

describe(precio_millon)
## precio_millon
## n missing distinct Info Mean Gmd .05 .10
## 26 0 15 0.991 332.1 93.45 240.0 240.0
## .25 .50 .75 .90 .95
## 251.2 305.0 395.0 440.0 450.0
##
## lowest : 240 250 255 260 268, highest: 410 419 430 450 480
##
## Value 240 250 255 260 268 272 290 320 385 395 410
## Frequency 4 3 1 1 1 1 2 1 4 2 1
## Proportion 0.154 0.115 0.038 0.038 0.038 0.038 0.077 0.038 0.154 0.077 0.038
##
## Value 419 430 450 480
## Frequency 1 1 2 1
## Proportion 0.038 0.038 0.077 0.038
Se puede observar que el promedio del Precio por millon es de 332.1 y la mediana 305.0 por lo tanto se puede concluir ademas de manera grafica con el histograma que los datos no tienen una distribucion simetrica.
Del histograma se puede ver que la mayoria de los datos estan acumulados entre 200 y 250 Millones de pesos, lo cual se confirma cuando en la tabla describe se observa que uno de los datos mas frecuente es 240 Millones de pesos con 4 observaciones acompañado en este rango con el segundo dato mas frecuente el cual es de 250 Millones de pesos con 3 observaciones .
En el boxplot se puede apreciar que los datos no son simetricos debido a que la mediana no se muestra en el centro de la grafica, se muestra el promedio con el error estandar del mismo, ademas de mostrar los datos organizados por cuartiles mostrando asi que no existe ningun dato atipico.