Cargar la base de datos
library(readxl)
library(modeest)
olx_viviendas_cali =read_excel("/Mesa/olx_viviendas_cali.xlsx",col_types = c("text",
"text", "text", "text", "numeric", "numeric", "numeric","numeric","numeric","text","numeric","numeric","numeric","text","text","text","text"))
#View(olx_viviendas_cali)
head(olx_viviendas_cali)
| ID | URL | ciudad | Zona | piso | Estrato | Precio | Area_privada | Area_contruida | condi | parqueaderos | Baños | Habitaciones | Tipo | Barrio | Cordenada_latitud | cordenada_longitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1564442091-9900 | https://www.fincaraiz.com.co/apartamento-en-venta/cali/metropolitano_del_norte-det-4683523.aspx | Cali | Zona Norte | NA | 3 | 1.50e+08 | 2027027 | 74 | FALSE | 1 | 2 | 3 | Apartamento | metropolitano del norte | -0.00168643891811371 | 0.000171326100826263 |
| 1564442091-13645 | https://www.fincaraiz.com.co/apartamento-en-venta/cali/ingenio-det-4369414.aspx | Cali | Zona Sur | 6 | 5 | 3.20e+08 | 2064516 | 155 | FALSE | 1 | 5 | 4 | Apartamento | el ingenio | 0.000300407409667969 | 0.000193119049072266 |
| 1564442091-7383 | https://www.fincaraiz.com.co/apartamento-en-venta/cali/valle_del_lili-det-4696414.aspx | Cali | Zona Sur | NA | 4 | 1.18e+08 | 2145455 | 55 | FALSE | NA | 2 | 2 | Apartamento | valle del lili | 0.00701350811868906 | -0.000827856420073658 |
| 1564442091-10349 | https://www.fincaraiz.com.co/apartamento-en-venta/cali/caney-det-4664306.aspx | Cali | Zona Sur | NA | 5 | 1.70e+08 | 2833333 | 60 | FALSE | NA | 2 | 3 | Apartamento | el caney | -0.0120641002431512 | -0.00303027289919555 |
| 1564437042-4644 | https://www.fincaraiz.com.co/casa-en-venta/cali/primavera-det-4362009.aspx | Cali | Zona Oriente | NA | 3 | 2.58e+08 | 806250 | 320 | FALSE | NA | 3 | 8 | Casa | la primavera | -0.00355292111635208 | 0.00366389751434326 |
| 1564442091-9307 | https://www.fincaraiz.com.co/apartamento-en-venta/cali/valle_del_lili-det-4707819.aspx | Cali | Zona Sur | NA | 4 | 1.65e+08 | 2704918 | 61 | FALSE | NA | 1 | 2 | Apartamento | valle del lili | 0.00320347701199353 | 0.0225584600120783 |
summary(olx_viviendas_cali)
## ID URL ciudad Zona
## Length:10857 Length:10857 Length:10857 Length:10857
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## piso Estrato Precio Area_privada
## Min. : 1.000 Min. :1.00 Min. :3.000e+07 Min. :2.670e+02
## 1st Qu.: 2.000 1st Qu.:4.00 1st Qu.:2.100e+08 1st Qu.:1.875e+06
## Median : 3.000 Median :5.00 Median :3.300e+08 Median :2.636e+06
## Mean : 3.691 Mean :4.56 Mean :4.977e+08 Mean :3.625e+06
## 3rd Qu.: 5.000 3rd Qu.:6.00 3rd Qu.:5.800e+08 3rd Qu.:3.382e+06
## Max. :15.000 Max. :6.00 Max. :5.000e+09 Max. :3.200e+09
## NA's :3909 NA's :44 NA's :50
## Area_contruida condi parqueaderos Baños
## Min. : 1 Length:10857 Min. : 1.000 Min. : 0.000
## 1st Qu.: 80 Class :character 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 128 Mode :character Median : 2.000 Median : 3.000
## Mean : 1482 Mean : 1.978 Mean : 3.229
## 3rd Qu.: 248 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :12000000 Max. :10.000 Max. :90.000
## NA's :51 NA's :2353
## Habitaciones Tipo Barrio Cordenada_latitud
## Min. : 0.000 Length:10857 Length:10857 Length:10857
## 1st Qu.: 3.000 Class :character Class :character Class :character
## Median : 3.000 Mode :character Mode :character Mode :character
## Mean : 3.775
## 3rd Qu.: 4.000
## Max. :254.000
##
## cordenada_longitud
## Length:10857
## Class :character
## Mode :character
##
##
##
##
names(olx_viviendas_cali)
## [1] "ID" "URL" "ciudad"
## [4] "Zona" "piso" "Estrato"
## [7] "Precio" "Area_privada" "Area_contruida"
## [10] "condi" "parqueaderos" "Baños"
## [13] "Habitaciones" "Tipo" "Barrio"
## [16] "Cordenada_latitud" "cordenada_longitud"
#regresion <- lm(Precio ~ Area_privada, data = olx_viviendas_cali)
#summary(regresion)
Medidas de tendencia central: cálculo de la media, mediana y moda con la variable precio
print("Promedio de precio")
## [1] "Promedio de precio"
mean(olx_viviendas_cali$Precio,na.rm = TRUE)
## [1] 497694089
print("Mediana de precio")
## [1] "Mediana de precio"
median(olx_viviendas_cali$Precio,na.rm = TRUE)
## [1] 3.3e+08
print("Moda de precio")
## [1] "Moda de precio"
mfv(olx_viviendas_cali$Precio)
## [1] 3.5e+08
summary(olx_viviendas_cali$Precio)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000e+07 2.100e+08 3.300e+08 4.977e+08 5.800e+08 5.000e+09
Medidas de posición: cálculo de frecuencias absolutas y relativas, cuantiles variable estrato
print("Frecuencia absoluta de Estrato")
## [1] "Frecuencia absoluta de Estrato"
tabla_estratos=table(olx_viviendas_cali$Estrato)
tabla_estratos
##
## 1 2 3 4 5 6
## 49 391 1715 2674 3271 2713
print("Frecuencia relativa de Estrato")
## [1] "Frecuencia relativa de Estrato"
prop.table(tabla_estratos)*100
##
## 1 2 3 4 5 6
## 0.4531582 3.6160178 15.8605382 24.7294923 30.2506242 25.0901692
print("Quantiles de distribución de estrato")
## [1] "Quantiles de distribución de estrato"
quantile(olx_viviendas_cali$Estrato, prob = c(0.25, 0.5, 0.75), na.rm = TRUE)
## 25% 50% 75%
## 4 5 6
Medidas de dispersión: rango, varianza, desviación estándar y coeficiente de variación variable precio
print("Rango de precios")
## [1] "Rango de precios"
range(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 3e+07 5e+09
print("Min de precios")
## [1] "Min de precios"
min(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 3e+07
print("Max de precios")
## [1] "Max de precios"
max(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 5e+09
print("Calculo del rango de precios")
## [1] "Calculo del rango de precios"
max(olx_viviendas_cali$Precio, na.rm = TRUE)-min(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 4.97e+09
print("Varianza de preciós")
## [1] "Varianza de preciós"
var(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 2.656916e+17
print("Desviación estadar")
## [1] "Desviación estadar"
sd(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 515452789
print("Coeficiente de variación")
## [1] "Coeficiente de variación"
sd(olx_viviendas_cali$Precio)/mean(olx_viviendas_cali$Precio)
## [1] 1.035682
Construcción de tabla de estadisticos de interes variable Estrato
print("Cálculo simple de estadíticos descriptivos")
## [1] "Cálculo simple de estadíticos descriptivos"
min = min(olx_viviendas_cali$Estrato, na.rm = TRUE)
q1 = quantile(olx_viviendas_cali$Estrato, probs = 0.25, na.rm = TRUE)
media = mean.default(olx_viviendas_cali$Estrato, na.rm = TRUE)
media_rec = mean.default(olx_viviendas_cali$Estrato, trim = 0.025, na.rm = TRUE)
mediana = median.default(olx_viviendas_cali$Estrato, na.rm = TRUE)
moda = mfv(olx_viviendas_cali$Estrato)
var = var(olx_viviendas_cali$Estrato, na.rm = TRUE)
desvest = sd(olx_viviendas_cali$Estrato, na.rm = TRUE)
q3 = quantile(olx_viviendas_cali$Estrato, probs = 0.75, na.rm = TRUE)
max = max(olx_viviendas_cali$Estrato, na.rm = TRUE)
print("Valores de estadísticos como vector")
## [1] "Valores de estadísticos como vector"
descriptivos_estrato <- as.numeric(c(min, q1, media, media_rec, mediana, moda,var, desvest, q3, max))
print("Encabezados de cada estadístico como un vector")
## [1] "Encabezados de cada estadístico como un vector"
nombres <- c("Mínimo", "Q1", "Media", "Media recortada", "Mediana", "Moda",
"Varianza", "Desviación Estándar", "Q3", "Máximo")
desc_estrato = as.data.frame(rbind(nombres,descriptivos_estrato))
desc_estrato
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | V10 | |
|---|---|---|---|---|---|---|---|---|---|---|
| nombres | Mínimo | Q1 | Media | Media recortada | Mediana | Moda | Varianza | Desviación Estándar | Q3 | Máximo |
| descriptivos_estrato | 1 | 4 | 4.5597891426986 | 4.59398423050715 | 5 | 5 | 1.33690310018917 | 1.15624525953155 | 6 | 6 |
Graficar distribution por estrato diagrama de torta y de barrar
table(olx_viviendas_cali$Estrato)
##
## 1 2 3 4 5 6
## 49 391 1715 2674 3271 2713
prop.table(table(olx_viviendas_cali$Estrato))*100
##
## 1 2 3 4 5 6
## 0.4531582 3.6160178 15.8605382 24.7294923 30.2506242 25.0901692
pie(table(olx_viviendas_cali$Estrato))
barplot(table(olx_viviendas_cali$Estrato),main ="Barras de estratos",col ="red" )