Cargar la base de datos

library(readxl)
library(modeest)
olx_viviendas_cali =read_excel("/Mesa/olx_viviendas_cali.xlsx",col_types = c("text", 
                                                                                 "text", "text", "text", "numeric", "numeric", "numeric","numeric","numeric","text","numeric","numeric","numeric","text","text","text","text"))


#View(olx_viviendas_cali)
head(olx_viviendas_cali)
ID URL ciudad Zona piso Estrato Precio Area_privada Area_contruida condi parqueaderos Baños Habitaciones Tipo Barrio Cordenada_latitud cordenada_longitud
1564442091-9900 https://www.fincaraiz.com.co/apartamento-en-venta/cali/metropolitano_del_norte-det-4683523.aspx Cali Zona Norte NA 3 1.50e+08 2027027 74 FALSE 1 2 3 Apartamento metropolitano del norte -0.00168643891811371 0.000171326100826263
1564442091-13645 https://www.fincaraiz.com.co/apartamento-en-venta/cali/ingenio-det-4369414.aspx Cali Zona Sur 6 5 3.20e+08 2064516 155 FALSE 1 5 4 Apartamento el ingenio 0.000300407409667969 0.000193119049072266
1564442091-7383 https://www.fincaraiz.com.co/apartamento-en-venta/cali/valle_del_lili-det-4696414.aspx Cali Zona Sur NA 4 1.18e+08 2145455 55 FALSE NA 2 2 Apartamento valle del lili 0.00701350811868906 -0.000827856420073658
1564442091-10349 https://www.fincaraiz.com.co/apartamento-en-venta/cali/caney-det-4664306.aspx Cali Zona Sur NA 5 1.70e+08 2833333 60 FALSE NA 2 3 Apartamento el caney -0.0120641002431512 -0.00303027289919555
1564437042-4644 https://www.fincaraiz.com.co/casa-en-venta/cali/primavera-det-4362009.aspx Cali Zona Oriente NA 3 2.58e+08 806250 320 FALSE NA 3 8 Casa la primavera -0.00355292111635208 0.00366389751434326
1564442091-9307 https://www.fincaraiz.com.co/apartamento-en-venta/cali/valle_del_lili-det-4707819.aspx Cali Zona Sur NA 4 1.65e+08 2704918 61 FALSE NA 1 2 Apartamento valle del lili 0.00320347701199353 0.0225584600120783
summary(olx_viviendas_cali)
##       ID                URL               ciudad              Zona          
##  Length:10857       Length:10857       Length:10857       Length:10857      
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##       piso           Estrato         Precio           Area_privada      
##  Min.   : 1.000   Min.   :1.00   Min.   :3.000e+07   Min.   :2.670e+02  
##  1st Qu.: 2.000   1st Qu.:4.00   1st Qu.:2.100e+08   1st Qu.:1.875e+06  
##  Median : 3.000   Median :5.00   Median :3.300e+08   Median :2.636e+06  
##  Mean   : 3.691   Mean   :4.56   Mean   :4.977e+08   Mean   :3.625e+06  
##  3rd Qu.: 5.000   3rd Qu.:6.00   3rd Qu.:5.800e+08   3rd Qu.:3.382e+06  
##  Max.   :15.000   Max.   :6.00   Max.   :5.000e+09   Max.   :3.200e+09  
##  NA's   :3909     NA's   :44                         NA's   :50         
##  Area_contruida        condi            parqueaderos        Baños       
##  Min.   :       1   Length:10857       Min.   : 1.000   Min.   : 0.000  
##  1st Qu.:      80   Class :character   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median :     128   Mode  :character   Median : 2.000   Median : 3.000  
##  Mean   :    1482                      Mean   : 1.978   Mean   : 3.229  
##  3rd Qu.:     248                      3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :12000000                      Max.   :10.000   Max.   :90.000  
##  NA's   :51                            NA's   :2353                     
##   Habitaciones         Tipo              Barrio          Cordenada_latitud 
##  Min.   :  0.000   Length:10857       Length:10857       Length:10857      
##  1st Qu.:  3.000   Class :character   Class :character   Class :character  
##  Median :  3.000   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :  3.775                                                           
##  3rd Qu.:  4.000                                                           
##  Max.   :254.000                                                           
##                                                                            
##  cordenada_longitud
##  Length:10857      
##  Class :character  
##  Mode  :character  
##                    
##                    
##                    
## 
names(olx_viviendas_cali)
##  [1] "ID"                 "URL"                "ciudad"            
##  [4] "Zona"               "piso"               "Estrato"           
##  [7] "Precio"             "Area_privada"       "Area_contruida"    
## [10] "condi"              "parqueaderos"       "Baños"             
## [13] "Habitaciones"       "Tipo"               "Barrio"            
## [16] "Cordenada_latitud"  "cordenada_longitud"
#regresion <- lm(Precio ~ Area_privada, data = olx_viviendas_cali)
#summary(regresion)

Medidas de tendencia central: cálculo de la media, mediana y moda con la variable precio

print("Promedio de precio")
## [1] "Promedio de precio"
mean(olx_viviendas_cali$Precio,na.rm = TRUE)
## [1] 497694089
print("Mediana de precio")
## [1] "Mediana de precio"
median(olx_viviendas_cali$Precio,na.rm = TRUE)
## [1] 3.3e+08
print("Moda de precio")
## [1] "Moda de precio"
mfv(olx_viviendas_cali$Precio)
## [1] 3.5e+08
summary(olx_viviendas_cali$Precio)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 3.000e+07 2.100e+08 3.300e+08 4.977e+08 5.800e+08 5.000e+09

Medidas de posición: cálculo de frecuencias absolutas y relativas, cuantiles variable estrato

print("Frecuencia absoluta de Estrato")
## [1] "Frecuencia absoluta de Estrato"
tabla_estratos=table(olx_viviendas_cali$Estrato)
tabla_estratos
## 
##    1    2    3    4    5    6 
##   49  391 1715 2674 3271 2713
print("Frecuencia relativa de Estrato")
## [1] "Frecuencia relativa de Estrato"
prop.table(tabla_estratos)*100
## 
##          1          2          3          4          5          6 
##  0.4531582  3.6160178 15.8605382 24.7294923 30.2506242 25.0901692
print("Quantiles de distribución de estrato")
## [1] "Quantiles de distribución de estrato"
quantile(olx_viviendas_cali$Estrato, prob = c(0.25, 0.5, 0.75), na.rm = TRUE)
## 25% 50% 75% 
##   4   5   6

Medidas de dispersión: rango, varianza, desviación estándar y coeficiente de variación variable precio

print("Rango de precios")
## [1] "Rango de precios"
range(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 3e+07 5e+09
print("Min de precios")
## [1] "Min de precios"
min(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 3e+07
print("Max de precios")
## [1] "Max de precios"
max(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 5e+09
print("Calculo del rango de precios")
## [1] "Calculo del rango de precios"
max(olx_viviendas_cali$Precio, na.rm = TRUE)-min(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 4.97e+09
print("Varianza de preciós")
## [1] "Varianza de preciós"
var(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 2.656916e+17
print("Desviación estadar")
## [1] "Desviación estadar"
sd(olx_viviendas_cali$Precio, na.rm = TRUE)
## [1] 515452789
print("Coeficiente de variación")
## [1] "Coeficiente de variación"
sd(olx_viviendas_cali$Precio)/mean(olx_viviendas_cali$Precio)
## [1] 1.035682

Construcción de tabla de estadisticos de interes variable Estrato

print("Cálculo simple de estadíticos descriptivos")
## [1] "Cálculo simple de estadíticos descriptivos"
min = min(olx_viviendas_cali$Estrato, na.rm = TRUE)
q1 = quantile(olx_viviendas_cali$Estrato, probs = 0.25, na.rm = TRUE)
media = mean.default(olx_viviendas_cali$Estrato, na.rm = TRUE)
media_rec = mean.default(olx_viviendas_cali$Estrato, trim = 0.025, na.rm = TRUE)
mediana = median.default(olx_viviendas_cali$Estrato, na.rm = TRUE)
moda = mfv(olx_viviendas_cali$Estrato)
var = var(olx_viviendas_cali$Estrato, na.rm = TRUE)
desvest = sd(olx_viviendas_cali$Estrato, na.rm = TRUE)
q3 = quantile(olx_viviendas_cali$Estrato, probs = 0.75, na.rm = TRUE)
max = max(olx_viviendas_cali$Estrato, na.rm = TRUE)

print("Valores de estadísticos como vector")
## [1] "Valores de estadísticos como vector"
descriptivos_estrato <- as.numeric(c(min, q1, media, media_rec, mediana, moda,var, desvest, q3, max))

print("Encabezados de cada estadístico como un vector")
## [1] "Encabezados de cada estadístico como un vector"
nombres <- c("Mínimo", "Q1", "Media", "Media recortada", "Mediana", "Moda",
             "Varianza", "Desviación Estándar", "Q3", "Máximo")

desc_estrato = as.data.frame(rbind(nombres,descriptivos_estrato))

desc_estrato
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
nombres Mínimo Q1 Media Media recortada Mediana Moda Varianza Desviación Estándar Q3 Máximo
descriptivos_estrato 1 4 4.5597891426986 4.59398423050715 5 5 1.33690310018917 1.15624525953155 6 6

Graficar distribution por estrato diagrama de torta y de barrar

table(olx_viviendas_cali$Estrato)
## 
##    1    2    3    4    5    6 
##   49  391 1715 2674 3271 2713
prop.table(table(olx_viviendas_cali$Estrato))*100
## 
##          1          2          3          4          5          6 
##  0.4531582  3.6160178 15.8605382 24.7294923 30.2506242 25.0901692
pie(table(olx_viviendas_cali$Estrato))

barplot(table(olx_viviendas_cali$Estrato),main ="Barras de estratos",col ="red" )