Analiticas descriptivas de la base de datos de toyota corolla

En la presente sección se desarrolla un algoritmo con el uso de for, if, is. , boxplot.stats, hist, pie, y table

#importar Data y configurar pantall
BD <- read.csv("C:/Users/jonat/Dropbox/a Docencia/Statistics programming for business analytics/Datos para las clases/Biz/ToyotaCorolla.csv")
n <- NULL
c <- NULL
columnas <- dim(BD)[2]
par(mfrow = c(2,columnas/2))

código de lectura

for(j in 1:columnas) {
  if(is.numeric(BD[,j]) == "TRUE") {
    texto <- paste('Análisis del atributo  ',colnames(BD)[j])
    print(texto)
    print(summary(BD[ ,j]))
    print(paste("Detección de los outlier del atributo ",colnames(BD)[j]))
    print(boxplot.stats(BD[,j])$out)
    print(paste("======================================================="))
    hist(BD[,j],col=j, main=texto,xlab = colnames(BD)[j])
    n <- c(n,j)
  } 
  else 
    {    
    texto <- paste('analisis del atributo  ',colnames(BD)[j])
    print(texto)
    print(table(BD[ ,j]))
    print(paste("======================================================="))
    pie(table(BD[,j]), main=texto,xlab = colnames(BD)[j])
    c <- c(c,j)
  }
}
## [1] "Análisis del atributo   Price"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    4350    8450    9900   10731   11950   32500 
## [1] "Detección de los outlier del atributo  Price"
##   [1] 18600 21500 20950 19950 19600 21500 22500 22000 22750 17950 17495 17950
##  [13] 19000 17950 17950 21950 17950 20500 21950 18950 18750 17950 17950 18950
##  [25] 22250 18950 19950 18750 18450 18950 17250 17950 17450 17950 21950 22250
##  [37] 19950 18900 19950 18750 17450 18990 18500 18500 19450 18800 17450 17950
##  [49] 32500 31000 31275 24950 24950 22950 24990 21950 17900 19250 22250 18950
##  [61] 19950 18950 21750 17950 18450 23000 19900 23950 19950 18500 18950 20500
##  [73] 24500 19450 20950 19950 18450 19500 21750 19500 18900 19750 19750 18950
##  [85] 20750 19600 19500 17650 19950 19950 20950 20500 17795 18245 23750 19500
##  [97] 18950 21950 19950 18950 19950 21950 22500 18500 18700 21125 21500 17795
## [109] 18245 18950
## [1] "======================================================="

## [1] "Análisis del atributo   Age"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00   44.00   61.00   55.95   70.00   80.00 
## [1] "Detección de los outlier del atributo  Age"
## [1] 4 4 4 2 2 1 1
## [1] "======================================================="

## [1] "Análisis del atributo   KM"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       1   43000   63390   68533   87021  243000 
## [1] "Detección de los outlier del atributo  KM"
##  [1] 243000 180638 179860 178858 161000 158320 216000 198167 176000 174139
## [11] 174000 205000 204250 194545 190900 183500 176184 174833 155720 155500
## [21] 154783 154462 232940 218118 217764 207114 203254 200732 197501 194765
## [31] 191620 183277 180378 178800 176177 176000 172980 170000 164000 161775
## [41] 160000 159968 159908 158492 156204 156169 155210 155000 154900
## [1] "======================================================="

## [1] "analisis del atributo   FuelType"
## 
##    CNG Diesel Petrol 
##     17    155   1264 
## [1] "======================================================="

## [1] "Análisis del atributo   HP"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    69.0    90.0   110.0   101.5   110.0   192.0 
## [1] "Detección de los outlier del atributo  HP"
##  [1] 192 192 192 192 192 192 192 192 192 192 192
## [1] "======================================================="

## [1] "Análisis del atributo   MetColor"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  1.0000  0.6748  1.0000  1.0000 
## [1] "Detección de los outlier del atributo  MetColor"
## integer(0)
## [1] "======================================================="

## [1] "Análisis del atributo   Automatic"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.00000 0.00000 0.00000 0.05571 0.00000 1.00000 
## [1] "Detección de los outlier del atributo  Automatic"
##  [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## [39] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## [77] 1 1 1 1
## [1] "======================================================="

## [1] "Análisis del atributo   CC"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1300    1400    1600    1567    1600    2000 
## [1] "Detección de los outlier del atributo  CC"
##   [1] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
##  [16] 2000 2000 2000 1995 1995 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
##  [31] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
##  [46] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
##  [61] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
##  [76] 2000 2000 2000 2000 2000 2000 2000 1975 2000 2000 2000 2000 2000 2000 2000
##  [91] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [106] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [121] 2000 2000
## [1] "======================================================="

## [1] "Análisis del atributo   Doors"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.000   3.000   4.000   4.033   5.000   5.000 
## [1] "Detección de los outlier del atributo  Doors"
## integer(0)
## [1] "======================================================="

## [1] "Análisis del atributo   Weight"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1000    1040    1070    1072    1085    1615 
## [1] "Detección de los outlier del atributo  Weight"
##  [1] 1165 1165 1165 1165 1170 1170 1245 1245 1185 1185 1185 1185 1185 1185 1185
## [16] 1185 1170 1255 1255 1270 1255 1255 1195 1255 1180 1195 1165 1180 1275 1180
## [31] 1180 1245 1265 1260 1260 1260 1155 1480 1480 1480 1320 1320 1270 1280 1270
## [46] 1255 1275 1255 1320 1185 1165 1180 1160 1205 1205 1205 1170 1615 1165 1205
## [61] 1165 1260 1260 1155 1480 1172
## [1] "======================================================="