En la presente sección se desarrolla un algoritmo con el uso de for, if, is. , boxplot.stats, hist, pie, y table
#importar Data y configurar pantall
BD <- read.csv("C:/Users/jonat/Dropbox/a Docencia/Statistics programming for business analytics/Datos para las clases/Biz/ToyotaCorolla.csv")
n <- NULL
c <- NULL
columnas <- dim(BD)[2]
par(mfrow = c(2,columnas/2))
for(j in 1:columnas) {
if(is.numeric(BD[,j]) == "TRUE") {
texto <- paste('Análisis del atributo ',colnames(BD)[j])
print(texto)
print(summary(BD[ ,j]))
print(paste("Detección de los outlier del atributo ",colnames(BD)[j]))
print(boxplot.stats(BD[,j])$out)
print(paste("======================================================="))
hist(BD[,j],col=j, main=texto,xlab = colnames(BD)[j])
n <- c(n,j)
}
else
{
texto <- paste('analisis del atributo ',colnames(BD)[j])
print(texto)
print(table(BD[ ,j]))
print(paste("======================================================="))
pie(table(BD[,j]), main=texto,xlab = colnames(BD)[j])
c <- c(c,j)
}
}
## [1] "Análisis del atributo Price"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4350 8450 9900 10731 11950 32500
## [1] "Detección de los outlier del atributo Price"
## [1] 18600 21500 20950 19950 19600 21500 22500 22000 22750 17950 17495 17950
## [13] 19000 17950 17950 21950 17950 20500 21950 18950 18750 17950 17950 18950
## [25] 22250 18950 19950 18750 18450 18950 17250 17950 17450 17950 21950 22250
## [37] 19950 18900 19950 18750 17450 18990 18500 18500 19450 18800 17450 17950
## [49] 32500 31000 31275 24950 24950 22950 24990 21950 17900 19250 22250 18950
## [61] 19950 18950 21750 17950 18450 23000 19900 23950 19950 18500 18950 20500
## [73] 24500 19450 20950 19950 18450 19500 21750 19500 18900 19750 19750 18950
## [85] 20750 19600 19500 17650 19950 19950 20950 20500 17795 18245 23750 19500
## [97] 18950 21950 19950 18950 19950 21950 22500 18500 18700 21125 21500 17795
## [109] 18245 18950
## [1] "======================================================="
## [1] "Análisis del atributo Age"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 44.00 61.00 55.95 70.00 80.00
## [1] "Detección de los outlier del atributo Age"
## [1] 4 4 4 2 2 1 1
## [1] "======================================================="
## [1] "Análisis del atributo KM"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1 43000 63390 68533 87021 243000
## [1] "Detección de los outlier del atributo KM"
## [1] 243000 180638 179860 178858 161000 158320 216000 198167 176000 174139
## [11] 174000 205000 204250 194545 190900 183500 176184 174833 155720 155500
## [21] 154783 154462 232940 218118 217764 207114 203254 200732 197501 194765
## [31] 191620 183277 180378 178800 176177 176000 172980 170000 164000 161775
## [41] 160000 159968 159908 158492 156204 156169 155210 155000 154900
## [1] "======================================================="
## [1] "analisis del atributo FuelType"
##
## CNG Diesel Petrol
## 17 155 1264
## [1] "======================================================="
## [1] "Análisis del atributo HP"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 69.0 90.0 110.0 101.5 110.0 192.0
## [1] "Detección de los outlier del atributo HP"
## [1] 192 192 192 192 192 192 192 192 192 192 192
## [1] "======================================================="
## [1] "Análisis del atributo MetColor"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 1.0000 0.6748 1.0000 1.0000
## [1] "Detección de los outlier del atributo MetColor"
## integer(0)
## [1] "======================================================="
## [1] "Análisis del atributo Automatic"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00000 0.00000 0.00000 0.05571 0.00000 1.00000
## [1] "Detección de los outlier del atributo Automatic"
## [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## [39] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## [77] 1 1 1 1
## [1] "======================================================="
## [1] "Análisis del atributo CC"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1300 1400 1600 1567 1600 2000
## [1] "Detección de los outlier del atributo CC"
## [1] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [16] 2000 2000 2000 1995 1995 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [31] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [46] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [61] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [76] 2000 2000 2000 2000 2000 2000 2000 1975 2000 2000 2000 2000 2000 2000 2000
## [91] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [106] 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
## [121] 2000 2000
## [1] "======================================================="
## [1] "Análisis del atributo Doors"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.000 3.000 4.000 4.033 5.000 5.000
## [1] "Detección de los outlier del atributo Doors"
## integer(0)
## [1] "======================================================="
## [1] "Análisis del atributo Weight"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1000 1040 1070 1072 1085 1615
## [1] "Detección de los outlier del atributo Weight"
## [1] 1165 1165 1165 1165 1170 1170 1245 1245 1185 1185 1185 1185 1185 1185 1185
## [16] 1185 1170 1255 1255 1270 1255 1255 1195 1255 1180 1195 1165 1180 1275 1180
## [31] 1180 1245 1265 1260 1260 1260 1155 1480 1480 1480 1320 1320 1270 1280 1270
## [46] 1255 1275 1255 1320 1185 1165 1180 1160 1205 1205 1205 1170 1615 1165 1205
## [61] 1165 1260 1260 1155 1480 1172
## [1] "======================================================="