En la presente seccion analizaremos cada atributo de la base de datos de Toyota Corolla. Inicilamente se realizara un summary de los atributos. La base de datos la puede descargar desde https://www.kaggle.com/datasets/tolgahancepel/toyota-corolla/data.
# importamos la base de datos de Toyota
BD <- read.csv("C:/Users/Rojas/Downloads/Simulacion/Data Mining/Data Mining/Data Mining 2023/Clases 2023/Capitulo 05/ToyotaCorolla.csv")
summary(BD)
## Price Age KM FuelType
## Min. : 4350 Min. : 1.00 Min. : 1 Length:1436
## 1st Qu.: 8450 1st Qu.:44.00 1st Qu.: 43000 Class :character
## Median : 9900 Median :61.00 Median : 63390 Mode :character
## Mean :10731 Mean :55.95 Mean : 68533
## 3rd Qu.:11950 3rd Qu.:70.00 3rd Qu.: 87021
## Max. :32500 Max. :80.00 Max. :243000
## HP MetColor Automatic CC
## Min. : 69.0 Min. :0.0000 Min. :0.00000 Min. :1300
## 1st Qu.: 90.0 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:1400
## Median :110.0 Median :1.0000 Median :0.00000 Median :1600
## Mean :101.5 Mean :0.6748 Mean :0.05571 Mean :1567
## 3rd Qu.:110.0 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:1600
## Max. :192.0 Max. :1.0000 Max. :1.00000 Max. :2000
## Doors Weight
## Min. :2.000 Min. :1000
## 1st Qu.:3.000 1st Qu.:1040
## Median :4.000 Median :1070
## Mean :4.033 Mean :1072
## 3rd Qu.:5.000 3rd Qu.:1085
## Max. :5.000 Max. :1615
# Definimos vectores nulos para diferencias los atributos numericos y del tipo caracter
BDN <- NULL
BDC <- NULL
# determinar el numero de atributos de la base de datos
atributos <- dim(BD)[2]
atributos
## [1] 10
# configuramos la pantalla
par(mfrow = c(2, atributos/2))
# elaboramos nuestra funcion de graficos, donde los datos numericos seran representados mediante un histograma y los datos tipo caracter mediante un diagrama de pie
for(i in 1:atributos){
if(is.numeric(BD[ ,i])== TRUE){
texto <- paste("Analisis del atributo: ", colnames(BD)[i])
hist(BD[ ,i], col=i, main = texto, xlab = colnames(BD)[i])
BDN <- c(BDN,i)
} else{
pie(table(BD[ ,i]))
BDN <- c(BDN,i)
}
}