Analisis descriptivo de Toyota Corolla

En la presente seccion analizaremos cada atributo de la base de datos de Toyota Corolla. Inicilamente se realizara un summary de los atributos. La base de datos la puede descargar desde https://www.kaggle.com/datasets/tolgahancepel/toyota-corolla/data.

# importamos la base de datos de Toyota
BD <- read.csv("C:/Users/Rojas/Downloads/Simulacion/Data Mining/Data Mining/Data Mining 2023/Clases 2023/Capitulo 05/ToyotaCorolla.csv")

summary(BD)
##      Price            Age              KM           FuelType        
##  Min.   : 4350   Min.   : 1.00   Min.   :     1   Length:1436       
##  1st Qu.: 8450   1st Qu.:44.00   1st Qu.: 43000   Class :character  
##  Median : 9900   Median :61.00   Median : 63390   Mode  :character  
##  Mean   :10731   Mean   :55.95   Mean   : 68533                     
##  3rd Qu.:11950   3rd Qu.:70.00   3rd Qu.: 87021                     
##  Max.   :32500   Max.   :80.00   Max.   :243000                     
##        HP           MetColor        Automatic             CC      
##  Min.   : 69.0   Min.   :0.0000   Min.   :0.00000   Min.   :1300  
##  1st Qu.: 90.0   1st Qu.:0.0000   1st Qu.:0.00000   1st Qu.:1400  
##  Median :110.0   Median :1.0000   Median :0.00000   Median :1600  
##  Mean   :101.5   Mean   :0.6748   Mean   :0.05571   Mean   :1567  
##  3rd Qu.:110.0   3rd Qu.:1.0000   3rd Qu.:0.00000   3rd Qu.:1600  
##  Max.   :192.0   Max.   :1.0000   Max.   :1.00000   Max.   :2000  
##      Doors           Weight    
##  Min.   :2.000   Min.   :1000  
##  1st Qu.:3.000   1st Qu.:1040  
##  Median :4.000   Median :1070  
##  Mean   :4.033   Mean   :1072  
##  3rd Qu.:5.000   3rd Qu.:1085  
##  Max.   :5.000   Max.   :1615

Incluimos algunos graficos

# Definimos vectores nulos para diferencias los atributos numericos y del tipo caracter
BDN <- NULL
BDC <- NULL

# determinar el numero de atributos de la base de datos
atributos <- dim(BD)[2]
atributos
## [1] 10
# configuramos la pantalla
par(mfrow = c(2, atributos/2))


# elaboramos nuestra funcion de graficos, donde los datos numericos seran representados mediante un histograma y los datos tipo caracter mediante un diagrama de pie

for(i in 1:atributos){
  if(is.numeric(BD[ ,i])== TRUE){
    texto <- paste("Analisis del atributo: ", colnames(BD)[i])
    hist(BD[ ,i], col=i, main = texto, xlab = colnames(BD)[i])
    BDN <- c(BDN,i)
    
  } else{
    pie(table(BD[ ,i]))
    BDN <- c(BDN,i)
  
    }
}