Base de datos de Toyota Corolla

En el presente documento analizaremos de manera descriptiva los atributos de la base de datos de toyota Corolla. La base de datos la puede descargar de la pagina de Kaggle: https://www.kaggle.com/datasets/tolgahancepel/toyota-corolla

Importación y analisis exploratorio de la base de dato

El formato de la base de datos se encuentra en estructura CSV. Posteriormente analizaremos un summary de los atributos

BD <- read.csv("C:/Users/jonat/Dropbox/a Docencia/Statistics programming for business analytics/2025-2/Capitulo 1/ToyotaCorolla.csv")

summary(BD)
##      Price            Age              KM           FuelType        
##  Min.   : 4350   Min.   : 1.00   Min.   :     1   Length:1436       
##  1st Qu.: 8450   1st Qu.:44.00   1st Qu.: 43000   Class :character  
##  Median : 9900   Median :61.00   Median : 63390   Mode  :character  
##  Mean   :10731   Mean   :55.95   Mean   : 68533                     
##  3rd Qu.:11950   3rd Qu.:70.00   3rd Qu.: 87021                     
##  Max.   :32500   Max.   :80.00   Max.   :243000                     
##        HP           MetColor        Automatic             CC      
##  Min.   : 69.0   Min.   :0.0000   Min.   :0.00000   Min.   :1300  
##  1st Qu.: 90.0   1st Qu.:0.0000   1st Qu.:0.00000   1st Qu.:1400  
##  Median :110.0   Median :1.0000   Median :0.00000   Median :1600  
##  Mean   :101.5   Mean   :0.6748   Mean   :0.05571   Mean   :1567  
##  3rd Qu.:110.0   3rd Qu.:1.0000   3rd Qu.:0.00000   3rd Qu.:1600  
##  Max.   :192.0   Max.   :1.0000   Max.   :1.00000   Max.   :2000  
##      Doors           Weight    
##  Min.   :2.000   Min.   :1000  
##  1st Qu.:3.000   1st Qu.:1040  
##  Median :4.000   Median :1070  
##  Mean   :4.033   Mean   :1072  
##  3rd Qu.:5.000   3rd Qu.:1085  
##  Max.   :5.000   Max.   :1615

Analisis grafico

Procedemos a trabajar el analisis explotario descriptivo mediante el codigo de R usando FOR para el analisis de cada columna - atributo

columnas <- dim(BD)[2]
par(mfrow=c(2,columnas/2))

for (i in 1:columnas) {
 if(is.numeric(BD[ ,i])== TRUE){
   texto <- paste("Analisis de la variable ",colnames(BD)[i])
   hist(BD[ ,i],col=i,main = texto)
 } else{
   texto <- paste("Analisis de la variable ",colnames(BD)[i])
   pie(table(BD[ ,i]),main = texto)
 } 
}