En el presente analisis se detalla las estadisticas descriptivas de la base de datos de toyota coralla, la cual es propuesta por Kaggle https://www.kaggle.com/datasets/tolgahancepel/toyota-corolla
#importar la base de datos de toyota corolla y realizar un resumen de la data
BD <- read.csv("/cloud/project/ToyotaCorollaVF.csv")
# dimension de la base de datos
dim(BD)
## [1] 1436 10
# cantidad de atributos de la base de datos
length(BD)
## [1] 10
#variables temporales para la separacion del tipo variable
BDN <- NULL
BDC <- NULL
#nombre de las columnas
colnames(BD)
## [1] "Price" "Age" "KM" "FuelType" "HP" "MetColor"
## [7] "Automatic" "CC" "Doors" "Weight"
columna <- length(BD)
str(BD)
## 'data.frame': 1436 obs. of 10 variables:
## $ Price : int 13500 13750 13950 14950 13750 12950 16900 18600 21500 12950 ...
## $ Age : int 23 23 24 26 30 32 27 30 27 23 ...
## $ KM : int 46986 72937 41711 48000 38500 61000 94612 75889 19700 71138 ...
## $ FuelType : chr "Diesel" "Diesel" "Diesel" "Diesel" ...
## $ HP : int 90 90 90 90 90 90 90 90 192 69 ...
## $ MetColor : int 1 1 1 0 0 0 1 1 0 0 ...
## $ Automatic: int 0 0 0 0 0 0 0 0 0 0 ...
## $ CC : int 2000 2000 2000 2000 2000 2000 2000 2000 1800 1900 ...
## $ Doors : int 3 3 3 3 3 3 3 3 3 3 ...
## $ Weight : int 1165 1165 1165 1165 1170 1170 1245 1245 1185 1105 ...
par(mfrow = c(2,5))
for (i in 1:columna) {
if(is.numeric(BD[ ,i])== TRUE){
texto <- paste("AnĂ¡lisis del atributo ",colnames(BD)[i])
hist(BD[ ,i], col = i,main = texto, xlab = colnames(BD)[i] )
BDN <- c(BDN,i)
} else{
texto2 <- paste("AnĂ¡lisis del atributo ",colnames(BD)[i])
pie(table(BD[ ,i]),main = texto2)
BDC <- c(BDC,i)
}
}