En el presente analisis se detalla las estadisticas descriptivas de la base de datos de Toyota Corolla, la cual es propuesta por Kaggle https://www.kaggle.com/datasets/tolgahancepel/toyota-corolla
#analisis exploratorio de los datos
#Importar la base de datos de toyota corolla y realizar un resumen de la data
BD2 <- read.csv("C:/Users/yamel/OneDrive/Escritorio/B Analitycs/Estatistics/1/ToyotaCorolla.csv")
#dimension de la base de datos
dim(BD2)
## [1] 1436 10
#cantidad de atributos de la base de datos
length (BD2)
## [1] 10
#Variables temporales para la sepracion del tipo variable
BDN <- NULL
BDC <- NULL
#nombre de las columnas
colnames(BD2)
## [1] "Price" "Age" "KM" "FuelType" "HP" "MetColor"
## [7] "Automatic" "CC" "Doors" "Weight"
Analizaremos los datos utilizando una funcion con FOR.
columna <- length(BD2)
str (BD2)
## 'data.frame': 1436 obs. of 10 variables:
## $ Price : int 13500 13750 13950 14950 13750 12950 16900 18600 21500 12950 ...
## $ Age : int 23 23 24 26 30 32 27 30 27 23 ...
## $ KM : int 46986 72937 41711 48000 38500 61000 94612 75889 19700 71138 ...
## $ FuelType : chr "Diesel" "Diesel" "Diesel" "Diesel" ...
## $ HP : int 90 90 90 90 90 90 90 90 192 69 ...
## $ MetColor : int 1 1 1 0 0 0 1 1 0 0 ...
## $ Automatic: int 0 0 0 0 0 0 0 0 0 0 ...
## $ CC : int 2000 2000 2000 2000 2000 2000 2000 2000 1800 1900 ...
## $ Doors : int 3 3 3 3 3 3 3 3 3 3 ...
## $ Weight : int 1165 1165 1165 1165 1170 1170 1245 1245 1185 1105 ...
par(mfrow = c(2,5))
for ( i in 1:columna) {
if(is.numeric(BD2[ ,i])== TRUE){
texto <- paste("Analisis del atributo ",colnames(BD2)[i])
hist(BD2[ ,i], col = i,main = texto, xlab = colnames(BD2)[i] )
BDN <- c(BDN,i)
} else{
texto2 <- paste("Analisis del atributo ",colnames(BD2)[i])
pie(table(BD2[ ,i]),main = texto2)
BDC <- c(BDC,i)
}
}