En el presente analisis se detallan las estadisticas descriptivas de Toyota Corolla, la cual es propuesta por Kaggle
#importar la base de datos de Toyota corolla y realizar un resumen de la data
BD <- read.csv("Manuel/Diplomado BA 2025 PUCP/Statistics Programming -BA/S3/ToyotaCorolla.csv")
#Dimensión de la base de datos
dim(BD)
## [1] 1436 10
#Cantidad de atributos de la base de datos
length(BD)
## [1] 10
#Variables temporales para la separación del tipo de variable
BDN <- NULL
BDC <- NULL
#Nombre de las columnas
colnames(BD)
## [1] "Price" "Age" "KM" "FuelType" "HP" "MetColor"
## [7] "Automatic" "CC" "Doors" "Weight"
Analisaremos los datos utiliando una función por FOR
columna <- length(BD)
str(BD)
## 'data.frame': 1436 obs. of 10 variables:
## $ Price : int 13500 13750 13950 14950 13750 12950 16900 18600 21500 12950 ...
## $ Age : int 23 23 24 26 30 32 27 30 27 23 ...
## $ KM : int 46986 72937 41711 48000 38500 61000 94612 75889 19700 71138 ...
## $ FuelType : chr "Diesel" "Diesel" "Diesel" "Diesel" ...
## $ HP : int 90 90 90 90 90 90 90 90 192 69 ...
## $ MetColor : int 1 1 1 0 0 0 1 1 0 0 ...
## $ Automatic: int 0 0 0 0 0 0 0 0 0 0 ...
## $ CC : int 2000 2000 2000 2000 2000 2000 2000 2000 1800 1900 ...
## $ Doors : int 3 3 3 3 3 3 3 3 3 3 ...
## $ Weight : int 1165 1165 1165 1165 1170 1170 1245 1245 1185 1105 ...
par(mfrow=c(2,5))
for (i in 1:columna) {
if(is.numeric(BD[,i])== TRUE){
texto <- paste("Analisis del atributo ",colnames(BD)[i])
hist(BD[,i],col=i,main=texto, xlab= colnames(BD)[i])
BDN <- c(BDN,i)
} else {
texto2 <- paste("Analisis del atributo ",colnames(BD)[i])
pie(table(BD[ ,i]),main= texto2)
BDC <- c(BDC,i)
}
}