En esta primera sesion analizaremos la base de datos de toyota corolla, la cual contiene 10 atributos y 1492 tuplas. La base de datos la puede descargar de https://www.kaggle.com/c/toyota-corolla/overview/description
# imporamos la base de datos desde un formato CSV
ToyotaCorolla <- read.csv("C:/Users/Rojas/Downloads/Simulacion/Data Mining/Data Mining/Data Mining 2023/Clases 2023/Capitulo 05/ToyotaCorolla.csv")
BD <- ToyotaCorolla
Posteriormente crearemos un codigo que permita leer cada uno de los atributos de la base de datos. Con este codigo los datos numericos seran representados mediante un histograma y los datos caracter mediante un diagrama de pie
# imporamos la base de datos desde un formato CSV
BDN <- NULL
BDC <- NULL
columnas <- dim(BD)[2]
par(mfrow = c(2,(columnas+1)/2))
for(i in 1:columnas)
{
if(is.numeric(BD[ ,i]) == TRUE)
{
texto <- paste("analis del atributo: ", colnames(BD)[i])
hist(BD[ ,i],col=i, main = texto,xlab = colnames(BD)[i])
BDN <- c(BDN, i)
}
else
{
texto <- paste("analis del atributo: ", colnames(BD)[i])
pie(table(BD[ ,i]),main =texto)
BDC <- c(BDC, i)
}
}