Mi primera sesion en Rstudio

En esta primera sesion analizaremos la base de datos de toyota corolla, la cual contiene 10 atributos y 1492 tuplas. La base de datos la puede descargar de https://www.kaggle.com/c/toyota-corolla/overview/description

# imporamos la base de datos desde un formato CSV
ToyotaCorolla <- read.csv("C:/Users/Rojas/Downloads/Simulacion/Data Mining/Data Mining/Data Mining 2023/Clases 2023/Capitulo 05/ToyotaCorolla.csv")
BD <- ToyotaCorolla

Visualizacion

Posteriormente crearemos un codigo que permita leer cada uno de los atributos de la base de datos. Con este codigo los datos numericos seran representados mediante un histograma y los datos caracter mediante un diagrama de pie

# imporamos la base de datos desde un formato CSV
BDN <- NULL
BDC <- NULL
columnas <- dim(BD)[2]
par(mfrow = c(2,(columnas+1)/2))


for(i in 1:columnas)
{
  if(is.numeric(BD[ ,i]) == TRUE)
  {
    texto <- paste("analis del atributo: ", colnames(BD)[i])
    hist(BD[ ,i],col=i, main = texto,xlab = colnames(BD)[i])
    BDN <- c(BDN, i)
  }
  else
  {
    texto <- paste("analis del atributo: ", colnames(BD)[i])
    pie(table(BD[ ,i]),main =texto)
    BDC <- c(BDC, i)
  }
}