Ahora realizaremos un un analisis descriptivo de la base de datos de WINEQUALITY-RED.
BD = winequality.red...VILLANUEVA.ULLOA <- read.csv("C:/Users/pvillanueva/Desktop/winequality-red - VILLANUEVA ULLOA.csv")
### Dimension de la base de datos WineQualityRed
dim (BD)
## [1] 1599 12
dimension=dim (BD)
### Nombres de la base de datos WineQualityRed
names (BD)
## [1] "fixed.acidity" "volatile.acidity" "citric.acid"
## [4] "residual.sugar" "chlorides" "free.sulfur.dioxide"
## [7] "total.sulfur.dioxide" "density" "pH"
## [10] "sulphates" "alcohol" "quality"
## Cantidad de columnas de la base de datos de WineQualityRed
columna <- dim(BD) [1]
columna
## [1] 1599
## Composicion de la data WineQualityRed
str(BD)
## 'data.frame': 1599 obs. of 12 variables:
## $ fixed.acidity : num 7.4 7.8 7.8 11.2 7.4 7.4 7.9 7.3 7.8 7.5 ...
## $ volatile.acidity : num 0.7 0.88 0.76 0.28 0.7 0.66 0.6 0.65 0.58 0.5 ...
## $ citric.acid : num 0 0 0.04 0.56 0 0 0.06 0 0.02 0.36 ...
## $ residual.sugar : num 1.9 2.6 2.3 1.9 1.9 1.8 1.6 1.2 2 6.1 ...
## $ chlorides : num 0.076 0.098 0.092 0.075 0.076 0.075 0.069 0.065 0.073 0.071 ...
## $ free.sulfur.dioxide : num 11 25 15 17 11 13 15 15 9 17 ...
## $ total.sulfur.dioxide: num 34 67 54 60 34 40 59 21 18 102 ...
## $ density : num 0.998 0.997 0.997 0.998 0.998 ...
## $ pH : num 3.51 3.2 3.26 3.16 3.51 3.51 3.3 3.39 3.36 3.35 ...
## $ sulphates : num 0.56 0.68 0.65 0.58 0.56 0.56 0.46 0.47 0.57 0.8 ...
## $ alcohol : num 9.4 9.8 9.8 9.8 9.4 9.4 9.4 10 9.5 10.5 ...
## $ quality : int 5 5 5 6 5 5 5 7 7 5 ...
# Resumen de los cuartiles de la data de WineQualityRed
summary (BD)
## fixed.acidity volatile.acidity citric.acid residual.sugar
## Min. : 4.60 Min. :0.1200 Min. :0.000 Min. : 0.900
## 1st Qu.: 7.10 1st Qu.:0.3900 1st Qu.:0.090 1st Qu.: 1.900
## Median : 7.90 Median :0.5200 Median :0.260 Median : 2.200
## Mean : 8.32 Mean :0.5278 Mean :0.271 Mean : 2.539
## 3rd Qu.: 9.20 3rd Qu.:0.6400 3rd Qu.:0.420 3rd Qu.: 2.600
## Max. :15.90 Max. :1.5800 Max. :1.000 Max. :15.500
## chlorides free.sulfur.dioxide total.sulfur.dioxide density
## Min. :0.01200 Min. : 1.00 Min. : 6.00 Min. :0.9901
## 1st Qu.:0.07000 1st Qu.: 7.00 1st Qu.: 22.00 1st Qu.:0.9956
## Median :0.07900 Median :14.00 Median : 38.00 Median :0.9968
## Mean :0.08747 Mean :15.87 Mean : 46.47 Mean :0.9967
## 3rd Qu.:0.09000 3rd Qu.:21.00 3rd Qu.: 62.00 3rd Qu.:0.9978
## Max. :0.61100 Max. :72.00 Max. :289.00 Max. :1.0037
## pH sulphates alcohol quality
## Min. :2.740 Min. :0.3300 Min. : 8.40 Min. :3.000
## 1st Qu.:3.210 1st Qu.:0.5500 1st Qu.: 9.50 1st Qu.:5.000
## Median :3.310 Median :0.6200 Median :10.20 Median :6.000
## Mean :3.311 Mean :0.6581 Mean :10.42 Mean :5.636
## 3rd Qu.:3.400 3rd Qu.:0.7300 3rd Qu.:11.10 3rd Qu.:6.000
## Max. :4.010 Max. :2.0000 Max. :14.90 Max. :8.000
## Grafica de la base de datos de WineQualityRed
indexn <- NULL
indexc <- NULL
par(mfrow=c(2,dimension[2]/2))
for(j in 1:dimension[2]) {
if(is.numeric(BD[,j]) == "TRUE") {
Titulo <- paste('Analisis de la variable: ',colnames(BD)[j])
hist(BD[,j],col=j, main = Titulo)
indexn <- c(indexn,j)
} else {
Titulo <- paste('Analisis de la variable: ',colnames(BD)[j])
pie(table(BD[,j]), main = Titulo)
indexc <- c(indexc,j)
}
}
Dimensiones: 1,599 observaciones y 12 variables.
Columnas disponibles en la data son : Variables relacionadas con la composición química del vino, como: fixed acidity, volatile acidity, citric acid, residual sugar, chlorides, sulphates, alcohol, etc.
Una variable categórica discreta, quality, que refleja la calidad del vino.
Todas las variables, excepto quality, son numéricas continuas.
La variable quality es un entero que representa la evaluación de calidad.
Ácidos (fixed acidity, volatile acidity, citric acid):
Los valores promedio sugieren un nivel típico de acidez en vinos tintos, fixed acidity tiene un rango amplio, mientras que citric acid presenta valores más concentrados cerca del promedio.
Azúcares residuales: Aunque el promedio es 2.54, hay valores máximos altos (15.5), lo que podría indicar algunas muestras más dulces.
Sulfatos y dióxido de azufre: Algunos vinos tienen niveles muy altos de estos compuestos, que son conservantes.
pH: Valores ligeramente ácidos (media = 3.31).
Alcohol: Promedio de 10.42%, rango de 8.4% a 14.9%.
Calidad: La mayoría de las muestras están en la media de calidad de 5-6 puntos.