Análisis descriptivo de la Calidad del Vino

A continuación se realiza un análisis descriptivo de la base de datos de La calidad del Vino.

#importar la base de datos de Calidad de Vino y realizar un resumen de la data 

BD <- read.csv("/cloud/project/winequality-red.csv")

#imprimir la dimension de la base de datos

dim(BD)
## [1] 1599   12
#los nombres de las base de datos
names(BD)
##  [1] "fixed.acidity"        "volatile.acidity"     "citric.acid"         
##  [4] "residual.sugar"       "chlorides"            "free.sulfur.dioxide" 
##  [7] "total.sulfur.dioxide" "density"              "pH"                  
## [10] "sulphates"            "alcohol"              "quality"
#la cantidad de columnas de la base de datos

columna <- dim(BD)[2]
columna
## [1] 12
#la composición de la data
str(BD)
## 'data.frame':    1599 obs. of  12 variables:
##  $ fixed.acidity       : num  7.4 7.8 7.8 11.2 7.4 7.4 7.9 7.3 7.8 7.5 ...
##  $ volatile.acidity    : num  0.7 0.88 0.76 0.28 0.7 0.66 0.6 0.65 0.58 0.5 ...
##  $ citric.acid         : num  0 0 0.04 0.56 0 0 0.06 0 0.02 0.36 ...
##  $ residual.sugar      : num  1.9 2.6 2.3 1.9 1.9 1.8 1.6 1.2 2 6.1 ...
##  $ chlorides           : num  0.076 0.098 0.092 0.075 0.076 0.075 0.069 0.065 0.073 0.071 ...
##  $ free.sulfur.dioxide : num  11 25 15 17 11 13 15 15 9 17 ...
##  $ total.sulfur.dioxide: num  34 67 54 60 34 40 59 21 18 102 ...
##  $ density             : num  0.998 0.997 0.997 0.998 0.998 ...
##  $ pH                  : num  3.51 3.2 3.26 3.16 3.51 3.51 3.3 3.39 3.36 3.35 ...
##  $ sulphates           : num  0.56 0.68 0.65 0.58 0.56 0.56 0.46 0.47 0.57 0.8 ...
##  $ alcohol             : num  9.4 9.8 9.8 9.8 9.4 9.4 9.4 10 9.5 10.5 ...
##  $ quality             : int  5 5 5 6 5 5 5 7 7 5 ...
#resumen de los cuartiles de la data
summary(BD)
##  fixed.acidity   volatile.acidity  citric.acid    residual.sugar  
##  Min.   : 4.60   Min.   :0.1200   Min.   :0.000   Min.   : 0.900  
##  1st Qu.: 7.10   1st Qu.:0.3900   1st Qu.:0.090   1st Qu.: 1.900  
##  Median : 7.90   Median :0.5200   Median :0.260   Median : 2.200  
##  Mean   : 8.32   Mean   :0.5278   Mean   :0.271   Mean   : 2.539  
##  3rd Qu.: 9.20   3rd Qu.:0.6400   3rd Qu.:0.420   3rd Qu.: 2.600  
##  Max.   :15.90   Max.   :1.5800   Max.   :1.000   Max.   :15.500  
##    chlorides       free.sulfur.dioxide total.sulfur.dioxide    density      
##  Min.   :0.01200   Min.   : 1.00       Min.   :  6.00       Min.   :0.9901  
##  1st Qu.:0.07000   1st Qu.: 7.00       1st Qu.: 22.00       1st Qu.:0.9956  
##  Median :0.07900   Median :14.00       Median : 38.00       Median :0.9968  
##  Mean   :0.08747   Mean   :15.87       Mean   : 46.47       Mean   :0.9967  
##  3rd Qu.:0.09000   3rd Qu.:21.00       3rd Qu.: 62.00       3rd Qu.:0.9978  
##  Max.   :0.61100   Max.   :72.00       Max.   :289.00       Max.   :1.0037  
##        pH          sulphates         alcohol         quality     
##  Min.   :2.740   Min.   :0.3300   Min.   : 8.40   Min.   :3.000  
##  1st Qu.:3.210   1st Qu.:0.5500   1st Qu.: 9.50   1st Qu.:5.000  
##  Median :3.310   Median :0.6200   Median :10.20   Median :6.000  
##  Mean   :3.311   Mean   :0.6581   Mean   :10.42   Mean   :5.636  
##  3rd Qu.:3.400   3rd Qu.:0.7300   3rd Qu.:11.10   3rd Qu.:6.000  
##  Max.   :4.010   Max.   :2.0000   Max.   :14.90   Max.   :8.000

Grafica de la base de datos

indexn <- NULL
indexc <- NULL

par(mfrow = c(2,5))




for(i in 1:columna){
  if(is.numeric(BD[ , i])== TRUE){
    titulo <- paste("Variable: ", colnames(BD[i]))
    hist(BD[ , i], col = i, main = titulo)
    indexn <- c(indexn,i)
  } else{
    titulo <- paste("Variable: ", colnames(BD[i]))
    pie(table(BD[ , i]), main = titulo)
    indexc <- c(indexc,i)
  }
}

Variables analizadas:

Fixed Acidity (Acidez Fija) Rango: de 4.60 a 15.90 La acidez fija es una medida estable de la acidez en el vino. El promedio es 8.32, con una dispersión significativa entre el mínimo y el máximo. Indica que hay variabilidad en los procesos de fermentación o en los tipos de uvas y técnicas utilizadas.

Volatile Acidity (Acidez Volátil)Rango: de 0.1200 a 1.5800 Se refiere a los componentes ácidos volátiles en el vino (como el ácido acético). El promedio es 0.5278, valores elevados pueden ser indicativos de defectos en el proceso de fermentación.

Citric Acid (Ácido Cítrico)Rango: de 0.000 a 1.000 El ácido cítrico contribuye a la frescura y estabilidad del vino. El valor promedio es 0.271, no hay una gran variabilidad respecto a los valores máximos, lo que indica su presencia estable.

Residual Sugar (Azúcar Residual)Rango: de 0.900 a 15.500 Se refiere al azúcar que queda después de la fermentación. El promedio es 2.539, lo que indica un rango considerablemente amplio. Esto puede reflejar vinos con estilos muy distintos (vinos secos vs. dulces).

Chlorides (Cloruros)Rango: de 0.01200 a 0.61100 Los niveles de cloruros afectan el sabor salado y la calidad del vino. El promedio es de 0.08747, por lo que su relación con la calidad no está afectando al producto.

Free Sulfur Dioxide (Dióxido de Azufre Libre)Rango: de 1.00 a 72.00 El dióxido de azufre es utilizado para estabilizar el vino y protegerlo contra la oxidación. El promedio es 15.87, con una alta dispersión. Algunos vinos pueden requerir niveles más altos para asegurar su conservación.

Total Sulfur Dioxide (Dióxido de Azufre Total) Rango: de 6.00 a 289.00 Correlacionado con el dióxido de azufre libre, pero incluye las formas combinadas. El promedio es 46.47, lo que refleja la concentración general de estos compuestos en el proceso de vinificación.

Density (Densidad)Rango: de 0.9901 a 1.0037 Indica el contenido de alcohol y azúcar en el vino. El promedio es 0.9967, con variaciones normales que reflejan el proceso de fermentación.Esto indicaría diferencias en los estilos de fermentación (dulce, seco, etc.) al igual que la azúcar residual.

pH Rango: de 2.740 a 4.010 El pH es un indicador clave en la acidez general del vino. El promedio es 3.311, lo que está dentro de los rangos típicos de vinos.

Sulphates (Sulfatos) Rango: de 0.3300 a 2.0000 Los sulfitos afectan la calidad y percepción sensorial. El promedio es 0.6581.La variabilidad es moderada.

Alcohol Rango: de 8.40 a 14.90 El nivel de alcohol es clave para la percepción sensorial y la estabilidad del vino. Observaciones: El promedio es 10.42, esto refleja vinos con un rango alcohólico típico.

Quality (Calidad)Rango: de 3 a 8 Se entiendo por la puntuación dada a la calidad por expertos. El promedio es 5.636, lo que indica que la mayoría de los vinos tienen una calidad intermedia.

Conclusiones:

Los resultados revelan una alta variabilidad en las características físicas y químicas entre las muestras de vino analizadas, lo que es común en estudios de este tipo debido a la diversidad de estilos, técnicas de vinificación y características de uvas utilizadas.

Se observan patrones de calidad moderada, con factores clave como acidez fija, azúcar residual, pH, y densidad influyendo en la percepción sensorial esperada.

Las prácticas relacionadas con el uso de dióxido de azufre y el nivel de azúcar residual sugieren diferencias en métodos de vinificación y en los estilos de vino producidos.