title: “Regresion Lineal Multiple” author: “Emerson Valencia” date: “2026-05-08” output: html_document —
El objetivo de este análisis es estudiar la relación entre las propiedades fisicoquímicas del vino tinto portugués y su calidad sensorial mediante un modelo de regresión lineal múltiple.
El dataset Wine Quality - Red Wine contiene información sobre vinos tintos portugueses de la región de Vinho Verde. Incluye variables fisicoquímicas como acidez, cloruros, pH, alcohol y sulfatos, además de una variable de calidad evaluada sensorialmente.
## # A tibble: 6 × 12
## fixed.acidity volatile.acidity citric.acid residual.sugar chlorides
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 7.4 0.7 0 1.9 0.076
## 2 7.8 0.88 0 2.6 0.098
## 3 7.8 0.76 0.04 2.3 0.092
## 4 11.2 0.28 0.56 1.9 0.075
## 5 7.4 0.7 0 1.9 0.076
## 6 7.4 0.66 0 1.8 0.075
## # ℹ 7 more variables: free.sulfur.dioxide <dbl>, total.sulfur.dioxide <dbl>,
## # density <dbl>, pH <dbl>, sulphates <dbl>, alcohol <dbl>, quality <dbl>
## corrplot 0.95 loaded
##
## Call:
## lm(formula = quality ~ fixed.acidity + volatile.acidity + citric.acid +
## residual.sugar + chlorides + free.sulfur.dioxide + total.sulfur.dioxide +
## density + pH + sulphates + alcohol, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.68911 -0.36652 -0.04699 0.45202 2.02498
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.197e+01 2.119e+01 1.036 0.3002
## fixed.acidity 2.499e-02 2.595e-02 0.963 0.3357
## volatile.acidity -1.084e+00 1.211e-01 -8.948 < 2e-16 ***
## citric.acid -1.826e-01 1.472e-01 -1.240 0.2150
## residual.sugar 1.633e-02 1.500e-02 1.089 0.2765
## chlorides -1.874e+00 4.193e-01 -4.470 8.37e-06 ***
## free.sulfur.dioxide 4.361e-03 2.171e-03 2.009 0.0447 *
## total.sulfur.dioxide -3.265e-03 7.287e-04 -4.480 8.00e-06 ***
## density -1.788e+01 2.163e+01 -0.827 0.4086
## pH -4.137e-01 1.916e-01 -2.159 0.0310 *
## sulphates 9.163e-01 1.143e-01 8.014 2.13e-15 ***
## alcohol 2.762e-01 2.648e-02 10.429 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.648 on 1587 degrees of freedom
## Multiple R-squared: 0.3606, Adjusted R-squared: 0.3561
## F-statistic: 81.35 on 11 and 1587 DF, p-value: < 2.2e-16
La estructura general del modelo es:
quality = β0 + β1x1 + β2x2 + … + βnxn + ε
El modelo obtuvo un R-cuadrado ajustado de aproximadamente 0.3561, lo que indica que el modelo explica el 35.61% de la variabilidad de la calidad del vino.
Las variables estadísticamente significativas fueron:
Las variables alcohol y sulphates mostraron una relación positiva con la calidad del vino, mientras que volatile.acidity y chlorides presentaron una relación negativa significativa.
La regresión lineal múltiple permitió identificar las variables fisicoquímicas asociadas significativamente con la calidad del vino tinto. El alcohol fue una de las variables con mayor influencia positiva sobre la calidad.