Introdución

En este material se presenta un analisís estadistico, basandonos en las caracteristicas que requiere un buen vino y enfocandonos en las cantidades de Azucar Residual, Acidez fija y la Densidad de este. Con el objetivo de descubrir cual de las variables afecta en mayor medida en que el vino sea mas denso.
Esta es la fuente de donde se obtuvo la información: https://www.kaggle.com/rajyellow46/wine-quality. Esta tabla de datos contiene el registro de mas de 1000 ejemplares de vinos junto con la cantidad de sustancias que contienen. De los cuales decidimos tomar una muestra de 100 vinos en los cuales basarnos.
Integrantes del equipo: Israel Eguino, Víctor Gutiérrez, Jesús Valera

vinos
## # A tibble: 100 x 3
##    acidez_fija azucar_residual densidad
##          <dbl>           <dbl>    <dbl>
##  1         7.4             1.9    0.998
##  2         7.8             2.6    0.997
##  3         7.8             2.3    0.997
##  4        11.2             1.9    0.998
##  5         7.4             1.9    0.998
##  6         7.4             1.8    0.998
##  7         7.9             1.6    0.996
##  8         7.3             1.2    0.995
##  9         7.8             2      0.997
## 10         7.5             6.1    0.998
## # ... with 90 more rows



Regresión lineal en relación a la cantidad de Azúcar residual

plot( vinos$azucar_residual , vinos$densidad, xlab="Azúcar Residual", ylab = "Densidad")
regresion = lm(densidad ~ azucar_residual, data=vinos)
abline(regresion)
  • Predicción con los valores de azucar residual 6 a 10
  • vector1 = seq(6, 10)
    names(vector1) = c("6", "7", "8", "9", "10")
    predict(regresion,data.frame(azucar_residual = vector1))
    ##         6         7         8         9        10 
    ## 0.9980264 0.9983822 0.9987380 0.9990938 0.9994497


    Regresión lineal en relación a la cantidad de Azúcar residual

    plot( vinos$acidez_fija , vinos$densidad, xlab="Acidez Fija", ylab = "Densidad")
    regresion = lm(densidad ~ acidez_fija, data=vinos)
    abline(regresion)
  • Predicción con los valores de Acidez fija 12 a 15
  • vector2 = seq(12,15)
    names(vector2) = c("12", "13", "14", "15")
    predict(regresion,data.frame(acidez_fija = vector2))
    ##        12        13        14        15 
    ## 0.9998728 1.0005757 1.0012786 1.0019815


    Correlaciones de las variables

    cor(vinos)
    ##                 acidez_fija azucar_residual  densidad
    ## acidez_fija      1.00000000      0.03170208 0.6820987
    ## azucar_residual  0.03170208      1.00000000 0.4411835
    ## densidad         0.68209874      0.44118353 1.0000000

    Como se puede observar con las correlaciónes de las variables la acidez fija tiene un mayor impacto en la densidad que presentan los los vinos con un 68% de correlación, mientras que el azúcar residual tienen un 44% de correlación con las calorías. Esta información puede ser de mucha utilidad ya que la densidad del vino tiene un gran impacto en la calidad que este mismo consigue.