#2. Quality Wine – RED 
#Descripción: http://archive.ics.uci.edu/dataset/186/wine+quality
#Comando para cargar los datos en R desde internet
data1=read.csv(url("https://raw.githubusercontent.com/geovannychoez/prueba/master/winequality-red.csv"), header = TRUE,sep = ";")

Estadística descriptiva univariante

Dos diagramas de barras(sólo se dispone de una variable que puede ser cualitativa)

# Como no hay variables cualitativas, se adiciona la variable calidad para fines academicos
data1$calidad= ifelse(data1$quality =="0",
                  "PESIMA",
                  ifelse(data1$quality =="1",
                         "Muy Baja",
                         ifelse(data1$quality == "2",
                                "Baja",
                         ifelse(data1$quality =="3",
                                "Muy Regular",
                         ifelse(data1$quality == "4",
                                "Regular",
                         ifelse(data1$quality == "5",
                                "Media",
                         ifelse(data1$quality =="6",
                                "Buena",
                         ifelse(data1$quality == "7",
                                "Muy Buena",
                         ifelse(data1$quality == "8",
                                "Deseable",
                         ifelse(data1$quality == "9",
                                "Muy Deseable",
                                "Excelente")
                  )))))))))

highchart()%>%
  hc_add_series(data1$calidad,type="column")

Estadística descriptiva bivariante

Diagrama de dispersión Sugar and density

highchart()%>%
  hc_add_series(data1, "scatter", hcaes(x =residual.sugar , y = density))

Diagrama de dispersión fixed.acidity and alcohol

highchart()%>%
  hc_add_series(data1, "scatter", hcaes(x = fixed.acidity, y = alcohol))

Estadística descriptiva multivariante

Matriz4x4 gráfica de diagramas de dispersión (residual.sugar,density, fixed.acidity y alcohol)

plot(data1[,c(8,1,4,11)], col=c("red"))

## Matriz4x4 gráfica de diagramas de correlación (residual.sugar,density, fixed.acidity y alcohol )

library(psych)
pairs.panels(data1[,c(8,1,4,11)])

library(corrplot)
## corrplot 0.92 loaded
corrplot.mixed(cor(data1[,c(8,1,4,11)]), lower = "number", upper = "circle", tl.col="black")

## Conclusiones

##C1: De acuerdo al diagrama de correlación, la variable “density”, tiene asociación con las variables “fixed.acidity”, “residual.sugar” y “alochol”, por lo cual la cantidad de azúcar, alcohol, acidez pueden explicar la densidad del vino, lo que contribuye al cuerpo de esa bebida y a su sabor.

##C2: De acuerdo al diagrama de correlación, las variables “fixed.activity” y “residual.sugar”, no tienen una correlación con la variable “alcohol”, por lo cual la cantidad de acidez y azúcar no aporta signficativamente a la variable alcohol.