#2. Quality Wine – RED 
#Descripción: http://archive.ics.uci.edu/dataset/186/wine+quality
#Comando para cargar los datos en R desde internet
data1=read.csv(url("https://raw.githubusercontent.com/geovannychoez/prueba/master/winequality-red.csv"), header = TRUE,sep = ";")

Estadística descriptiva univariante

Dos diagramas de barras(sólo se dispone de una variable que puede ser cualitativa)

# Como no hay variables cualitativas, se adiciona la variable calidad para fines academicos
data1$calidad= ifelse(data1$quality =="0",
                  "PESIMA",
                  ifelse(data1$quality =="1",
                         "Muy Baja",
                         ifelse(data1$quality == "2",
                                "Baja",
                         ifelse(data1$quality =="3",
                                "Muy Regular",
                         ifelse(data1$quality == "4",
                                "Regular",
                         ifelse(data1$quality == "5",
                                "Media",
                         ifelse(data1$quality =="6",
                                "Buena",
                         ifelse(data1$quality == "7",
                                "Muy Buena",
                         ifelse(data1$quality == "8",
                                "Deseable",
                         ifelse(data1$quality == "9",
                                "Muy Deseable",
                                "Excelente")
                  )))))))))

highchart()%>%
  hc_add_series(data1$calidad,type="column")

Estadística descriptiva bivariante

Diagrama de dispersión Sugar and density

highchart()%>%
  hc_add_series(data1, "scatter", hcaes(x =residual.sugar , y = density))

Diagrama de dispersión acidity and alcohol

highchart()%>%
  hc_add_series(data1, "scatter", hcaes(x = volatile.acidity, y = alcohol))

Estadística descriptiva multivariante

Matriz4x4 gráfica de diagramas de dispersión (residual.sugar,density, volatile,alcohol )

plot(data1[,c(4,8,2,11)], col=c("red"))

## Matriz4x4 gráfica de diagramas de correlación (residual.sugar,density, volatile,alcohol )

library(psych)
pairs.panels(data1[,c(4,8,2,11)])

library(corrplot)
## corrplot 0.92 loaded
corrplot(cor(data1[,c(4,8,2,11)]))

## Conclusiones

##C1: De acuerdo al diagrama de correlación, la variable “residual.sugar”, no tiene asociación con las variable “volatile.acidity” y “alochol”, por lo cual no es posible determinar algún sentido de covariación, sin embargo esto no significa que no exista una relación no lineal entre la variables, habría realizar otros análisis.

##C2: De acuerdo al diagrama de correlación, las variables “density” y “alcohol”, tienen una correlación negativa media, por lo cual existe una relación inversa entre ambas variables, es decir mientras mas “alcohol” disponga el vino, menos densidad tendrá.