#2. Quality Wine – RED
#Descripción: http://archive.ics.uci.edu/dataset/186/wine+quality
#Comando para cargar los datos en R desde internet
data1=read.csv(url("https://raw.githubusercontent.com/geovannychoez/prueba/master/winequality-red.csv"), header = TRUE,sep = ";")
# Como no hay variables cualitativas, se adiciona la variable calidad para fines academicos
data1$calidad= ifelse(data1$quality =="0",
"PESIMA",
ifelse(data1$quality =="1",
"Muy Baja",
ifelse(data1$quality == "2",
"Baja",
ifelse(data1$quality =="3",
"Muy Regular",
ifelse(data1$quality == "4",
"Regular",
ifelse(data1$quality == "5",
"Media",
ifelse(data1$quality =="6",
"Buena",
ifelse(data1$quality == "7",
"Muy Buena",
ifelse(data1$quality == "8",
"Deseable",
ifelse(data1$quality == "9",
"Muy Deseable",
"Excelente")
)))))))))
highchart()%>%
hc_add_series(data1$calidad,type="column")
highchart()%>%
hc_add_series(data1, "scatter", hcaes(x =residual.sugar , y = density))
highchart()%>%
hc_add_series(data1, "scatter", hcaes(x = fixed.acidity, y = alcohol))
plot(data1[,c(8,1,4,11)], col=c("red"))
##
Matriz4x4 gráfica de diagramas de correlación (residual.sugar,density,
fixed.acidity y alcohol )
library(psych)
pairs.panels(data1[,c(8,1,4,11)])
library(corrplot)
## corrplot 0.92 loaded
corrplot.mixed(cor(data1[,c(8,1,4,11)]), lower = "number", upper = "circle", tl.col="black")
##
Conclusiones
##C1: De acuerdo al diagrama de correlación, la variable “density”, tiene asociación con las variables “fixed.acidity”, “residual.sugar” y “alochol”, por lo cual la cantidad de azúcar, alcohol, acidez pueden explicar la densidad del vino, lo que contribuye al cuerpo de esa bebida y a su sabor.
##C2: De acuerdo al diagrama de correlación, las variables “fixed.activity” y “residual.sugar”, no tienen una correlación con la variable “alcohol”, por lo cual la cantidad de acidez y azúcar no aporta signficativamente a la variable alcohol.