#2. Quality Wine – RED
#Descripción: http://archive.ics.uci.edu/dataset/186/wine+quality
#Comando para cargar los datos en R desde internet
data1=read.csv(url("https://raw.githubusercontent.com/geovannychoez/prueba/master/winequality-red.csv"), header = TRUE,sep = ";")
# Como no hay variables cualitativas, se adiciona la variable calidad para fines academicos
data1$calidad= ifelse(data1$quality =="0",
"PESIMA",
ifelse(data1$quality =="1",
"Muy Baja",
ifelse(data1$quality == "2",
"Baja",
ifelse(data1$quality =="3",
"Muy Regular",
ifelse(data1$quality == "4",
"Regular",
ifelse(data1$quality == "5",
"Media",
ifelse(data1$quality =="6",
"Buena",
ifelse(data1$quality == "7",
"Muy Buena",
ifelse(data1$quality == "8",
"Deseable",
ifelse(data1$quality == "9",
"Muy Deseable",
"Excelente")
)))))))))
highchart()%>%
hc_add_series(data1$calidad,type="column")
highchart()%>%
hc_add_series(data1, "scatter", hcaes(x =residual.sugar , y = density))
highchart()%>%
hc_add_series(data1, "scatter", hcaes(x = volatile.acidity, y = alcohol))
plot(data1[,c(4,8,2,11)], col=c("red"))
##
Matriz4x4 gráfica de diagramas de correlación (residual.sugar,density,
volatile,alcohol )
library(psych)
pairs.panels(data1[,c(4,8,2,11)])
library(corrplot)
## corrplot 0.92 loaded
corrplot(cor(data1[,c(4,8,2,11)]))
##
Conclusiones
##C1: De acuerdo al diagrama de correlación, la variable “residual.sugar”, no tiene asociación con las variable “volatile.acidity” y “alochol”, por lo cual no es posible determinar algún sentido de covariación, sin embargo esto no significa que no exista una relación no lineal entre la variables, habría realizar otros análisis.
##C2: De acuerdo al diagrama de correlación, las variables “density” y “alcohol”, tienen una correlación negativa media, por lo cual existe una relación inversa entre ambas variables, es decir mientras mas “alcohol” disponga el vino, menos densidad tendrá.