library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(highcharter)
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
library(corrplot)
## corrplot 0.92 loaded
data=read.csv(url("http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data"),header = FALSE)
nuevos_nombres <- c('Class', 'Alcohol', 'MalicAcid', 'Ash', 'AlcalinityOfAsh', 'Magnesium', 'Total phenols', 'Flavanoids', 'NonflavanoidPhenols', 'Proanthocyanins', 'ColorIntensity', 'Hue', 'OD280/OD315', 'Proline')
colnames(data) <- nuevos_nombres
names(data)
## [1] "Class" "Alcohol" "MalicAcid"
## [4] "Ash" "AlcalinityOfAsh" "Magnesium"
## [7] "Total phenols" "Flavanoids" "NonflavanoidPhenols"
## [10] "Proanthocyanins" "ColorIntensity" "Hue"
## [13] "OD280/OD315" "Proline"
data$Class <- as.factor(data$Class)
Class: La categoría del vino, generalmente identificada por un número (1, 2 o 3) que indica a qué grupo pertenece según sus características químicas.
Alcohol: El porcentaje de alcohol en volumen presente en el vino.
Malic acid: La concentración de ácido málico en el vino, un ácido orgánico que contribuye a la acidez y el sabor.
Ash: El contenido total de cenizas en el vino, que incluye minerales y otros componentes no volátiles.
Alcalinity of ash: Una medida de la alcalinidad de las cenizas, que indica la concentración de compuestos alcalinos (principalmente sales) en el vino.
Magnesium: La cantidad de magnesio presente en el vino, un mineral importante que puede influir en el sabor y la salud.
Total phenols: La concentración total de fenoles en el vino, compuestos que afectan el sabor, color y propiedades antioxidantes.
Flavanoids: La cantidad de flavonoides en el vino, un tipo de fenol que contribuye a la astringencia y el color.
Nonflavanoid phenols: La concentración de fenoles no flavonoides, que también afectan el sabor y las propiedades antioxidantes del vino.
Proanthocyanins: La concentración de proantocianidinas en el vino, compuestos que influyen en la astringencia y el cuerpo del vino.
Color intensity: Una medida de la intensidad del color del vino, que puede estar relacionada con la concentración de compuestos colorantes.
Hue: El matiz del color del vino, que indica su tono específico en la escala de colores.
OD280/OD315: La proporción de absorbancia a 280 nm y 315 nm, que mide la concentración de taninos y otros compuestos fenólicos en el vino.
Proline: La cantidad de prolina, un aminoácido que está relacionado con la madurez de la uva y puede influir en el sabor del vino.
head(data)
## Class Alcohol MalicAcid Ash AlcalinityOfAsh Magnesium Total phenols
## 1 1 14.23 1.71 2.43 15.6 127 2.80
## 2 1 13.20 1.78 2.14 11.2 100 2.65
## 3 1 13.16 2.36 2.67 18.6 101 2.80
## 4 1 14.37 1.95 2.50 16.8 113 3.85
## 5 1 13.24 2.59 2.87 21.0 118 2.80
## 6 1 14.20 1.76 2.45 15.2 112 3.27
## Flavanoids NonflavanoidPhenols Proanthocyanins ColorIntensity Hue
## 1 3.06 0.28 2.29 5.64 1.04
## 2 2.76 0.26 1.28 4.38 1.05
## 3 3.24 0.30 2.81 5.68 1.03
## 4 3.49 0.24 2.18 7.80 0.86
## 5 2.69 0.39 1.82 4.32 1.04
## 6 3.39 0.34 1.97 6.75 1.05
## OD280/OD315 Proline
## 1 3.92 1065
## 2 3.40 1050
## 3 3.17 1185
## 4 3.45 1480
## 5 2.93 735
## 6 2.85 1450
En este caso podemos observar que solo hay una variable cualitativa de tipo categorico que es “Class” por este motivo solo se realizara un solo grafico cuantitativo. ## Explorar el tipo de variables para realizar los graficos
| Variable Name | Type |
|---|---|
| Class | Categorical |
| Alcohol | Continuous |
| Malic_acid | Continuous |
| Ash | Continuous |
| Alcalinity_of_ash | Continuous |
| Magnesium | Integer |
| Total_phenols | Continuous |
| Flavanoids | Continuous |
| Nonflavanoid_phenols | Continuous |
| Proanthocyanins | Continuous |
| Color_intensity | Continuous |
| Hue | Continuous |
| 0D280/0D315 | Continuous |
| Proline | Integer |
# Crear una tabla de frecuencias para Class
class_counts <- data %>%
count(Class)
hchart(class_counts, "column", hcaes(x = Class, y = n)) %>%
hc_title(text = "Distribución de la variable Class") %>%
hc_xAxis(title = list(text = "Class")) %>%
hc_yAxis(title = list(text = "Frecuencia")) %>%
hc_tooltip(pointFormat = "Frecuencia: {point.y}")
hchart(data, "scatter", hcaes(x = Alcohol, y = MalicAcid)) %>%
hc_title(text = "Diagrama de Dispersión: Alcohol vs. Malic Acid") %>%
hc_xAxis(title = list(text = "Alcohol")) %>%
hc_yAxis(title = list(text = "Malic Acid")) %>%
hc_tooltip(pointFormat = "Alcohol: {point.x}<br>Malic Acid: {point.y}") %>%
hc_add_theme(hc_theme_flat())
hchart(data, "scatter", hcaes(x = Ash, y = AlcalinityOfAsh)) %>%
hc_title(text = "Diagrama de Dispersión: Ash vs. Alcalinity Of Ash") %>%
hc_xAxis(title = list(text = "Ash")) %>%
hc_yAxis(title = list(text = "Alcalinity Of Ash")) %>%
hc_tooltip(pointFormat = "Ash: {point.x}<br>Alcalinity Of Ash: {point.y}") %>%
hc_plotOptions(
series = list(
color = "red" # Cambiar color de los puntos
)
) %>%
hc_add_theme(hc_theme_flat())
plot(data[,6:10], col=c("red"))
data_subset <- data[, 6:10]
corr_matrix_subset <- cor(data_subset)
corrplot(corr_matrix_subset,
method = "circle",
type = "full",
title = "Correlaciones entre 'Magnesium', 'Total phenols', 'Flavanoids', 'NonflavanoidPhenols', 'Proanthocyanins' ",
addCoef.col = "black",
tl.col = "black",
tl.srt = 45)
Como se puede observar en los gráficos de correlación y dispersión, las variables ‘Total phenols’ y ‘Flavanoids’ presentan una correlación fuertemente positiva y lineal. Además, se puede afirmar que estas variables son directamente proporcionales: a medida que aumentan los ‘Flavanoids’, también aumenta la cantidad de fenoles totales en los vinos.