Olga Yamile Benavides Castro

Danna Lizeth Camargo Garcia

Ariadna Valentina Sanchez Fonseca

Docente: Jairo Enrique

Universidad Pedagógica y Técnologica de Colombia

Facultad de Ciencias - Química

2025

CALIDAD DE VINO

Planteamiento del Problema

La clasificación sensorial y técnica de los vinos, ya sea por tipo (blanco o tinto), calidad (baja, media, excelente) o nivel de acidez, responde a una compleja interacción de características fisicoquímicas que no siempre se reflejan con precisión en los procesos de valoración subjetiva o comercial. A pesar de que el etiquetado de un vino puede sugerir una categoría determinada, no siempre existe respaldo estadístico que justifique tales distinciones.

Este proyecto surge de la necesidad de validar empíricamente si las categorías utilizadas en la industria vitivinícola (como “Excelente”, “Muy ácido” o “Alcohol alto”) están sustentadas en diferencias cuantificables y estadísticamente significativas entre muestras, evaluando variables clave como el contenido de alcohol, acidez volátil, pH, azúcar residual, densidad y dióxido de azufre.

Mediante un análisis riguroso basado en el Diseño de Experimentos y técnicas estadísticas como pruebas de normalidad, igualdad de varianzas, pruebas t y pruebas no paramétricas, se busca:

  • Detectar incongruencias o sobreposiciones entre categorías nominales y medidas continuas que podrían estar indicando un sesgo o subutilización de ciertos parámetros en la clasificación.

  • Evaluar si vinos considerados como de mayor calidad o puntuación sensorial presentan efectivamente mejores condiciones fisicoquímicas, o si estas categorizaciones están influidas por otros factores no medidos.

En lugar de limitarse a describir diferencias, este estudio pretende validar la consistencia interna de las clasificaciones y explorar posibles ajustes a los sistemas de categorización actuales, proponiendo un enfoque basado en evidencia y con potencial de aplicación para mejorar tanto la producción como la percepción del vino

Objetivos

Objetivo General

Evaluar los parámetros fisicoquímicos más influyentes en la percepción de calidad y aceptabilidad del vino blanco y tinto, mediante análisis estadístico y técnicas de Diseño de Experimentos aplicadas a datos observacionales, con el fin de identificar patrones que orienten futuras estrategias de mejora del producto.

Objetivos Específicos

Identificar y cuantificar la influencia de variables fisicoquímicas (como acidez fija, acidez volátil, contenido de alcohol, sulfatos, entre otras) sobre las categorías de calidad y el puntaje sensorial de los vinos.

Evaluar si existen interacciones significativas entre variables fisicoquímicas y características categóricas como tipo de vino, nivel de acidez y contenido de alcohol, que afecten la calidad global.

Comparar estadísticamente los parámetros químicos entre niveles de clasificación (calidad, acidez, tipo de vino, etc.) para establecer si estas categorías están respaldadas por diferencias objetivas y significativas.

Proponer, a partir de los resultados obtenidos, recomendaciones para el control de calidad y la mejora del perfil químico del vino según tipo y categoría.

Antecedentes

La calidad del vino es el resultado de una compleja interacción entre factores fisicoquímicos y sensoriales que influyen en su aceptación comercial. Tradicionalmente, los criterios de clasificación como “Buena calidad”, “Muy ácido” o “Tipo tinto” han sido establecidos con base en valoraciones sensoriales o estándares generales, sin validar siempre su coherencia mediante herramientas estadísticas. En este contexto, el análisis estadístico de datos observacionales ofrece una vía rigurosa y objetiva para examinar si las variables cuantitativas que definen las propiedades del vino respaldan efectivamente dichas categorizaciones.

Diversos estudios han empleado técnicas de diseño de experimentos (DoE) y modelos estadísticos multivariantes para optimizar procesos como la fermentación, extracción de compuestos fenólicos o caracterización aromática. Sin embargo, investigaciones más recientes también han explorado el uso de datos reales para desarrollar modelos predictivos de calidad a partir de variables como el contenido de alcohol, el pH o los niveles de dióxido de azufre (Cortez et al., 2009; González Viejo et al., 2017). Estos trabajos muestran que muchas decisiones sobre clasificación del vino podrían beneficiarse de una revisión basada en análisis estadístico inferencial.

En el presente proyecto, no se busca intervenir el proceso de elaboración del vino, sino evaluar si los criterios actuales de clasificación están sustentados en diferencias estadísticamente significativas entre muestras reales. Para ello, se utilizarán técnicas como pruebas de normalidad, pruebas de igualdad de varianzas y pruebas de hipótesis (t-student o Wilcoxon), complementadas con herramientas visuales como diagramas de caja y medidas descriptivas (medias, rangos, cuartiles).

Este enfoque permite, por un lado, identificar patrones o inconsistencias dentro de las categorías asignadas, y por otro, sugerir criterios alternativos para mejorar la clasificación de los vinos. De esta manera, se aporta una mirada crítica basada en evidencia cuantitativa, útil tanto para procesos de control de calidad como para decisiones de mercado.

Desarrollo del Proyecto

Se trabajó con una base de datos compuesta por 6.497 observaciones y 16 variables, las cuales describen características fisicoquímicas, sensoriales y categóricas de distintos vinos blancos y tintos. Entre las variables cuantitativas se encuentran: acidez fija, acidez volátil, ácido cítrico, azúcar residual, cloruros, dióxido de azufre libre y total, densidad, pH, sulfatos y contenido de alcohol. Las variables cualitativas incluyen acidez categórica, calidad, contenido de alcohol (categorizado como bajo, medio o alto), tipo de vino (blanco o tinto) y clasificación sensorial.

Los nombres de las variables fueron estandarizados para facilitar su manipulación, y se verificó la presencia de valores extremos o inconsistentes, como outliers atípicos que podrían afectar los análisis inferenciales posteriores. Una vez filtradas las inconsistencias, se generaron estadísticas descriptivas globales para comprender la distribución general de los datos.

'data.frame':   6497 obs. of  16 variables:
 $ acidez.fija            : num  7 6.3 8.1 7.2 7.2 8.1 6.2 7 6.3 8.1 ...
 $ acidez.volátil         : num  0.27 0.3 0.28 0.23 0.23 0.28 0.32 0.27 0.3 0.22 ...
 $ X.ácido.cítrico        : num  0.36 0.34 0.4 0.32 0.32 0.4 0.16 0.36 0.34 0.43 ...
 $ azúcar.residual        : num  20.7 1.6 6.9 8.5 8.5 6.9 7 20.7 1.6 1.5 ...
 $ cloruros               : num  0.045 0.049 0.05 0.058 0.058 0.05 0.045 0.045 0.049 0.044 ...
 $ dióxido.de.azufre.libre: num  45 14 30 47 47 30 30 45 14 28 ...
 $ dióxido.de.azufre.total: num  170 132 97 186 186 97 136 170 132 129 ...
 $ densidad               : num  1.001 0.994 0.995 0.996 0.996 ...
 $ pH                     : num  3 3.3 3.26 3.19 3.19 3.26 3.18 3 3.3 3.22 ...
 $ acidez                 : chr  "Muy ácido" "Ácido" "Ácido" "Muy ácido" ...
 $ sulfatos               : num  0.45 0.49 0.44 0.4 0.4 0.44 0.47 0.45 0.49 0.45 ...
 $ alcohol                : num  8.8 9.5 10.1 9.9 9.9 10.1 9.6 8.8 9.5 11 ...
 $ contenido.de.alcohol   : chr  "Bajo" "Bajo" "Medio" "Bajo" ...
 $ puntaje.sensorial      : int  6 6 6 6 6 6 6 6 6 6 ...
 $ calidad                : chr  "Media" "Media" "Media" "Media" ...
 $ tipo                   : chr  "white" "white" "white" "white" ...

Análisis Exploratorio de Datos (EDA)

Acidez Volátil

La variable acidez volátil fue explorada mediante medidas descriptivas:

    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
   0.080    0.230    0.290    1.319    0.400 1185.000 
       media mediana desviacion_estandar minimo Q1_25 Q2_50 Q3_75 maximo
25% 1.319138    0.29            32.30417   0.08  0.23  0.29   0.4   1185

El valor mínimo observado fue de 0.08, mientras que el máximo alcanzó los 1185, lo cual sugiere la presencia de un valor extremo atípico. La media fue de 1.319 y la mediana de 0.290, lo que indica una distribución altamente asimétrica a la derecha. El primer cuartil (Q1) fue 0.230, el tercer cuartil (Q3) fue 0.400 y la desviación estándar fue de aproximadamente 6.14, lo que refuerza la existencia de una alta variabilidad, posiblemente explicada por ese valor extremo

En la figura se presenta el diagrama de caja y bigotes para la variable acidez volátil, excluyendo valores extremos superiores a 2 g/L para una visualización más adecuada. Se observa una distribución asimétrica a la derecha, con presencia de varios valores atípicos por encima del tercer cuartil. Este tipo de comportamiento sugiere que, aunque la mayoría de las muestras tienen niveles de acidez volátil entre 0.2 y 0.5 g/L, existen casos con valores significativamente mayores que podrían influir en análisis posteriores si no se tratan adecuadamente.

Alcohol

              media             mediana desviacion_estandar              minimo 
          10.504746           10.300000            1.593123            8.000000 
             maximo          Q1_25%.25%          Q2_50%.50%          Q3_75%.75% 
          95.666667            9.500000           10.300000           11.300000 

Se observa una distribución con tendencia a valores bajos de alcohol, pero con la presencia de un posible valor atípico extremo cercano a 95.7, que claramente excede el rango esperado para vinos tradicionales, sugiriendo que debe ser excluido o evaluado con atención durante los análisis gráficos e inferenciales.

A partir del análisis exploratorio, se consideró pertinente investigar si algunas características fisicoquímicas y sensoriales difieren significativamente entre grupos categorizados por acidez, tipo de vino, contenido de alcohol o calidad. Para ello, se aplicaron pruebas de hipótesis y se estimaron intervalos de confianza, respondiendo a una serie de preguntas específicas presentadas a continuación.

Dado que el valor máximo de contenido de alcohol alcanzaba los 95.67%, se decidió realizar un análisis gráfico excluyendo valores superiores al 20% para evitar la distorsión de la escala. Tras el filtrado, el boxplot revela una concentración de muestras entre 9.5% y 11.3%, lo cual coincide con el rango común en vinos. Este ajuste permitió una visualización más clara de la variabilidad sin eliminar observaciones típicas del fenómeno.

pH

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.720   3.110   3.210   3.219   3.320   4.010
## [1] 0.1607872

La variable pH fue explorada para comprender su comportamiento general dentro de la muestra. El rango de valores se ubicó entre 2.7 y 4.3, con una media y mediana de aproximadamente 3.2. El análisis mostró que la distribución es relativamente simétrica y con baja dispersión (desviación estándar cercana a 0.15), lo cual es esperable, ya que la mayoría de los vinos comerciales mantienen su pH en rangos óptimos para asegurar estabilidad microbiológica y sensorial.

Se realizó una visualización con valores de pH entre 2.5 y 4.5 para evitar distorsiones causadas por posibles datos atípicos o errores de medición. Este gráfico muestra una ligera concentración hacia los valores intermedios (entre 3.1 y 3.3), consistentes con vinos equilibrados en acidez.

Azúcar Residual

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.600   1.800   3.000   5.434   8.100  31.600 
[1] 4.698852

Se analizó la variable azúcar residual, la cual representa la cantidad de azúcar que permanece en el vino después del proceso de fermentación. Esta característica influye en el sabor del producto, especialmente en vinos blancos o dulces. Para mejorar la visualización, se excluyeron valores superiores a 40 g/L, ya que distorsionaban la escala del gráfico.

El análisis reveló que la mediana se encuentra en torno a 2.5 g/L, mientras que la media alcanza los 5.4 g/L, indicando una asimetría positiva influenciada por valores altos. El 50% central de las observaciones se encuentra entre 1.8 y 4.2 g/L. Estos resultados muestran que, aunque la mayoría de las muestras tienen concentraciones moderadas, existen vinos con niveles de azúcar considerablemente mayores, posiblemente relacionados con estilos semidulces o errores de carga.

Acidez


         Ácido Bajo en acidez          Medio      Muy ácido 
          2483             91            693           3230 

Se analizó la variable categórica acidez, la cual clasifica las muestras en cuatro niveles cualitativos: “Muy ácido”, “Ácido”, “Medio” y “Bajo en acidez”. A través de una tabla de frecuencias y un gráfico de barras, se observó que el mayor número de observaciones se concentra en los niveles “Medio” y “Ácido”, lo que sugiere que la mayoría de los vinos analizados presentan una acidez moderada.

sta variable es de gran importancia en el estudio, ya que la acidez influye directamente en la percepción sensorial del vino, su frescura, longevidad y balance gustativo. Clasificar los vinos por nivel de acidez permite realizar comparaciones estructuradas con otras variables fisicoquímicas como el pH, el contenido de alcohol, los sulfatos y el puntaje sensorial, con el fin de identificar patrones asociados a características deseables de calidad enológica.

Además, esta clasificación será útil al momento de aplicar pruebas de hipótesis, al permitir contrastar si existen diferencias significativas entre los grupos definidos por sus niveles de acidez.

Tipo de Vino

## 
##  rojo white 
##  1599  4898

Se evaluó la variable tipo, que clasifica los vinos como blanco o rojo. La tabla de frecuencias y el gráfico de barras revelan que existe un mayor número de observaciones correspondientes al tipo blanco, lo cual podría tener implicaciones en el análisis posterior, especialmente al realizar comparaciones de variables fisicoquímicas entre tipos.

La diferenciación entre vinos blancos y tintos es fundamental, ya que se elaboran a partir de distintos procesos enológicos, lo cual impacta notablemente en su contenido de alcohol, pH, acidez, compuestos fenólicos y perfil sensorial. Por tanto, esta variable permitirá segmentar los análisis para evaluar si estas diferencias se manifiestan estadísticamente en los datos.

Esta clasificación también se utilizará para contrastes de medias y pruebas no paramétricas entre los tipos de vino, a fin de identificar si ciertas propiedades analíticas o sensoriales son propias del tipo de uva o del método de elaboración

Calidad


     Baja     Buena Excelente     Media  Muy baja 
     2138      1079       198      2836       246 

Se analizó la variable calidad categórica, la cual agrupa las muestras en cinco niveles: Muy baja, Baja, Media, Buena y Excelente, en función de una escala ordinal derivada del puntaje sensorial y otras métricas de evaluación enológica.

La distribución observada en el gráfico de barras muestra que la mayoría de los vinos se concentran en los niveles intermedios de calidad, particularmente en los grupos Media y Buena. Esta tendencia sugiere una predominancia de vinos con características aceptables a destacables dentro de la muestra.

Esta variable resulta fundamental para el análisis, ya que se utilizará como eje de comparación en múltiples pruebas de hipótesis. El objetivo será determinar si existen diferencias estadísticamente significativas en parámetros fisicoquímicos como el alcohol, la acidez volátil, la densidad o el contenido de azúcares residuales entre vinos de distintas calidades.

Además, esta clasificación cualitativa representa una síntesis de la percepción general del vino y permite integrar múltiples aspectos en una sola medida, facilitando el análisis multivariado y la identificación de factores que inciden en una mejor calidad del producto.

Resolución de Preguntas

Variable 1: Acidez (Ácido y Muy Ácido)

1. ¿El contenido promedio de alcohol varía según el nivel de acidez (por ejemplo, Ácido vs. Muy ácido)?


    Ácido Muy ácido 
     2483      3230 

Con el fin de comparar estadísticamente el contenido promedio de alcohol entre diferentes niveles de acidez, se filtraron los datos para incluir únicamente las observaciones clasificadas como “Ácido” y “Muy ácido”. Esta selección permitió reducir el análisis a dos niveles comparables, facilitando así la aplicación de pruebas estadísticas de diferencia de medias y de distribución. El número de muestras resultante fue de 2.483 vinos clasificados como Ácidos y 3.230 como Muy ácidos, lo que garantiza tamaños muestrales adecuados para los procedimientos inferenciales posteriores.


    Shapiro-Wilk normality test

data:  subset(data_filtrada, acidez == "Ácido")$alcohol
W = 0.95802, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  subset(data_filtrada, acidez == "Muy ácido")$alcohol
W = 0.43265, p-value < 2.2e-16

Para determinar si la variable contenido de alcohol presenta una distribución normal dentro de cada nivel de acidez (Ácido y Muy ácido), se aplicó la prueba de Shapiro-Wilk a cada grupo por separado. Los resultados fueron los siguientes:

Para el grupo Ácido, se obtuvo W = 0.95802 con un valor p < 2.2e-16.

Para el grupo Muy ácido, se obtuvo W = 0.43265 con un valor p < 2.2e-16.

En ambos casos, el valor p es menor al nivel de significancia de 0.05, lo que indica que se rechaza la hipótesis nula de normalidad. Por lo tanto, se concluye que el contenido de alcohol no sigue una distribución normal en ninguno de los dos grupos.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  2.5605 0.1096
      5710               

Se aplicó la prueba de Levene con centro en la mediana para evaluar si las varianzas del contenido de alcohol eran homogéneas entre los grupos con acidez categorizada como “Ácido” y “Muy ácido”. El resultado obtenido fue F(1, 5710) = 2.56, con un valor p = 0.1096. Dado que este valor es superior al nivel de significancia habitual de 0.05, no se rechaza la hipótesis nula de igualdad de varianzas. Por lo tanto, se puede suponer que las varianzas de los dos grupos son homogéneas, lo cual permite utilizar pruebas paramétricas que asumen igualdad de varianzas, como la prueba t para muestras independientes.


    Welch Two Sample t-test

data:  alcohol by acidez
t = 5.4132, df = 5458.2, p-value = 6.454e-08
alternative hypothesis: true difference in means between group Ácido and group Muy ácido is not equal to 0
95 percent confidence interval:
 0.1428806 0.3051256
sample estimates:
    mean in group Ácido mean in group Muy ácido 
               10.60566                10.38166 

De los resultados obtenidos por R Studio tenemos:

Se analizó si existía una diferencia estadísticamente significativa en el contenido promedio de alcohol entre los vinos clasificados con niveles de acidez Ácido y Muy ácido. Para ello, se filtraron las muestras correspondientes (n = 2483 para Ácido y n = 3230 para Muy ácido).

Previamente, se aplicaron pruebas de normalidad (Shapiro-Wilk), las cuales indicaron que los datos no siguen una distribución normal (p < 0.001 en ambos grupos). Sin embargo, dado el tamaño grande de las muestras, se aplicó el teorema central del límite. Asimismo, la prueba de igualdad de varianzas de Levene (p = 0.1096) sugirió homogeneidad, permitiendo el uso de una prueba t.

Se empleó una prueba t de Welch para comparar las medias, encontrándose una diferencia significativa ¨(t = 5.41, p < 0.001). El contenido promedio de alcohol fue de 10.61% en los vinos Ácidos y 10.38% en los Muy ácidos. El intervalo de confianza del 95% para la diferencia de medias fue de [0.14, 0.31], lo cual no incluye el cero. En consecuencia, se concluye que los vinos con acidez Ácida presentan, en promedio, un contenido de alcohol significativamente mayor que los vinos Muy Ácidos.

2. ¿Las muestras con mayor nivel de acidez categórica presentan menor pH promedio?

Antes de aplicar una prueba de hipótesis para determinar si las muestras con mayor nivel de acidez categórica presentan un pH promedio menor, es necesario verificar si los datos de pH en ambos grupos siguen una distribución normal, requisito fundamental para aplicar pruebas paramétricas como la t de Student.


    Shapiro-Wilk normality test

data:  alcohol_acido
W = 0.94706, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  alcohol_muy_acido
W = 0.9329, p-value < 2.2e-16

En primer lugar, se aplicó la prueba de normalidad de Shapiro-Wilk de manera independiente para cada grupo. Para las muestras con acidez Ácida se obtuvo W = 0.94706, y para las muestras con acidez Muy Ácida W = 0.9329, ambos con un p-valor < 2.2e-. Dado que en ambos casos el valor p fue menor al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad, concluyéndose que los datos de pH no siguen una distribución normal en ninguno de los dos grupos.

Levene's Test for Homogeneity of Variance (center = median)
        Df F value    Pr(>F)    
group    1  239.88 < 2.2e-16 ***
      5711                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Posteriormente, se evaluó la igualdad de varianzas mediante la prueba de Levene, obteniéndose un estadístico F = 239.88 con un p-valor < 2.2e-16. Este resultado indica que existen diferencias estadísticamente significativas entre las varianzas de los dos grupos, por lo que no se cumple el supuesto de homogeneidad de varianzas.

En consecuencia, al no cumplirse los supuestos de normalidad ni de igualdad de varianzas, se determinó que la prueba adecuada para comparar los promedios de pH entre los niveles de acidez es una prueba no paramétrica de Wilcoxon (rango con corrección de continuidad).


    Welch Two Sample t-test

data:  ph_acido and ph_muy_acido
t = 109.67, df = 5612.9, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.2003667 0.2076604
sample estimates:
mean of x mean of y 
 3.294704  3.090690 

A pesar de que los datos de pH no cumplen con el supuesto de normalidad ni de igualdad de varianzas, se realizó la prueba t de Student con la opción var.equal = FALSE, que se ajusta a la situación de varianzas desiguales. Esta prueba se aplicó para efectos comparativos y con fines académicos. Los resultados obtenidos deben interpretarse con precaución, pero pueden servir de referencia al contrastar con los resultados de la prueba no paramétrica de Wilcoxon.

La prueba t de Welch arrojó un estadístico t = 109.67 con un p-valor menor a 2.2e-16, lo cual indica que existe una diferencia estadísticamente significativa en los valores promedio de pH entre los vinos clasificados como “Ácido” y “Muy ácido”. El intervalo de confianza del 95% para la diferencia de medias fue de 0.200 a 0.208. Las medias observadas fueron 3.295 para los vinos ácidos y 3.091 para los muy ácidos.

En este caso se utilizó la prueba de Wilcoxon (también conocida como Mann-Whitney) para comparar las distribuciones de pH entre los dos niveles de acidez.


    Wilcoxon rank sum test with continuity correction

data:  ph_acido and ph_muy_acido
W = 8020090, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

El resultado de la prueba fue W = 8,020,090, con un valor p < 2.2e-16. Este valor es significativamente menor que el nivel de significancia convencional de 0.05, por lo que se rechaza la hipótesis nula de igualdad de medianas. Se concluye, por tanto, que existe una diferencia estadísticamente significativa en el pH entre los vinos Ácidos y Muy Ácidos.

Este resultado respalda la afirmación de que el nivel de acidez categórica se asocia con diferencias sistemáticas en el pH promedio, siendo el grupo Muy ácido caracterizado por valores de pH significativamente más bajos en comparación con el grupo Ácido.

En este caso, tanto la prueba t como la prueba de Wilcoxon apuntan a la misma conclusión: los vinos “Muy ácidos” presentan un pH promedio significativamente menor que los vinos “Ácidos”. Aunque la prueba de Wilcoxon se considera más adecuada debido a que no se cumplen los supuestos paramétricos, los resultados de la prueba t refuerzan esta conclusión.

3. ¿El nivel de azúcar residual es mayor en las muestras clasificadas como Muy ácidas frente a las Ácidas?


    Shapiro-Wilk normality test

data:  azucar_acido
W = 0.7454, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  azucar_muy_acido
W = 0.89705, p-value < 2.2e-16

Luego de aplicar la prueba de shapiro-wil, se encontro que ambos grupos no siguen una distribución normal. Ya que el p-valor de ambos niveles es mucho menor que 0.05.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  259.27 < 2.2e-16 ***
      5711                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con el fin de evaluar si se cumple el supuesto de homogeneidad de varianzas entre los grupos “Ácido” y “Muy ácido” respecto al contenido de azúcar residual, se aplicó la prueba de Levene considerando la mediana como medida central. El resultado obtenido fue un estadístico F=259.27 con un valor - p: < 2.2e-16, lo que indica una diferencia estadísticamente significativa entre las varianzas de los grupos.

Dado que se rechaza la hipótesis nula de igualdad de varianzas, se concluye que no se cumple el supuesto de homocedasticidad. Esto refuerza la decisión de emplear pruebas no paramétricas como la de Wilcoxon para comparar el azúcar residual entre los grupos. Si se desea aplicar una prueba t como complemento, debe utilizarse la versión de Welch, que no asume varianzas iguales.


    Wilcoxon rank sum test with continuity correction

data:  azucar_muy_acido and azucar_acido
W = 4839095, p-value < 2.2e-16
alternative hypothesis: true location shift is greater than 0

Se aplicó la prueba no paramétrica de Wilcoxon para evaluar si las muestras clasificadas como “Muy ácido” presentan mayor nivel de azúcar residual que las clasificadas como “Ácido”. Los resultados indicaron una diferencia estadísticamente significativa a favor del grupo “Muy ácido” (p < 0.001).

Adicionalmente, y teniendo en cuenta el gran tamaño muestral, se aplicó la prueba t de Student para dos muestras independientes como método complementario.


    Two Sample t-test

data:  azucar_muy_acido and azucar_acido
t = 15.733, df = 5711, p-value < 2.2e-16
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 1.79628     Inf
sample estimates:
mean of x mean of y 
 6.600418  4.594382 

    Welch Two Sample t-test

data:  azucar_muy_acido and azucar_acido
t = 16.093, df = 5666.7, p-value < 2.2e-16
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 1.800971      Inf
sample estimates:
mean of x mean of y 
 6.600418  4.594382 

Considerando que no se cumple la igualdad de varianzas, se utilizó la versión de Welch, obteniéndose un valor t = 16.09 con un valor p < 2.2e-16. El intervalo de confianza del 95% para la diferencia de medias fue [1.80, ∞), lo que confirma que el grupo “Muy ácido” presenta un nivel promedio de azúcar residual significativamente mayor que el grupo “Ácido”. Ambas pruebas coincidieron en indicar una diferencia significativa en el azúcar residual entre los grupos.

En conclusión, existe evidencia estadística suficiente para afirmar que los vinos clasificados como “Muy ácidos” tienen, en promedio, un mayor contenido de azúcar residual que los clasificados como “Ácidos”¨

4. ¿Existen diferencias en la acidez volátil promedio entre niveles de acidez (Ácido vs. Muy ácido)?


    Shapiro-Wilk normality test

data:  volatil_acido
W = 0.010901, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  volatil_muy_acido
W = 0.0086415, p-value < 2.2e-16

Para determinar si existen diferencias en la acidez volátil promedio entre los vinos clasificados como “Ácido” y “Muy ácido”, se evaluó primero el supuesto de normalidad para cada grupo mediante la prueba de Shapiro-Wilk.

Los resultado fuero: para el grupo Ácido, se obtuvo un estadístico W = 0.0109 con un valor p < 2.2e-16, y para el grupo Muy ácido, el estadístico fue W = 0.0086 con un valor p < 2.2e-16.

Dado que en ambos casos el valor p es significativamente menor que el nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad. Esto indica que la distribución de los datos en ambos grupos no es normal.

Por lo tanto, no es adecuado aplicar una prueba t de Student, ya que esta asume normalidad en los datos. En consecuencia, se procederá a utilizar una prueba no paramétrica que no dependa de este supuesto, como la prueba de Wilcoxon para muestras independientes.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.1079 0.7426
      5711               

Con el fin de evaluar si la varianza de la acidez volátil es homogénea entre los vinos clasificados como “Ácido” y “Muy ácido”, se aplicó la prueba de Levene con centro en la mediana, debido a que los datos no siguen una distribución normal.

El resultado fue un valor F = 0.1079 con un p-valor = 0.7426, el cual es considerablemente mayor que el nivel de significancia convencional de 0.05. Por lo tanto, no se rechaza la hipótesis nula de igualdad de varianzas. Esto indica que no existen diferencias estadísticamente significativas en la dispersión de la acidez volátil entre los dos grupos evaluados.


    Wilcoxon rank sum test with continuity correction

data:  volatil_muy_acido and volatil_acido
W = 3404788, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Dado que los datos de acidez volátil en los grupos “Ácido” y “Muy ácido” no siguen una distribución normal, y aunque la prueba de Levene indica igualdad de varianzas (p = 0.7426), lo que permitiría aplicar una prueba t bajo el supuesto de homogeneidad de varianzas, NO es recomendable aplicar una prueba t.

En este caso se aplicó la prueba no paramétrica de Wilcoxon para muestras independientes, con el fin de comparar la acidez volátil promedio entre ambos niveles de acidez categórica. El resultado de la prueba fue un estadístico ¨W = 3,404,788 con un valor p < 2.2e-16, lo cual indica una diferencia estadísticamente significativa entre los grupos. Al ser el valor p menor al nivel de significancia de 0.05, se rechaza la hipótesis nula de igualdad en las medianas y se concluye que existe una diferencia real en la acidez volátil entre ambos grupos.


    Welch Two Sample t-test

data:  volatil_acido and volatil_muy_acido
t = 0.33545, df = 4937.3, p-value = 0.7373
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.188086  1.678603
sample estimates:
mean of x mean of y 
1.1785421 0.9332833 

Aunque los datos no cumplieron con el supuesto de normalidad según la prueba de Shapiro-Wilk (p < 0.05), se aplicó de forma complementaria una prueba t de Student con corrección de Welch, la cual no asume igualdad de varianzas. Esta prueba arrojó un estadístico t = 0.335 con un valor p = 0.737, indicando que no se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula de igualdad de medias entre los grupos “Ácido” y “Muy ácido”.

En resumen, mientras que la prueba t no detectó diferencias significativas, la prueba de Wilcoxon sí encontró una diferencia significativa en la acidez volátil promedio entre los vinos clasificados como “Ácido” y “Muy ácido”. Esto refuerza la necesidad de emplear pruebas no paramétricas en situaciones donde los supuestos de normalidad no se cumplen.

5. ¿La densidad promedio cambia entre los niveles de acidez?


    Shapiro-Wilk normality test

data:  densidad_acido
W = 0.046158, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  densidad_muy_acido
W = 0.088926, p-value < 2.2e-16

Para determinar si la variable densidad presenta diferencias significativas entre los vinos clasificados como “Ácido” y “Muy ácido”, se evaluó inicialmente el supuesto de normalidad mediante la prueba de Shapiro-Wilk para cada grupo por separado.

Los resultados fueron los siguientes: Para el grupo “Ácido”: W = 0.046158, valor p < 2.2e-16 y Para el grupo “Muy ácido”: W = 0.088926, valor p < 2.2e-16.

En ambos casos, el valor p es significativamente menor al nivel de significancia de 0.05, lo que permite rechazar la hipótesis nula de normalidad. Por lo tanto, los datos de densidad no siguen una distribución normal en ninguno de los dos grupos, y no es adecuado utilizar pruebas paramétricas como la t de Student. En su lugar, se deben emplear métodos no paramétricos.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  13.207 0.0002813 ***
      5711                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se evaluó el supuesto de igualdad de varianzas mediante la prueba de Levene. El resultado fue un estadístico F = 13.207 con un p-valor = 0.00028, lo que indica una diferencia significativa en las varianzas entre los grupos. Es decir, no se cumple el supuesto de homogeneidad de varianzas.


    Wilcoxon rank sum test with continuity correction

data:  densidad_muy_acido and densidad_acido
W = 4076454, p-value = 0.2825
alternative hypothesis: true location shift is not equal to 0

Se optó por aplicar la prueba no paramétrica de Wilcoxon para muestras independientes.

El resultado de la prueba fue un estadístico ¨W = 4,076,454, con un valor p = 0.2825, el cual es mayor al nivel de significancia convencional de 0.05. Este resultado indica que no hay evidencia estadística suficiente para rechazar la hipótesis nula, por lo tanto, no se observa una diferencia significativa en la densidad promedio entre los vinos “Ácido” y “Muy ácido”.

En consecuencia, se concluye que la densidad promedio no varía de manera significativa entre estos dos niveles de acidez categórica.


    Welch Two Sample t-test

data:  densidad_acido and densidad_muy_acido
t = -3.9475, df = 4861.8, p-value = 8.008e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1162.6221  -391.0327
sample estimates:
mean of x mean of y 
 353.9889 1130.8163 

Se aplicó la prueba t de Welch, que no asume igualdad de varianzas, para comparar las medias de densidad entre los vinos clasificados como “Ácido” y “Muy ácido”.El resultado arrojó un estadístico t = -3.9475 con gl = 4861.8 y un valor p = 8.008e-05, que es menor al nivel de significancia de 0.05. Esto indica que existe una diferencia estadísticamente significativa en la densidad promedio entre los dos grupos de vinos.El intervalo de confianza del 95% para la diferencia de medias fue de [-1162.62, -391.03], lo que sugiere que, en promedio, los vinos “Muy ácidos” tienen una densidad significativamente mayor que los vinos “Ácidos”.

En conclusión, mientras que la prueba t de Welch indicó una diferencia estadísticamente significativa en la densidad promedio entre los vinos clasificados como “Ácido” y “Muy ácido”, la prueba no paramétrica de Wilcoxon no detectó una diferencia significativa entre ambos grupos. Esta discrepancia resalta la importancia de considerar los supuestos de normalidad y homogeneidad de varianzas al seleccionar el tipo de prueba estadística.

6. Elabora un gráfico de cajas y bigotes del nivel de pH para vinos clasificados como ácido y Muy acido. (Interpretelo)

La mediana del pH en los vinos clasificados como “Muy ácidos” fue 3.07, inferior a la observada en los vinos “Ácidos”, cuya mediana fue de 3.22. Esta diferencia es coherente con la clasificación sensorial, ya que un mayor nivel de acidez percibida suele corresponder con valores de pH más bajos.

El rango intercuartílico fue ligeramente mayor en el grupo “Muy ácido”, lo que indica una mayor variabilidad en los niveles de pH dentro de este grupo. Asimismo, se identificaron valores atípicos hacia la parte inferior del rango (< 2.85), posiblemente asociados a formulaciones particulares o procesos de fermentación más agresivos.

En contraste, el grupo “Ácido” presentó una distribución del pH más concentrada y simétrica, lo cual sugiere mayor homogeneidad en las muestras evaluadas dentro de ese nivel.

El grupo “Ácido” presenta una distribución más concentrada y simétrica.

El gráfico de cajas evidencia que los vinos clasificados como “Muy ácidos” presentan un pH significativamente más bajo y más disperso que los vinos “Ácidos”. Esta diferencia visual respalda estadísticamente lo obtenido en las pruebas de hipótesis, confirmando que existe una relación entre la percepción sensorial de acidez y el nivel químico real del pH.

7. ¿La concentración de ácido cítrico promedio difiere entre muestras con acidez Ácida y Muy ácida?


    Shapiro-Wilk normality test

data:  citricos_acido
W = 0.95073, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  citricos_muy_acido
W = 0.95424, p-value < 2.2e-16

Antes de comparar la concentración promedio de ácido cítrico entre los vinos clasificados como “Ácidos” y “Muy ácidos”, se evaluó el supuesto de normalidad mediante la prueba de Shapiro-Wilk, aplicada de forma independiente a cada grupo.

Para el grupo “Ácido”, se obtuvo un estadístico W = 0.95073 con un valor p < 2.2e-16. Para el grupo “Muy ácido”, el resultado fue W = 0.95424, también con un valor p < 2.2e-16.

Dado que en ambos casos los valores p son significativamente menores que 0.05, se rechaza la hipótesis nula de normalidad. Esto indica que la variable ácido cítrico no presenta una distribución normal en ninguno de los dos grupos. En consecuencia, no es apropiado aplicar pruebas paramétricas como la prueba t de Student, y se recomienda utilizar una prueba no paramétrica para comparar las medias.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.0598 0.8069
      5711               

Se evaluó el supuesto de homogeneidad de varianzas en la concentración de ácido cítrico entre los grupos con acidez “Ácido” y “Muy ácido” mediante la prueba de Levene, utilizando la mediana como centro. El resultado obtenido F = 0.0598, p = 0.8069 no fue estadísticamente significativo al nivel de significancia del 5%. Esto indica que **no hay evidencia suficiente para rechazar la hipótesis nula de igualdad de *varianzas.**

En consecuencia, se asume que las varianzas entre los grupos son homogéneas, lo que permitiría aplicar una prueba t de Student, aunque previamente se ha identificado que los datos no siguen una distribución normal Shapiro-Wilk, p < 0.001 en ambos grupos). Por lo tanto, la prueba t no es apropiada en este caso, y se recomienda una prueba no paramétrica como la de Wilcoxon.


    Wilcoxon rank sum test with continuity correction

data:  citricos_muy_acido and citricos_acido
W = 4852792, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Se analizó si la concentración promedio de ácido cítrico difiere significativamente entre los vinos clasificados como “Ácido” y “Muy ácido”. Dado que la prueba de normalidad de Shapiro-Wilk indicó que los datos no siguen una distribución normal en ninguno de los dos grupos (p < 0.001), y a pesar de que la prueba de Levene no mostró evidencia de diferencia en las varianzas (p = 0.8069), se optó por una prueba no paramétrica de Wilcoxon para muestras independientes.

El resultado de esta prueba arrojó un estadístico W = 4,852,792 con un valor p < 2.2e-16, lo cual indica una diferencia estadísticamente significativa en los niveles de ácido cítrico entre los dos grupos.

Por lo tanto, se concluye que existe evidencia estadística suficiente para afirmar que los vinos “Muy ácidos” presentan una concentración de ácido cítrico significativamente diferente (mayor o menor) en comparación con los vinos “Ácidos”.


    Welch Two Sample t-test

data:  citricos_muy_acido and citricos_acido
t = 15.692, df = 5233.5, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.05009674 0.06440056
sample estimates:
mean of x mean of y 
0.3567090 0.2994603 

La prueba t de Welch se aplicó para comparar la concentración promedio de ácido cítrico entre los vinos clasificados como “Muy ácido” y “Ácido”, con fines comparativos y académicos, dado que no se cumplía el supuesto de normalidad.

El resultado de esta prueba arrojó un estadístico t = 15.692, con gl = 5233.5 y un ¨valor p < 2.2e-16, lo cual indica una diferencia estadísticamente significativa entre las medias de ácido cítrico de los dos grupos. Además, el intervalo de confianza al 95% para la diferencia de medias está entre 0.0501 y 0.0644, lo que reafirma que existe una diferencia positiva en las medias de los grupos.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon detectaron una diferencia estadísticamente significativa en la concentración promedio de ácido cítrico entre los vinos clasificados como “Ácido” y “Muy ácido”.No obstante, debido a que los datos no cumplen el supuesto de normalidad, se considera que la prueba de Wilcoxon es la más apropiada para este análisis.

8. ¿Las muestras con mayor contenido de alcohol presentan menor acidez fija en promedio?


 Alto  Bajo Medio 
  777  2576  2360 

El conjunto de datos contiene 777 vinos con alto contenido de alcohol, 2,576 vinos con bajo contenido de alcohol y 2,360 vinos con contenido medio. Para esta comparación, únicamente se analizaron los grupos de alto y bajo contenido de alcohol, a fin de contrastar extremos y observar si existen diferencias significativas en la acidez fija promedio.


    Shapiro-Wilk normality test

data:  acidez_bajo
W = 0.87193, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  acidez_alto
W = 0.85539, p-value < 2.2e-16

Se evaluó la normalidad de la variable “acidez fija” en ambos grupos mediante la prueba de Shapiro-Wilk. Para el grupo de contenido bajo de alcohol, se obtuvo un estadístico W = 0.87193 con un valor p < 2.2e-16. En el grupo de contenido alto de alcohol, se obtuvo W = 0.85539, también con un valor p < 2.2e-16.

En ambos casos, los valores p fueron inferiores al nivel de significancia de 0.05, por lo tanto, se rechaza la hipótesis de normalidad. Esto indica que los datos no presentan una distribución normal.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.0253 0.8737
      3708               

Se verificó el cumplimiento del supuesto de homogeneidad de varianzas mediante la prueba de Levene, utilizando la mediana como centro de comparación.

El resultado fue F = 0.0253 con un valor p de 0.8737, el cual es mayor al nivel de significancia de 0.05. Por lo tanto, no se rechaza la hipótesis nula de igualdad de varianzas, lo que indica que las varianzas de acidez fija son homogéneas entre ambos grupos.

Se optó por aplicar la prueba no paramétrica de Wilcoxon para muestras independientes. Esta prueba es apropiada cuando no se cumple el supuesto de normalidad, incluso si las varianzas son homogéneas, como se verificó previamente mediante la prueba de Levene (p = 0.8737).


    Wilcoxon rank sum test with continuity correction

data:  acidez_alto and acidez_bajo
W = 772908, p-value < 2.2e-16
alternative hypothesis: true location shift is less than 0

El resultado de la prueba fue un estadístico W = 772,908, con un valor p < 2.2e-16. Este valor es significativamente menor que el nivel de significancia de 0.05, por lo que se rechaza la hipótesis nula de igualdad en las medianas. La hipótesis alternativa planteada fue que la acidez fija en el grupo de vinos con alto contenido de alcohol es menor, y el resultado apoya dicha afirmación.

En conclusión, existe evidencia estadística suficiente para afirmar que los vinos con mayor contenido de alcohol presentan, en promedio, una menor acidez fija que los vinos con bajo contenido de alcohol.


    Welch Two Sample t-test

data:  acidez_alto and acidez_bajo
t = -8.1779, df = 1319.6, p-value = 6.718e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.4972411 -0.3048349
sample estimates:
mean of x mean of y 
 6.929086  7.330124 

La prueba t de Welch, aplicada con fines comparativos y académicos, arrojó un estadístico t = -8.18 con gl = 1319.6 y un valor p = 6.718e-16, menor al nivel de significancia convencional de 0.05. Esto indica que existe una diferencia estadísticamente significativa en la acidez fija promedio entre los vinos con alto y bajo contenido de alcohol.El intervalo de confianza del 95% para la diferencia de medias fue [-0.497, -0.305], lo cual sugiere que, en promedio, los vinos con alto contenido de alcohol presentan menor acidez fija que aquellos con bajo contenido de alcohol.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon coincidieron en detectar una diferencia estadísticamente significativa en la acidez fija promedio entre los vinos clasificados por su contenido de alcohol. Específicamente, los vinos con alto contenido de alcohol presentan menor acidez fija. Esta concordancia refuerza la validez del resultado, aunque es importante destacar que la prueba t se aplicó únicamente con fines académicos, ya que los datos no cumplían el supuesto de normalidad.

9. ¿El contenido de sulfatos difiere entre niveles de acidez?


    Shapiro-Wilk normality test

data:  sulfatos_acido
W = 0.94896, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  sulfatos_muy_acido
W = 0.82061, p-value < 2.2e-16

Para determinar si el contenido de sulfatos difiere significativamente entre los niveles de acidez categórica (“Ácido” y “Muy ácido”), se realizó inicialmente una evaluación de los supuestos de normalidad de los datos, mediante la prueba de Shapiro-Wilk, aplicada por separado a cada grupo.

En el grupo “Ácido”, se obtuvo un estadístico W = 0.94896 con un valor p < 2.2e-16, mientras que en el grupo “Muy ácido” el estadístico fue W = 0.82061, también con un valor p < 2.2e-16.

Dado que en ambos casos el valor- p fue significativamente menor que 0.05, se rechaza la hipótesis nula de normalidad para ambas distribuciones. Esto indica que los datos de contenido de sulfatos no siguen una distribución normal, lo cual descarta la posibilidad de utilizar pruebas paramétricas como la t de Student para la comparación de medias. Por esta razón, se opta por aplicar una prueba no paramétrica, adecuada para este tipo de datos.


    Wilcoxon rank sum test with continuity correction

data:  sulfatos_muy_acido and sulfatos_acido
W = 3172084, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Dado que los datos no cumplían con el supuesto de normalidad en ninguno de los grupos analizados, se procedió a utilizar la prueba no paramétrica de Wilcoxon para muestras independientes, con el fin de comparar el contenido de sulfatos entre los vinos clasificados como “Ácidos” y “Muy ácidos”.

El resultado de la prueba arrojó un estadístico W = 3,172,084 y un valor p < 2.2e-16. Este valor p, considerablemente inferior al nivel de significancia convencional de 0.05, indica que existe una diferencia estadísticamente significativa en el contenido de sulfatos entre los grupos evaluados.

En consecuencia, se rechaza la hipótesis nula de igualdad en las medianas, y se concluye que los niveles de acidez categórica están asociados con diferencias en el contenido de sulfatos en los vinos.


    Welch Two Sample t-test

data:  sulfatos_muy_acido and sulfatos_acido
t = -10.826, df = 5501.6, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.05020877 -0.03481286
sample estimates:
mean of x mean of y 
0.5055480 0.5480588 

El resultado de la prueba t de Welch arrojó un valor t = -10.826 con un valor p < 2.2e-16. Este valor p, al ser significativamente menor que el nivel de significancia de 0.05, indica que existe una diferencia estadísticamente significativa en el contenido promedio de sulfatos entre los vinos clasificados como “Ácido” y “Muy ácido”. El intervalo de confianza del 95% para la diferencia de medias se encuentra entre -0.0502 y -0.0348, lo cual refuerza esta diferencia: los vinos “Muy ácidos” presentan, en promedio, un contenido menor de sulfatos en comparación con los vinos “Ácidos”.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon coincidieron en detectar una diferencia estadísticamente significativa en el contenido promedio de sulfatos entre los vinos “Ácido” y “Muy ácido”. Esta coincidencia otorga mayor solidez a la conclusión, aunque la elección correcta es utilizar la prueba no paramétrica, debido a que los datos no seguían una distribución normal.

10. ¿El pH promedio de las muestras con acidez Muy ácida es diferente al de las Ácidas?


    Shapiro-Wilk normality test

data:  ph_acido
W = 0.94706, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  ph_muy_acido
W = 0.9329, p-value < 2.2e-16

Con el objetivo de determinar si el pH promedio difiere entre las muestras clasificadas como “Ácidas” y “Muy ácidas”, se evaluó inicialmente el cumplimiento del supuesto de normalidad en cada uno de los grupos mediante +*la prueba de Shapiro-Wilk**.

Para los vinos clasificados como “Ácidos”, se obtuvo un estadístico W = 0.94706 con un valor p < 2.2e-16. Para el grupo “Muy ácido”, se obtuvo W = 0.9329 y también un valor p < 2.2e-16.

Dado que en ambos casos el valor p fue significativamente inferior al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad, lo cual sugiere que los datos no siguen una distribución normal. Por lo tanto, no es apropiado aplicar pruebas paramétricas como la t de Student¨, y se justifica el uso de una prueba no paramétrica, como la prueba de Wilcoxon para muestras independientes, para comparar los niveles de pH entre los dos grupos.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  239.88 < 2.2e-16 ***
      5711                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con el propósito de determinar si se cumplen los supuestos necesarios para aplicar pruebas paramétricas, se evaluó la homogeneidad de varianzas del pH entre los vinos clasificados como “Ácido” y “Muy ácido”. Para ello, se aplicó la prueba de Levene utilizando la mediana como centro de agrupación, dado que los datos no siguen una distribución normal.

El resultado de la prueba fue F = 239.88 con un valor p < 2.2e-16, lo cual indica una diferencia estadísticamente significativa en las varianzas del pH entre ambos grupos. Por lo tanto, no se cumple el supuesto de igualdad de varianzas, lo cual, junto con la no normalidad previamente establecida, descarta la aplicación de una prueba t de Student, y justifica el uso de una prueba no paramétrica como la de Wilcoxon para comparar las medianas.


    Wilcoxon rank sum test with continuity correction

data:  ph_muy_acido and ph_acido
W = 0, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Debido a que las pruebas de normalidad (Shapiro-Wilk) indicaron que los datos de pH no siguen una distribución normal en ninguno de los grupos, y que la prueba de Levene arrojó una diferencia significativa en las varianzas (p < 0.001), se optó por aplicar una prueba no paramétrica de Wilcoxon para muestras independientes.

Esta prueba permite comparar la ubicación central (mediana) entre dos grupos sin requerir supuestos de normalidad ni igualdad de varianzas. Los resultados obtenidos fueron estadistico W = 0 y valor - p < 2.2e-16.

Este valor p es significativamente menor que 0.05, lo que lleva a rechazar la hipótesis nula de igualdad de medianas. Por lo tanto, se concluye que existe una diferencia estadísticamente significativa en los valores de pH entre los vinos clasificados como “Ácido” y “Muy ácido”. Esto respalda la hipótesis de que el nivel de acidez categórica está efectivamente asociado a diferencias en el pH químico medido en laboratorio.


    Welch Two Sample t-test

data:  ph_acido and ph_muy_acido
t = 109.67, df = 5612.9, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.2003667 0.2076604
sample estimates:
mean of x mean of y 
 3.294704  3.090690 

El resultado de la prueba t de Welch arrojó un valor t = 109.67 con un valor p < 2.2e-16. Este valor p, al ser significativamente menor que el nivel de significancia de 0.05, indica que existe una diferencia estadísticamente significativa en el pH promedio entre los vinos clasificados como “Ácidos” y “Muy ácidos”. El intervalo de confianza del 95% para la diferencia de medias se encuentra entre 0.2004 y 0.2077, lo cual refuerza esta diferencia: los vinos “Muy ácidos” presentan, en promedio, un pH menor en comparación con los vinos “Ácidos”.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon detectaron una diferencia estadísticamente significativa en el pH promedio entre los vinos clasificados como “Ácidos” y “Muy ácidos”. Aunque la prueba t indicó una diferencia clara, esta se utilizó solo con fines comparativos, debido al incumplimiento de los supuestos estadísticos.

Variable 2: Contenido de Alcohol (Bajo, Medio, Alto)

1. ¿El puntaje sensorial promedio varía entre los vinos con bajo y alto contenido de alcohol?


    Shapiro-Wilk normality test

data:  bajo
W = 0.80936, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  alto
W = 0.84647, p-value < 2.2e-16

Antes de comparar los puntajes sensoriales entre vinos con bajo y alto contenido de alcohol, se evaluó si los datos seguían una distribución normal, requisito fundamental para aplicar pruebas paramétricas como la prueba t de Student. Para ello, se aplicó la prueba de normalidad de Shapiro-Wilk de forma separada para cada grupo.

En el grupo de vinos con bajo contenido de alcohol, se obtuvo un estadístico W = 0.80936 con un valor p < 2.2e-16, mientras que en el grupo con alto contenido de alcohol, el resultado fue W = 0.84647 con un p < 2.2e-16.

Dado que en ambos casos el valor p es mucho menor que el nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad. Por lo tanto, se concluye que los puntajes sensoriales en ambos grupos no siguen una distribución normal, lo que sugiere que se debe aplicar una prueba no paramétrica para comparar estos grupos de forma adecuada.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  18.573 1.682e-05 ***
      3351                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Antes de aplicar una prueba de hipótesis sobre la diferencia en el puntaje sensorial promedio entre vinos con bajo y alto contenido de alcohol, se evaluó el supuesto de igualdad de varianzas mediante la prueba de Levene.

El resultado fue F = 18.573 con un valor p = 1.682e-05, lo cual es significativamente menor que el nivel de significancia habitual de 0.05. Este resultado indica que se rechaza la hipótesis nula de igualdad de varianzas, por lo tanto, no se cumple el supuesto de homogeneidad de varianzas entre los grupos. En consecuencia, si se decidiera aplicar una prueba t, se recomienda utilizar la versión que no asume varianzas iguales (prueba t de Welch). Sin embargo, dado que también se ha observado previamente que los datos no siguen una distribución normal, lo más adecuado es utilizar una prueba no paramétrica como la de Wilcoxon para comparar las medianas entre los grupos.


    Wilcoxon rank sum test with continuity correction

data:  alto and bajo
W = 1677075, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

El resultado del test de Wilcoxon fue W = 1,677,075 con un valor p < 2.2e-16, lo cual indica una diferencia estadísticamente significativa entre los puntajes sensoriales de ambos grupos. Al ser el valor p menor que el nivel de significancia de 0.05, se rechaza la hipótesis nula de igualdad de medianas.

Por tanto, se concluye que el nivel de alcohol en el vino está asociado con diferencias en el puntaje sensorial promedio, siendo este puntaje significativamente distinto entre los vinos con bajo y alto contenido de alcohol.


    Welch Two Sample t-test

data:  bajo and alto
t = -34.287, df = 1175.6, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.158272 -1.032889
sample estimates:
mean of x mean of y 
 5.460404  6.555985 

El resultado de la prueba t de Welch arrojó un valor t = -34.287 con un valor p < 2.2e-16. Este valor p, al ser significativamente menor que el nivel de significancia de 0.05, indica que existe una diferencia estadísticamente significativa en el puntaje sensorial promedio entre los vinos con bajo y alto contenido de alcohol. El intervalo de confianza del 95% para la diferencia de medias se encuentra entre -1.1583 y -1.0329, lo cual refuerza esta diferencia: los vinos con alto contenido de alcohol presentan, en promedio, un puntaje sensorial más alto en comparación con los vinos con bajo contenido de alcohol.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon detectaron una diferencia estadísticamente significativa en el puntaje sensorial promedio entre los vinos con bajo y alto contenido de alcohol. Aunque la prueba t de Welch indicó que los vinos con alto contenido de alcohol tienen, en promedio, un puntaje sensorial mayor, esta prueba se aplicó solo con fines comparativos y académicos, debido a que no se cumplieron los supuestos de normalidad y homogeneidad de varianzas.

2. ¿Las muestras con alto contenido de alcohol tienen menor acidez volátil en promedio que las de contenido bajo?


    Shapiro-Wilk normality test

data:  acidez_alto
W = 0.91834, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  acidez_bajo
W = 0.010547, p-value < 2.2e-16

Para evaluar si las muestras con alto contenido de alcohol presentan menor acidez volátil promedio que aquellas con bajo contenido de alcohol, se procedió inicialmente a verificar el supuesto de normalidad en la distribución de los datos.

Se aplicó la prueba de Shapiro-Wilk por separado a cada grupo. Para el grupo de alto contenido de alcohol se obtuvo un estadístico W = 0.91834 con un valor p < 2.2e-16, mientras que para el grupo de bajo contenido se obtuvo W = 0.010547, también con p < 2.2e-16.

Dado que en ambos casos el valor p fue menor al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad, lo que indica que los datos no se distribuyen normalmente en ninguno de los dos grupos. Por esta razón, no es recomendable aplicar una prueba t, y se requiere una prueba no paramétrica para comparar las medianas.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.6688 0.4135
      3351               

Antes de aplicar una prueba de hipótesis para comparar la acidez volátil promedio entre vinos con alto y bajo contenido de alcohol, se evaluó el supuesto de homogeneidad de varianzas mediante la prueba de Levene, centrada en la mediana.

El resultado obtenido fue un estadístico F = 0.6688 con un valor p = 0.4135. Dado que el valor p es mayor que el nivel de significancia de 0.05, no se rechaza la hipótesis nula de igualdad de varianzas, lo que indica que se cumple el supuesto de homogeneidad de varianzas entre los grupos comparados.


    Wilcoxon rank sum test with continuity correction

data:  acidez_alto and acidez_bajo
W = 1014023, p-value = 0.7124
alternative hypothesis: true location shift is less than 0

El resultado de la prueba fue un estadístico W = 1,014,023, con un valor p = 0.7124, el cual es mayor que el nivel de significancia de 0.05. Por lo tanto, no se rechaza la hipótesis nula, lo que indica que no existen diferencias estadísticamente significativas en la acidez volátil promedio entre los vinos con alto y bajo contenido de alcohol.

Con base en los resultados obtenidos, no se encontraron diferencias estadísticamente significativas en la acidez volátil promedio entre los vinos con alto y bajo contenido de alcohol. Aunque los vinos con diferente contenido alcohólico pueden presentar características sensoriales distintas, en este caso la acidez volátil no varía de forma significativa entre ambos grupos, lo cual sugiere que esta variable no está directamente asociada al nivel de alcohol en el vino.


    Two Sample t-test

data:  acidez_alto and acidez_bajo
t = -0.79885, df = 3351, p-value = 0.4244
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.812767  1.184235
sample estimates:
mean of x mean of y 
 0.326184  1.140450 

El resultado de la prueba t de Student arrojó un valor t = -0.7989 con un valor p = 0.4244. Este valor p es mayor que el nivel de significancia de 0.05, por lo tanto, no se puede afirmar que exista una diferencia estadísticamente significativa en la acidez volátil promedio entre los vinos con alto y bajo contenido de alcohol. El intervalo de confianza del 95% para la diferencia de medias se encuentra entre -2.8128 y 1.1842, lo cual incluye el valor 0, reforzando la falta de evidencia estadística de una diferencia real entre los grupos.

En resumen, ni la prueba t de Student ni la prueba no paramétrica de Wilcoxon detectaron diferencias estadísticamente significativas en la acidez volátil promedio entre los vinos con alto y bajo contenido de alcohol. A pesar de que se cumplió el supuesto de homogeneidad de varianzas, la falta de normalidad limita el uso válido de la prueba t, por lo que la prueba de Wilcoxon resulta más adecuada en este caso.

3. ¿El nivel de azúcar residual cambia significativamente según el contenido de alcohol?

data_filtrada$contenido.de.alcohol: Alto

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.82815, p-value < 2.2e-16

------------------------------------------------------------ 
data_filtrada$contenido.de.alcohol: Bajo

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.90775, p-value < 2.2e-16

------------------------------------------------------------ 
data_filtrada$contenido.de.alcohol: Medio

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.7619, p-value < 2.2e-16

Con el objetivo de determinar si el nivel de azúcar residual varía según el contenido de alcohol (clasificado como Bajo, Medio y Alto), se evaluó inicialmente el supuesto de normalidad en cada uno de los tres grupos mediante la prueba de Shapiro-Wilk.

Los resultados obtenidos fueron los siguientes: para el grupo Alto, W = 0.82815; para el grupo Bajo, W = 0.90775; y para el grupo Medio, W = 0.7619, con valores p menores a 0.001 en todos los casos.

Dado que en los tres grupos el valor p fue menor al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad. Esto indica que los datos no siguen una distribución normal en ninguno de los niveles de contenido de alcohol.

En consecuencia, no es apropiado aplicar una prueba ANOVA, que requiere que los datos de cada grupo se distribuyan normalmente. En su lugar, se recomienda aplicar una prueba no paramétrica como la de Kruskal-Wallis, que permite comparar las medianas entre más de dos grupos cuando no se cumple el supuesto de normalidad.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    2  378.09 < 2.2e-16 ***
      5710                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para verificar si se cumplía el supuesto de igualdad de varianzas entre los grupos definidos por el contenido de alcohol (Alto, Medio y Bajo), se aplicó la prueba de Levene centrada en la mediana.

El resultado fue F = 378.09 con un p-valor < 2.2e-16, lo cual indica que se rechaza la hipótesis nula de homogeneidad de varianzas. Por tanto, se concluye que las varianzas del nivel de azúcar residual no son iguales entre los tres grupos de contenido de alcohol.

Para evaluar si el nivel de azúcar residual difiere significativamente según el contenido de alcohol (Bajo, Medio y Alto), se aplicó la prueba de Kruskal-Wallis, ya que los datos no siguen una distribución normal y no presentan varianzas homogéneas, tal como se comprobó previamente con las pruebas de Shapiro-Wilk y Levene.


    Kruskal-Wallis rank sum test

data:  azúcar.residual by contenido.de.alcohol
Kruskal-Wallis chi-squared = 491.03, df = 2, p-value < 2.2e-16

El resultado fue un estadístico χ² = 491.03, con 2 grados de libertad y un p-valor < 2.2e-16. Este valor p es menor al nivel de significancia de 0.05, por lo tanto se rechaza la hipótesis nula, lo que indica que existen diferencias estadísticamente significativas en el azúcar residual entre al menos dos de los grupos según su contenido de alcohol.

En conclusión, se puede afirmar que el contenido de alcohol está asociado a diferencias en el nivel de azúcar residual de los vinos.


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  data_filtrada$azúcar.residual and data_filtrada$contenido.de.alcohol 

      Alto   Bajo  
Bajo  <2e-16 -     
Medio 1      <2e-16

P value adjustment method: bonferroni 

Se aplicó una comparación por pares mediante la prueba de Wilcoxon con corrección de Bonferroni, con el fin de identificar entre qué grupos de contenido de alcohol existen diferencias significativas en el nivel de azúcar residual.

Los resultados mostraron que, entre los grupos “Bajo” y “Alto” se encontró una diferencia estadísticamente significativa (p < 0.001); entre los grupos “Bajo” y “Medio” también se observó una diferencia significativa (p < 0.001) y entre los grupos “Alto” y “Medio”, no se encontró evidencia de una diferencia significativa (p = 1).

Por tanto, se concluye que el contenido de alcohol influye significativamente en el nivel de azúcar residual, especialmente al comparar los vinos con contenido bajo frente a los otros niveles. Sin embargo, no hay diferencia significativa entre los vinos con contenido medio y alto de alcohol respecto al azúcar residual.

                       Df Sum Sq Mean Sq F value Pr(>F)    
contenido.de.alcohol    2  14978    7489   353.4 <2e-16 ***
Residuals            5710 121006      21                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El resultado de la prueba ANOVA arrojó un valor F = 353.4 con un valor p < 2e-16. Este valor p, al ser considerablemente menor que el nivel de significancia de 0.05, indica que existe una diferencia estadísticamente significativa en el nivel promedio de azúcar residual entre los vinos clasificados según su contenido de alcohol (Bajo, Medio y Alto).Sin embargo, esta prueba se aplicó únicamente con fines comparativos y académicos, ya que los datos no cumplen con los supuestos de normalidad ni de homogeneidad de varianzas requeridos para aplicar ANOVA de forma válida.

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = azúcar.residual ~ contenido.de.alcohol, data = data_filtrada)

$contenido.de.alcohol
                 diff         lwr        upr     p adj
Bajo-Alto   3.6152029  3.17349560  4.0569102 0.0000000
Medio-Alto  0.5012712  0.05490433  0.9476381 0.0231025
Medio-Bajo -3.1139317 -3.42144210 -2.8064212 0.0000000

Posteriormente, la prueba post hoc de Tukey HSD permitió identificar entre qué grupos se presentan esas diferencias. Se encontraron diferencias estadísticamente significativas entre: Bajo y Alto (diferencia = 3.6152, p < 0.001); Medio y Alto (diferencia = 0.5013, p ≈ 0.023); Medio y Bajo (diferencia = -3.1139, p < 0.001)

Esto indica que el nivel promedio de azúcar residual varía de forma significativa entre los tres grupos.

Tanto la prueba ANOVA como la de Kruskal-Wallis detectaron diferencias estadísticamente significativas en el nivel de azúcar residual entre los vinos clasificados según su contenido de alcohol. No obstante, la prueba ANOVA se utilizó únicamente con fines comparativos y académicos, ya que los datos no cumplen con los supuestos de normalidad ni de homogeneidad de varianzas.

La prueba no paramétrica de Kruskal-Wallis, más adecuada para este contexto, confirmó estas diferencias, aunque el análisis post hoc mostró un patrón diferente: no se evidenció una diferencia significativa entre los grupos Medio y Alto, a diferencia de lo indicado por la prueba de Tukey.

Esta discrepancia entre los resultados de los métodos paramétricos y no paramétricos resalta la importancia de verificar los supuestos estadísticos antes de seleccionar la prueba adecuada. En este caso, la prueba de Kruskal-Wallis ofrece una conclusión más confiable: la diferencia en el nivel de azúcar residual es significativa principalmente entre el grupo Bajo y los otros dos niveles.

4. ¿Las muestras con alcohol alto presentan mayor calidad promedio (por ejemplo, más veces clasificadas como “Buena” o “Excelente”)?

       
        Mala Regular Buena Excelente
  Alto    10     372   392         3
  Bajo   107    2307   162         0
  Medio   85    1719   555         1

Para evaluar si existe una asociación entre el contenido de alcohol (clasificado como Bajo, Medio o Alto) y la calidad sensorial del vino (clasificada como Mala, Regular, Buena o Excelente), se construyó una tabla de contingencia con las frecuencias observadas para cada combinación de categorías.

       
            Mala   Regular    Buena Excelente
  Alto  27.47313  598.1526 150.8302 0.5440224
  Bajo  91.08209 1983.0646 500.0497 1.8036058
  Medio 83.44478 1816.7828 458.1201 1.6523718

Antes de aplicar una prueba de independencia para evaluar la relación entre el contenido de alcohol y la calidad categórica del vino, se verificó el cumplimiento de los supuestos necesarios para emplear la prueba de chi-cuadrado de Pearson. Para ello, se construyó una tabla de contingencia entre ambas variables y se calcularon las frecuencias esperadas en cada celda.

Se encontró que algunas celdas presentan frecuencias esperadas inferiores a 5, particularmente en la categoría “Excelente”, tanto para vinos con contenido de alcohol alto (0.54), bajo (1.80) y medio (1.65). Estos valores indican que no se cumple el supuesto de contar con frecuencias esperadas suficientemente altas en todas las celdas, lo cual podría comprometer la validez de los resultados de la prueba chi-cuadrado.

Por esta razón, se considera más apropiado aplicar la prueba exacta de Fisher, la cual no requiere el cumplimiento del supuesto de tamaño mínimo en las frecuencias esperadas y es especialmente útil en tablas con conteos bajos en algunas combinaciones de categorías.


    Fisher's Exact Test for Count Data with simulated p-value (based on
    10000 replicates)

data:  tabla
p-value = 9.999e-05
alternative hypothesis: two.sided

El resultado de la prueba exacta de Fisher, basada en 10.000 simulaciones, arrojó un valor p = 9.999 × 10⁻⁵, el cual es menor al nivel de significancia de 0.05. Esto indica que se rechaza la hipótesis nula de independencia entre las variables, concluyéndose que existe una asociación estadísticamente significativa entre el contenido de alcohol y la calidad categórica del vino.

Por lo tanto, se evidencia que las muestras con alto contenido de alcohol presentan, en promedio, mayor calidad sensorial. En particular, los vinos con mayor nivel de alcohol registraron una mayor proporción de clasificaciones “Buena” y “Excelente”, mientras que los vinos con menor contenido de alcohol se asociaron con más frecuencias en las categorías “Mala” y “Regular”. Esto sugiere que el contenido de alcohol podría estar relacionado positivamente con la percepción sensorial de calidad del vino.


    Pearson's Chi-squared test

data:  tabla
X-squared = 805.39, df = 6, p-value < 2.2e-16

La prueba de independencia de chi-cuadrado arrojó un estadístico X² = 805.39 con un valor p < 2.2e-16. Este valor p, al ser significativamente menor que el nivel de significancia de 0.05, indica que existe una asociación estadísticamente significativa entre el contenido de alcohol y la calidad sensorial del vino.

Sin embargo, el resultado vino acompañado de la advertencia “Chi-squared approximation may be incorrect”, lo que sugiere que no se cumplen los supuestos necesarios para aplicar esta prueba, ya que algunas celdas tienen frecuencias esperadas menores a 5. Por esta razón, este resultado debe interpretarse con cautela y únicamente con fines comparativos y académicos.

En resumen, mientras que la prueba chi-cuadrado detectó una asociación significativa entre el contenido de alcohol y la calidad sensorial del vino, la advertencia sobre el incumplimiento de los supuestos limita su validez. Por el contrario, la prueba exacta de Fisher, más robusta ante conteos bajos en las celdas, también evidenció una relación significativa entre estas variables. Esta coincidencia refuerza la conclusión de que los vinos con mayor contenido de alcohol tienden a recibir calificaciones sensoriales más altas.

5. ¿El pH promedio difiere entre los niveles de alcohol (medio y alto)?


    Shapiro-Wilk normality test

data:  ph_medio
W = 0.97633, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  ph_alto
W = 0.97709, p-value = 1.102e-09

Para evaluar si los niveles de pH presentan una distribución normal dentro de los grupos de vinos con contenido de alcohol “Medio” y “Alto”, se aplicó la prueba de normalidad de Shapiro-Wilk a cada grupo por separado.

En el grupo de vinos con alcohol Medio, se obtuvo un estadístico W = 0.97633 con un p-valor < 2.2e-16 y, en el grupo de vinos con alcohol Alto, se obtuvo W = 0.97709 y un p-valor = 1.102e-09.

Dado que en ambos casos el valor p es inferior al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad. Por tanto, se concluye que los datos de pH no se distribuyen normalmente en ninguno de los dos niveles de contenido de alcohol. Esto sugiere que no es apropiado utilizar pruebas paramétricas como la t de Student, y se debería emplear una prueba no paramétrica para comparar los promedios entre los grupos.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  1.9004 0.1681
      3135               

Con el objetivo de verificar si los niveles de alcohol “Medio” y “Alto” presentan varianzas iguales en la variable pH, se aplicó la prueba de Levene utilizando la mediana como medida de centralidad.

El resultado obtenido fue un estadístico F = 1.9004 con un p-valor = 0.1681. Dado que el p-valor es mayor que el nivel de significancia de 0.05, no se rechaza la hipótesis nula de igualdad de varianzas.

Por lo tanto, se asume que existe homogeneidad de varianzas entre los dos grupos. Sin embargo, dado que previamente se comprobó que los datos no siguen una distribución normal, no es recomendable aplicar pruebas paramétricas, incluso si se cumple el supuesto de igualdad de varianzas. En su lugar, se debe utilizar una prueba no paramétrica como la prueba de Wilcoxon para muestras independientes.


    Wilcoxon rank sum test with continuity correction

data:  ph_medio and ph_alto
W = 931062, p-value = 0.5165
alternative hypothesis: true location shift is not equal to 0

Se aplicó la prueba de Wilcoxon para muestras independientes, obteniéndose un estadístico W = 931062 y un p-valor = 0.5165. Este valor es considerablemente mayor al nivel de significancia del 5%, por lo cual no se rechaza la hipótesis nula de igualdad de medianas.

En conclusión, no se encontró evidencia estadísticamente significativa que indique una diferencia en el pH promedio entre los vinos con contenido de alcohol Medio y Alto. Esto sugiere que, al menos en este conjunto de datos, el nivel de alcohol no influye significativamente en el pH del vino.


    Welch Two Sample t-test

data:  ph_medio and ph_alto
t = 0.62295, df = 1365, p-value = 0.5334
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.006788888  0.013106887
sample estimates:
mean of x mean of y 
 3.191254  3.188095 

El resultado de la prueba t de Welch fue t = 0.62295 con un valor p = 0.5334. Este valor p es considerablemente mayor al nivel de significancia de 0.05, por lo que no se rechaza la hipótesis nula. Esto indica que no existe una diferencia estadísticamente significativa en el pH promedio entre los vinos con contenido de alcohol Medio y Alto. El intervalo de confianza del 95% para la diferencia de medias fue de [-0.0068, 0.0131], lo que refuerza esta conclusión: el pH promedio entre ambos grupos es muy similar.

En resumen, tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon coincidieron en no detectar una diferencia significativa en el pH promedio entre los vinos con contenido de alcohol medio y alto. Esta coincidencia entre ambas pruebas sugiere que, en este caso, los resultados son robustos y el nivel de alcohol no parece influir de manera significativa sobre el pH promedio del vino.

Variable 3: Calidad (Muy baja, Baja, Media, Buena, Excelente)

1. ¿El contenido promedio de alcohol varía según el nivel de calidad de las muestras?

data_filtrada$calidad.categórica: Mala

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.95527, p-value = 5.685e-06

------------------------------------------------------------ 
data_filtrada$calidad.categórica: Regular

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.44128, p-value < 2.2e-16

------------------------------------------------------------ 
data_filtrada$calidad.categórica: Buena

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.96963, p-value = 1.774e-14

------------------------------------------------------------ 
data_filtrada$calidad.categórica: Excelente

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.75788, p-value = 0.04564

Para determinar si el contenido de alcohol presenta una distribución normal en función del nivel de calidad sensorial del vino (Mala, Regular, Buena y Excelente), se aplicó la prueba de normalidad de Shapiro-Wilk a cada grupo por separado

Los resultados obtenidos fueron los siguientes: para el grupo Mala, se obtuvo un estadístico W = 0.95527 con un valor p = 5.685e-06, para el grupo Regular, se obtuvo W = 0.44128 con un valor p < 2.2e-16, para el grupo Buena, se obtuvo W = 0.96963 con un valor p = 1.774e-14 y para el grupo Excelente, el resultado fue W = 0.75788 con un valor p = 0.04564.

En todos los casos, los valores de p fueron inferiores a 0.05, lo que indica que se rechaza la hipótesis nula de normalidad. Por tanto, se concluye que la variable contenido de alcohol no sigue una distribución normal en ninguno de los grupos definidos por los niveles de calidad sensorial.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.7345 0.3916
      1111               

Con el fin de verificar si el supuesto de igualdad de varianzas se cumple para la variable contenido de alcohol entre los distintos niveles de calidad sensorial del vino, se aplicó la prueba de Levene utilizando la mediana como centro.

El resultado fue un estadístico F = 0.7345 con un p-valor = 0.3916. Dado que el valor de p es mayor que 0.05, no se rechaza la hipótesis nula de homogeneidad de varianzas. Por tanto, se asume que las varianzas entre los grupos de calidad son estadísticamente iguales.


    Kruskal-Wallis rank sum test

data:  alcohol by calidad.categórica
Kruskal-Wallis chi-squared = 1.6004, df = 1, p-value = 0.2059

Se evaluó si el contenido promedio de alcohol varía significativamente entre los niveles de calidad de los vinos, utilizando la prueba no paramétrica Kruskal-Wallis, debido a que los datos no cumplen con los supuestos de normalidad y homogeneidad de varianzas requeridos por ANOVA.

El resultado fue un estadístico chi-cuadrado = 1.60, con 1 grado de libertad y un valor p = 0.2059, el cual es mayor que el nivel de significancia usual de 0.05.

Por tanto, no se encontró evidencia estadística suficiente para afirmar que existen diferencias significativas en el contenido de alcohol entre los grupos de calidad evaluados. Se concluye que el nivel de calidad categórica no está asociado de manera significativa al contenido promedio de alcohol en este conjunto de muestras.

                     Df Sum Sq Mean Sq F value Pr(>F)    
calidad.categórica    3   1270   423.5   169.5 <2e-16 ***
Residuals          5708  14260     2.5                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
1 observation deleted due to missingness

La prueba ANOVA arrojó un estadístico F = 169.5 con un p-valor < 2e-16, lo que indica que existen diferencias estadísticamente significativas en el contenido promedio de alcohol entre al menos dos de los niveles de calidad sensorial del vino.

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = alcohol ~ calidad.categórica, data = data_filtrada)

$calidad.categórica
                       diff         lwr      upr     p adj
Regular-Mala      0.1465458 -0.14572748 0.438819 0.5703026
Buena-Mala        1.3254717  1.01475031 1.636193 0.0000000
Excelente-Mala    2.0175743 -0.03330094 4.068449 0.0557962
Buena-Regular     1.1789260  1.04244080 1.315411 0.0000000
Excelente-Regular 1.8710285 -0.16076125 3.902818 0.0837486
Excelente-Buena   0.6921025 -1.34242288 2.726628 0.8182419

La prueba post hoc de Tukey mostró diferencias estadísticamente significativas en el contenido promedio de alcohol entre los vinos clasificados como “Mala” y “Buena” (p < 0.001), así como entre “Regular” y “Buena” (p < 0.001). Sin embargo, no se observaron diferencias significativas entre los grupos “Mala” y “Regular” (p = 0.57), ni entre “Excelente” y los demás grupos, ya que todos los valores p asociados fueron mayores a 0.05.

Mientras que la prueba ANOVA indicó diferencias estadísticamente significativas en el contenido promedio de alcohol entre los niveles de calidad sensorial del vino (p < 2e-16), la prueba no paramétrica de Kruskal-Wallis no encontró evidencia suficiente para afirmar diferencias entre los grupos (p = 0.2059)¨. Esta discrepancia puede deberse a la falta de normalidad en los datos, ya que la ANOVA asume normalidad y homogeneidad de varianzas, mientras que Kruskal-Wallis es más robusta ante su incumplimiento.

Por tanto, aunque el resultado de ANOVA fue confirmado parcialmente por la prueba de Tukey, debe interpretarse con cautela, recordando que se aplicó con fines comparativos y que la conclusión definitiva dependerá de la validez de los supuestos estadísticos.

2. ¿Las muestras clasificadas como “Excelente” presentan menor acidez volátil en promedio que las de calidad “Baja” ?


    Shapiro-Wilk normality test

data:  excelente
W = 0.83525, p-value = 0.1819

    Shapiro-Wilk normality test

data:  baja
W = 0.044818, p-value < 2.2e-16
Levene's Test for Homogeneity of Variance (center = "median")
       Df F value Pr(>F)
group   1  0.0207 0.8856
      204               

    Wilcoxon rank sum test with continuity correction

data:  excelente and baja
W = 212, p-value = 0.05234
alternative hypothesis: true location shift is less than 0

Para evaluar si las muestras de vino clasificadas como “Excelente” presentan menor acidez volátil promedio que aquellas clasificadas como “Baja”, se realizaron varias pruebas estadísticas.

Primero, se evaluó el supuesto de normalidad mediante la prueba de Shapiro-Wilk. En el grupo “Excelente” se obtuvo un valor W = 0.83525 con p = 0.1819, lo que sugiere que los datos podrían seguir una distribución normal. Sin embargo, en el grupo “Baja” se obtuvo W = 0.04482 con p < 0.001, indicando que los datos no siguen una distribución normal.

Dado este resultado mixto y considerando el tamaño reducido de la muestra “Excelente”, se decidió no asumir normalidad y aplicar una prueba no paramétrica.

Posteriormente, se evaluó la homogeneidad de varianzas mediante la prueba de Levene, obteniendo F = 0.0207 y un valor p = 0.8856, lo que sugiere que las varianzas pueden considerarse homogéneas.

Finalmente, se aplicó una prueba de Wilcoxon para muestras independientes, con hipótesis alternativa unilateral (menor). El resultado fue un estadístico W = 212 con un valor p = 0.05234.

Este valor p se encuentra ligeramente por encima del umbral de significancia de 0.05, por lo que no se puede rechazar la hipótesis nula. En consecuencia, no hay evidencia estadísticamente suficiente para afirmar que las muestras clasificadas como “Excelente” presentan menor acidez volátil promedio que las de calidad “Baja”.


    Two Sample t-test

data:  excelente and baja
t = -0.14454, df = 204, p-value = 0.4426
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
     -Inf 53.41525
sample estimates:
mean of x mean of y 
 0.282500  5.402995 

La prueba t de Student aplicada con el objetivo de determinar si las muestras clasificadas como “Excelente” presentan menor acidez volátil promedio que las de calidad “Baja”, arrojó un estadístico t = -0.1445 con un valor p = 0.4426. Este valor p es considerablemente mayor al nivel de significancia habitual de 0.05, por lo que no se puede rechazar la hipótesis nula de igualdad de medias.

Además, el intervalo de confianza unidireccional al 95% para la diferencia de medias fue de (–∞, 53.42), lo que sugiere que no hay evidencia suficiente para afirmar que los vinos “Excelente” tienen menor acidez volátil promedio que los vinos “Baja”.

Mientras que la prueba t de Student arrojó un resultado no significativo,indicando que no hay diferencia estadísticamente significativa en la acidez volátil promedio entre los vinos clasificados como “Excelente” y los clasificados como “Baja”, la prueba no paramétrica de Wilcoxon también respaldó esta conclusión.

Esto sugiere que no existe evidencia estadística suficiente para afirmar que los vinos “Excelente” presentan una acidez volátil promedio menor que los vinos “Baja”.Ambas pruebas, pese a sus diferencias metodológicas, coinciden en la conclusión, aunque el p-valor de Wilcoxon se aproxima al nivel de corte, lo que refuerza la necesidad de interpretar los resultados con cautela, especialmente ante tamaños de muestra pequeños o datos con supuestos parcialmente incumplidos.

3. ¿El puntaje sensorial promedio aumenta conforme mejora la calidad de las muestras?

data_filtrada$calidad: Baja

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.90678, p-value < 2.2e-16

------------------------------------------------------------ 
data_filtrada$calidad: Buena

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.97603, p-value = 2.522e-11

------------------------------------------------------------ 
data_filtrada$calidad: Excelente

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.90636, p-value = 4.873e-09

------------------------------------------------------------ 
data_filtrada$calidad: Media

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.36854, p-value < 2.2e-16

------------------------------------------------------------ 
data_filtrada$calidad: Muy baja

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.95527, p-value = 5.685e-06

Se evaluó si el puntaje sensorial varía significativamente entre los distintos niveles de calidad categórica: Muy baja, Baja, Media, Buena y Excelente.

Primero, se aplicó la prueba de Shapiro-Wilk en cada grupo para comprobar el supuesto de normalidad. En todos los casos, se obtuvieron valores de p significativamente menores a 0.05, lo que indica que los datos no siguen una distribución normal en ninguno de los niveles de calidad.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value Pr(>F)
group    1  0.7179  0.397
      1111               

Para verificar el supuesto de igualdad de varianzas entre los distintos niveles de calidad, se aplicó la prueba de Levene, centrada en la mediana. El valor de F fue 0.7179 con un valor p = 0.397, mayor que el nivel de significancia convencional (α = 0.05). Esto sugiere que las varianzas de los grupos evaluados pueden considerarse homogéneas, es decir, no hay una diferencia significativa en la dispersión de los datos entre los grupos.Por lo tanto, se cumple el supuesto de homogeneidad de varianzas.


    Kruskal-Wallis rank sum test

data:  puntaje by calidad
Kruskal-Wallis chi-squared = 30.314, df = 1, p-value = 3.675e-08

Se aplicó la prueba de Kruskal-Wallis para determinar si existen diferencias significativas en el puntaje sensorial promedio entre los diferentes niveles de calidad categórica, dado que no se cumple con el supuesto de normalidad.

El resultado del análisis fue un estadístico H = 30.314 con 1 grados de libertad y un valor p < 0.001¨, lo que indica que existen diferencias estadísticamente significativas en el puntaje sensorial entre al menos dos niveles de calidad.

Este hallazgo sugiere que el puntaje sensorial tiende a aumentar a medida que mejora la calidad percibida de los vinos, lo cual es coherente con las expectativas sensoriales y de evaluación, y que existen diferencias estadísticamente significativas en el puntaje sensorial según la calidad categórica del vino.


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  df_calidad$puntaje and df_calidad$calidad 

          Buena  
Excelente 3.7e-08

P value adjustment method: bonferroni 

Para identificar entre qué grupos específicos de calidad existen diferencias significativas en el puntaje sensorial, se aplicó la prueba de Wilcoxon con corrección de Bonferroni para comparaciones múltiples. El análisis incluyó únicamente las muestras clasificadas como “Buena” y “Excelente”, dado que fueron las categorías disponibles con tamaño de muestra suficiente.

El resultado mostró un valor p = 3.7 × 10⁻⁸, lo que indica una diferencia estadísticamente significativa en el puntaje sensorial entre vinos de calidad “Buena” y “Excelente”.Esto permite concluir que los vinos clasificados como “Excelente” presentan un puntaje sensorial promedio significativamente mayor que aquellos clasificados como “Buena”, respaldando la validez de la escala de calidad empleada.

              Df Sum Sq Mean Sq F value Pr(>F)    
calidad        4   4255    1064  258278 <2e-16 ***
Residuals   5708     24       0                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se aplicó una ANOVA de una vía, la cual es una prueba paramétrica comúnmente utilizada para comparar medias entre más de dos grupos. El análisis arrojó un estadístico F de 258278 con un valor p menor a 2e-16, lo cual indica que se rechaza la hipótesis nula de igualdad de medias. En consecuencia, se concluye que existen diferencias estadísticamente significativas en el puntaje sensorial promedio entre al menos dos de los niveles de calidad evaluados.

Es importante mencionar que esta prueba se aplicó únicamente con fines comparativos y académicos, ya que los datos analizados no cumplen con el supuesto de normalidad.

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = puntaje ~ calidad, data = data_filtrada)

$calidad
                        diff        lwr        upr p adj
Buena-Baja          2.000000  1.9930136  2.0069864     0
Excelente-Baja      3.023121  3.0092125  3.0370303     0
Media-Baja          1.000000  0.9946674  1.0053326     0
Muy baja-Baja      -1.108911 -1.1218727 -1.0959491     0
Excelente-Buena     1.023121  1.0086335  1.0376093     0
Media-Buena        -1.000000 -1.0066991 -0.9933009     0
Muy baja-Buena     -3.108911 -3.1224921 -3.0953297     0
Media-Excelente    -2.023121 -2.0368882 -2.0093545     0
Muy baja-Excelente -4.132032 -4.1501733 -4.1138912     0
Muy baja-Media     -2.108911 -2.1217201 -2.0961017     0

Los resultados del test de Tukey mostraron diferencias estadísticamente significativas (p ajustado = 0) en todas las comparaciones por pares entre los niveles de calidad. Por ejemplo, el puntaje promedio de los vinos de calidad “Excelente” fue significativamente mayor al de los vinos de calidad “Buena” (diferencia = 1.02), “Media” (diferencia = 2.02), “Baja” (diferencia = 3.02), y especialmente “Muy baja” (diferencia = 4.13), todas con intervalos de confianza que no incluyen el cero. Asimismo, cada salto de un nivel de calidad a otro reflejó un cambio significativo en el puntaje sensorial promedio.

La prueba no paramétrica de Kruskal-Wallis evidenció una diferencia estadísticamente significativa en el puntaje sensorial entre los niveles de calidad de vino y las comparaciones múltiples con la prueba de Wilcoxon, ajustadas mediante el método de Bonferroni, confirmaron que estas diferencias se mantenían entre los pares de grupos evaluados, particularmente entre los vinos clasificados como “Buena” y “Excelente”. Esto sugiere que el puntaje sensorial aumenta significativamente con la calidad del vino.

Por otro lado, aunque la prueba ANOVA también arrojó resultados altamente significativos, su validez es cuestionable en este contexto debido al incumplimiento del supuesto de normalidad, tal como lo indicaron las pruebas de Shapiro-Wilk. La prueba post hoc paramétrica de Tukey HSD detectó diferencias significativas entre todos los niveles de calidad, reforzando el patrón general observado.

4. ¿El nivel de dióxido de azufre total es diferente entre los vinos de calidad baja y los de calidad excelente?

 [1] "acidez.fija"             "acidez.volátil"         
 [3] "X.ácido.cítrico"         "azúcar.residual"        
 [5] "cloruros"                "dióxido.de.azufre.libre"
 [7] "dióxido.de.azufre.total" "densidad"               
 [9] "pH"                      "acidez"                 
[11] "sulfatos"                "alcohol"                
[13] "contenido.de.alcohol"    "puntaje.sensorial"      
[15] "calidad"                 "tipo"                   
[17] "calidad.categórica"     
[1] 1895
[1] 173

    Shapiro-Wilk normality test

data:  so2_baja
W = 0.97861, p-value = 3.114e-16

    Shapiro-Wilk normality test

data:  so2_excelente
W = 0.96766, p-value = 0.0004715

Se aplicó la prueba de Shapiro-Wilk con el objetivo de evaluar si los datos de dióxido de azufre total seguían una distribución normal en cada grupo de calidad. Para los vinos de calidad baja, se obtuvo un valor de W = 0.97861 con un valor p < 0.001, mientras que para los vinos de calidad excelente, el resultado fue W = 0.96766 con p = 0.00047.

Dado que en ambos casos los valores p fueron menores al nivel de significancia de 0.05, se rechaza la hipótesis nula de normalidad, lo que indica que los datos no siguen una distribución normal en ninguno de los dos grupos.

Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  34.702 4.474e-09 ***
      2066                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con el propósito de verificar si los grupos presentan homogeneidad de varianzas, se llevó a cabo la prueba de Levene. El resultado mostró una F = 34.702 con un valor p < 0.001.

Al ser este valor p significativamente menor que 0.05, se rechaza la hipótesis nula de igualdad de varianzas, concluyéndose que existe evidencia de que las varianzas del dióxido de azufre total entre los vinos de calidad baja y excelente no son iguales.


    Wilcoxon rank sum test with continuity correction

data:  so2_baja and so2_excelente
W = 182797, p-value = 0.01204
alternative hypothesis: true location shift is not equal to 0

Debido a que no se cumplen los supuestos de normalidad ni de varianzas iguales, se optó por utilizar la prueba no paramétrica de Wilcoxon Rank Sum. El resultado de la prueba fue una estadística W = 182797 con un valor p = 0.01204.

Este valor p es menor al nivel de significancia del 5%, por lo que se rechaza la hipótesis nula que plantea igualdad en la ubicación central (mediana) de las distribuciones entre los grupos comparados.

A partir del conjunto de pruebas realizadas, se concluye que existen diferencias estadísticamente significativas en los niveles de dióxido de azufre total entre los vinos clasificados como de calidad baja y excelente.

Este hallazgo indica que el nivel de dióxido de azufre total —un conservante ampliamente utilizado en la industria vinícola— varía de manera significativa en función del nivel de calidad del vino. La diferencia observada puede estar asociada a prácticas de producción diferenciadas para vinos de mayor calidad, como un menor uso de aditivos o conservantes para preservar características sensoriales más delicadas.

En conclusión, se evidencia una relación estadísticamente significativa entre el nivel de calidad del vino y su contenido de dióxido de azufre total, lo que representa un factor relevante a considerar en procesos de mejora de calidad y evaluación enológica.


    Welch Two Sample t-test

data:  so2_baja and so2_excelente
t = 2.2761, df = 235.46, p-value = 0.02374
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  1.085719 15.066742
sample estimates:
mean of x mean of y 
 125.7583  117.6821 

Se aplicó la prueba t de Welch con el objetivo de comparar los niveles de dióxido de azufre total entre vinos de calidad baja y calidad excelente, sin asumir igualdad de varianzas.El valor t fue 2.2761 con 235.46 grados de libertad, el valor p obtenido fue 0.02374, el cual es menor que el umbral de significancia de 0.05. El intervalo de confianza del 95% para la diferencia de medias fue entre 1.086 y 15.067.

Dado que el valor p < 0.05, se rechaza la hipótesis nula de igualdad de medias. Esto indica que existe una diferencia estadísticamente significativa en los niveles de dióxido de azufre total entre los dos grupos de calidad.

Tanto la prueba t de Welch como la prueba no paramétrica de Wilcoxon detectaron una diferencia estadísticamente significativa en los niveles de dióxido de azufre total entre los vinos de calidad “baja” y “excelente”. Mientras que la prueba t de Welch encontró una diferencia significativa en las medias, la prueba de Wilcoxon confirmó esta diferencia desde un enfoque basado en rangos y medianas, lo cual es más robusto ante violaciones de normalidad y homogeneidad de varianzas.

5. ¿Las muestras con calidad “Muy baja” presentan mayor densidad en promedio que las de calidad “Excelente”?


    Shapiro-Wilk normality test

data:  densidad_muybaja
W = 0.055813, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  densidad_excelente
W = 0.074216, p-value < 2.2e-16
Levene's Test for Homogeneity of Variance (center = median)
       Df F value Pr(>F)
group   1  0.8656 0.3527
      442               

    Wilcoxon rank sum test with continuity correction

data:  densidad_muybaja and densidad_excelente
W = 36635, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Se aplicó la prueba de normalidad de Shapiro-Wilk a los datos de densidad de ambos grupos. Los resultados mostraron valores de p significativamente inferiores a 0.05 en ambos casos, lo que llevó al rechazo de la hipótesis nula de normalidad. Esto indica que los datos no siguen una distribución normal ni en el grupo de calidad “muy baja” ni en el de calidad “excelente”, lo cual limita la validez de pruebas paramétricas como la t de Student.

Se evaluó el cumplimiento del supuesto de homogeneidad de varianzas mediante la prueba de Levene. El valor p obtenido fue de 0.3527, mayor al nivel de significancia convencional (0.05), lo que sugiere que no existe evidencia suficiente para rechazar la hipótesis nula de igualdad de varianzas. Por tanto, se puede asumir que las varianzas de los dos grupos son homogéneas.

Dado que los datos no presentan una distribución normal, se optó por aplicar una prueba no paramétrica de Wilcoxon, la cual no requiere el cumplimiento del supuesto de normalidad. Los resultados arrojaron un valor - p menor a 2.2e-16, lo que indica una diferencia estadísticamente significativa en la localización (mediana) de la densidad entre los vinos de calidad “muy baja” y “excelente”. Esta diferencia sugiere que los niveles de densidad varían significativamente entre ambos grupos de calidad, y que esta conclusión es robusta incluso en ausencia de normalidad.


    Two Sample t-test

data:  densidad_muybaja and densidad_excelente
t = 0.9304, df = 442, p-value = 0.3527
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -480.1008 1343.3016
sample estimates:
mean of x mean of y 
 533.6535  102.0531 

Se aplicó una prueba t de Student para comparar las medias de densidad entre vinos de calidad “muy baja” y “excelente”, bajo el supuesto de igualdad de varianzas (validado por la prueba de Levene). EL estadístico t = 0.9304, con 442 grados de libertad. El Valor p = 0.3527, que es mayor que 0.05, por lo que no hay evidencia estadística suficiente para rechazar la hipótesis nula.El intervalo de confianza del 95% para la diferencia de medias fue de [-480.10, 1343.30], lo cual incluye el 0.

Mientras que la prueba t de Student no detectó una diferencia estadísticamente significativa en las medias de densidad entre vinos de calidad “muy baja” y “excelente”, la prueba no paramétrica de Wilcoxon sí encontró una diferencia significativa en la localización de los datos. Esta discrepancia resalta la importancia de evaluar los supuestos de normalidad antes de aplicar pruebas paramétricas. En este caso, la prueba de Wilcoxon, al no requerir dichos supuestos, proporciona una inferencia más confiable sobre la diferencia en densidad entre ambos grupos.

Variable 4: Tipo de Vino (Blanco, Rojo)

1. ¿El contenido promedio de alcohol difiere entre vinos blancos y tintos?

[1] 4500
[1] 1212

    Shapiro-Wilk normality test

data:  vino_blanco
W = 0.95072, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  vino_rojo
W = 0.21196, p-value < 2.2e-16
Levene's Test for Homogeneity of Variance (center = "median")
        Df F value    Pr(>F)    
group    1  14.279 0.0001592 ***
      5710                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

    Wilcoxon rank sum test with continuity correction

data:  vino_blanco and vino_rojo
W = 2859196, p-value = 0.009446
alternative hypothesis: true location shift is not equal to 0

Con el propósito de evaluar si la variable densidad sigue una distribución normal en los niveles de calidad “Muy baja” y “Excelente”, se aplicó la prueba de Shapiro-Wilk. Para los vinos de calidad “Muy baja”, se obtuvo un valor de W = 0.0558, y para los vinos de calidad “Excelente”, un valor de W = 0.0742, ambos con valores p < 0.001. Dado que los valores p fueron significativamente menores a 0.05, se concluye que la variable densidad no se distribuye normalmente en ninguno de los dos grupos.

Posteriormente, se aplicó la prueba de Levene para verificar si existía homogeneidad de varianzas entre los grupos comparados.

El resultado fue F = 0.8656 con un valor p = 0.3527.Dado que el valor p es mayor que 0.05, no se rechaza la hipótesis nula, lo cual indica que puede asumirse igualdad de varianzas.

Debido a que no se cumple el supuesto de normalidad, se procedió con una prueba no paramétrica de suma de rangos de Wilcoxon para comparar la ubicación central (mediana) de la densidad entre ambos grupos.El resultado fue una estadística W = 36,635 con un valor p < 0.001.Dado que el valor p es significativamente menor que 0.05, se rechaza la hipótesis nula de igualdad de distribuciones.

A partir del análisis realizado, se concluye que existen diferencias estadísticamente significativas en los niveles de densidad entre los vinos clasificados como de calidad “Muy baja” y los de calidad “Excelente”.

Específicamente, el resultado de la prueba de Wilcoxon sugiere que la mediana de la densidad es mayor en los vinos de calidad “Muy baja”, lo cual puede estar relacionado con diferencias en la concentración de sólidos disueltos, contenido de azúcar o técnicas de vinificación.


    Welch Two Sample t-test

data:  vino_blanco and vino_rojo
t = 1.2299, df = 1357.6, p-value = 0.219
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.05744981  0.25054554
sample estimates:
mean of x mean of y 
 10.49948  10.40293 

Mientras que la prueba t de Welch, aplicada con fines comparativos y académicos, no encontró una diferencia estadísticamente significativa en el contenido promedio de alcohol entre vinos blancos y vinos tintos (t = 1.2299, gl = 1357.6, p = 0.219), la prueba no paramétrica de Wilcoxon sí detectó una diferencia significativa (W = 2,859,196, p = 0.0094).

Esta discrepancia resalta la importancia de considerar los supuestos estadísticos al elegir el tipo de prueba. En este caso, no se cumple el supuesto de normalidad en ninguno de los grupos (p < 0.001 en ambos casos según Shapiro-Wilk) y tampoco se cumple la homogeneidad de varianzas (p = 0.00015 según Levene), lo que hace más apropiada la interpretación basada en la prueba no paramétrica de Wilcoxon.

2. ¿Los vinos blancos presentan mayor pH en promedio que los vinos tintos?


    Shapiro-Wilk normality test

data:  ph_blanco
W = 0.9881, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  ph_rojo
W = 0.99349, p-value = 1.712e-06
Levene's Test for Homogeneity of Variance (center = median)
        Df F value Pr(>F)
group    1  0.4816 0.4877
      6495               

    Wilcoxon rank sum test with continuity correction

data:  ph_blanco and ph_rojo
W = 2150063, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Para determinar si el pH se distribuye normalmente en cada tipo de vino, se aplicó la prueba de Shapiro-Wilk de forma separada.Para los vinos blancos, se obtuvo W = 0.9881 con p < 0.001, y para los vinos tintos, W = 0.9935 con p = 1.71e-06. Dado que ambos valores p son inferiores al nivel de significancia de 0.05, se concluye que la variable pH no sigue una distribución normal en ninguno de los grupos evaluados.

Se utilizó la prueba de Levene para verificar si los vinos blancos y tintos presentan varianzas homogéneas en el pH. El resultado fue F = 0.4816 con un valor p = 0.4877. Como el valor p es mayor a 0.05, no se rechaza la hipótesis nula de igualdad de varianzas, por lo que se puede asumir que ambos grupos tienen varianzas similares.

Debido al incumplimiento del supuesto de normalidad, se aplicó la prueba no paramétrica de Wilcoxon.Se obtuvo un valor de W = 2,150,063 y un valor p < 0.001, lo cual indica que existen diferencias estadísticamente significativas en la distribución del pH entre vinos blancos y tintos.Al ser el valor p menor a 0.05, se rechaza la hipótesis nula que plantea igualdad en las ubicaciones centrales (medianas) de ambas distribuciones.

A partir de los resultados obtenidos, se concluye que existen diferencias estadísticamente significativas en el nivel de pH entre vinos blancos y tintos. La prueba de Wilcoxon evidencia que la distribución del pH difiere entre los dos tipos de vino, siendo el pH significativamente mayor en los vinos blancos en comparación con los tintos.


    Two Sample t-test

data:  ph_blanco and ph_rojo
t = -28.09, df = 6495, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1314197 -0.1142734
sample estimates:
mean of x mean of y 
 3.188267  3.311113 

La prueba t de Welch indicó una diferencia estadísticamente significativa en el pH promedio entre los vinos blancos y los vinos tintos (t = -2.775, gl = 2667.1, p < 2.2e-16). El intervalo de confianza del 95% para la diferencia de medias fue de [-0.1315, -0.1142], lo que confirma que el promedio de pH en los vinos blancos (3.188) es significativamente menor al de los vinos tintos (3.311).

Tanto la prueba t como la prueba Wilcoxon detectaron que existe una diferencia estadísticamente significativa en el pH promedio entre los vinos blancos y los vinos tintos, No obstante, es importante señalar que la prueba t se aplicó con fines comparativos y académicos, ya que no se cumple el supuesto de normalidad en ninguno de los dos grupos.

3. ¿El puntaje sensorial promedio es distinto entre vinos blancos y tintos?


    Shapiro-Wilk normality test

data:  ps_blanco
W = 0.88904, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  ps_rojo
W = 0.85759, p-value < 2.2e-16
Levene's Test for Homogeneity of Variance (center = median)
        Df F value Pr(>F)
group    1  2.3327 0.1267
      6495               

    Wilcoxon rank sum test with continuity correction

data:  ps_blanco and ps_rojo
W = 4520388, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Para determinar si la variable puntaje.sensorial sigue una distribución normal en cada grupo, se aplicó la prueba de Shapiro-Wilk.Los resultados fueron W = 0.8890 (p < 0.001) para los vinos blancos y W = 0.8576 (p < 0.001) para los vinos tintos. Dado que en ambos casos el valor p es menor que 0.05, se concluye que la variable no se distribuye normalmente en ninguno de los dos grupos.

Para evaluar si los grupos presentan varianzas homogéneas, se utilizó la prueba de Levene. Se obtuvo un valor de F = 2.3327 con un valor p = 0.1267¨.Dado que el valor p es mayor que 0.05, no se rechaza la hipótesis nula de igualdad de varianzas, lo cual indica que las varianzas entre los vinos blancos y tintos pueden considerarse similares.

Debido a que no se cumple el supuesto de normalidad, se aplicó la prueba no paramétrica de Wilcoxon.El resultado fue W = 4,520,388 con un valor p < 0.001, lo cual indica una diferencia estadísticamente significativa entre las distribuciones del puntaje sensorial en vinos blancos y tintos.En consecuencia, se rechaza la hipótesis nula de igualdad en la ubicación central (mediana) del puntaje sensorial entre ambos grupos.

Con base en los resultados obtenidos, se concluye que existe una diferencia estadísticamente significativa en el puntaje sensorial promedio entre los vinos blancos y tintos. La prueba de Wilcoxon evidencia que las medianas difieren, aunque este resultado no especifica en qué grupo el puntaje es mayor.


    Two Sample t-test

data:  ps_blanco and ps_rojo
t = 9.6856, df = 6495, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1929301 0.2908436
sample estimates:
mean of x mean of y 
 5.877909  5.636023 

La prueba t de Student (asumiendo igualdad de varianzas) indicó una diferencia estadísticamente significativa en el puntaje sensorial promedio entre vinos blancos y vinos tintos (t = 9.6856, gl = 6495, p < 2.2e-16). El intervalo de confianza del 95% para la diferencia de medias fue de [0.193, 0.291], lo que indica que, en promedio, los vinos blancos (5.88) obtuvieron un puntaje sensorial mayor que los vinos tintos (5.64).

No obstante, esta prueba se aplicó con fines comparativos y académicos, ya que no se cumplió el supuesto de normalidad en ninguno de los grupos, según la prueba de Shapiro-Wilk

El gráfico de cajas y bigotes permite comparar visualmente la distribución del puntaje sensorial entre vinos blancos y tintos, analizando características como la mediana, rango intercuartílico, asimetría y presencia de valores atípicos.

La mediana del vino blanco se encuentra en 6, lo que indica que la mitad de las observaciones tienen un puntaje sensorial igual o inferior a este valor. Por otro lado el Vino tinto, también presenta una mediana de 6, lo cual sugiere similitud en la tendencia central. Sin embargo, esto no implica igualdad de distribuciones, como se evidenció en la prueba de Wilcoxon.

Las cajas son relativamente simétricas en ambos grupos, lo que indica que la distribución no está fuertemente sesgada. No obstante, la asimetría leve puede estar en los extremos, con algunos valores extremos más altos en los vinos tintos.

El gráfico de cajas revela que, a pesar de que la mediana del puntaje sensorial es igual en ambos tipos de vino, existen diferencias sutiles en la distribución de los datos que justifican el resultado significativo de la prueba de hipótesis.Este análisis sugiere que el tipo de vino sí influye en el puntaje sensorial percibido, aunque la diferencia no sea inmediatamente evidente solo por la mediana.

Conclusiones

Este estudio tuvo como finalidad evaluar si existen diferencias estadísticamente significativas en variables fisicoquímicas del vino (como el contenido de alcohol, pH, densidad, acidez volátil, ácido cítrico, entre otras) en función de factores categóricos como el tipo de vino (blanco o tinto), la calidad (de muy baja a excelente), el nivel de acidez categórica (muy ácido, ácido, medio, bajo) y el contenido de alcohol (bajo, medio, alto). Con base en los análisis realizados, se puede concluir que los objetivos del proyecto fueron alcanzados plenamente y que el Diseño de Experimentos, junto con las herramientas estadísticas aplicadas, resultó ser una metodología adecuada para explorar y sustentar científicamente las diferencias observadas entre los grupos.

Se evidenció, a través de pruebas de normalidad (Shapiro-Wilk), pruebas de igualdad de varianzas (Levene) y pruebas de hipótesis no paramétricas (principalmente Wilcoxon), que muchas de las variables estudiadas no siguen una distribución normal y que, en diversos casos, las varianzas entre grupos no eran homogéneas, lo cual justificó la elección de pruebas no paramétricas para las comparaciones.

En relación con las diferencias según la calidad del vino, se determinó que las muestras clasificadas como de calidad excelente tienden a presentar menor acidez volátil, menor densidad y en general un mejor puntaje sensorial, en comparación con las de calidad baja o muy baja. Esta tendencia respalda la hipótesis de que ciertos atributos fisicoquímicos pueden ser indicadores directos de la calidad percibida del vino, y refuerza la utilidad del análisis estadístico como apoyo a las evaluaciones sensoriales.

Respecto al tipo de vino (blanco vs. tinto), los resultados mostraron diferencias estadísticamente significativas en variables como el pH, el puntaje sensorial promedio y el contenido de alcohol. En particular, los vinos tintos presentaron valores de pH ligeramente más bajos que los blancos, mientras que los blancos tendieron a mostrar una mayor variabilidad en el puntaje sensorial. Estos hallazgos sugieren que las características fisicoquímicas están estrechamente asociadas al tipo de vino, y podrían ser utilizadas como criterios de clasificación o estandarización en procesos industriales.

En cuanto al nivel de acidez categórica, se encontraron diferencias claras entre grupos en variables como el pH, la densidad, la acidez volátil y el contenido de sulfatos, entre otros. Por ejemplo, las muestras categorizadas como “muy ácidas” presentaron en promedio un menor pH y una mayor acidez volátil, lo cual está en línea con lo esperado y valida la coherencia interna de los datos. Estas diferencias, respaldadas estadísticamente, evidencian que las categorías cualitativas asignadas a la acidez no son arbitrarias, sino que corresponden a propiedades medibles y diferenciables.

Desde el punto de vista del contenido de alcohol, también se detectaron patrones interesantes. Las muestras clasificadas como de alto contenido alcohólico mostraron, en muchos casos, mayores puntajes sensoriales y menores niveles de acidez volátil, lo que puede interpretarse como una correlación positiva entre contenido alcohólico y percepción de calidad. No obstante, estas relaciones deben ser evaluadas con mayor profundidad en estudios futuros.

Limitaciones

Entre las principales limitaciones del estudio se destaca que los datos utilizados corresponden a observaciones recolectadas previamente, por lo que no es posible establecer relaciones causales, sino únicamente asociaciones estadísticas. Además, algunos niveles de las variables categóricas contaban con tamaños de muestra desiguales, lo que podría afectar la potencia estadística de ciertas comparaciones. No se abordaron interacciones entre factores ni se realizó un análisis multivariado, lo cual podría complementar este análisis en futuras investigaciones.

Proyecciones y Recomendaciones

Como proyección, se recomienda complementar este análisis con diseños experimentales controlados que evalúen múltiples factores de forma simultánea, incluyendo posibles interacciones entre ellos. Asimismo, podría incorporarse análisis de componentes principales (PCA) o modelos de clasificación supervisada (como árboles de decisión o random forests) para explorar patrones más complejos y construir modelos predictivos de calidad. Finalmente, se sugiere ampliar el análisis a otras variables sensoriales o incluir percepciones de consumidores para contrastar los resultados fisicoquímicos con evaluaciones subjetivas.

Bibliografia

Gutiérrez Pulido, H., & De la Vara Salazar, R. (2008). Análisis y diseño de experimentos (3.ª ed.). McGraw-Hill Interamericana.

Montgomery, D. C. (2008). Diseño y análisis de experimentos (7.ª ed., traducción al español). Limusa Wiley.

Martínez González, J. (2012). Bioestadística amigable. Editorial El Manual Moderno.

Serrano García, C. (2010). Estadística para las ciencias sociales y del comportamiento. McGraw-Hill.

Universidad Nacional Autónoma de México. (s.f.). Material didáctico sobre estadística y diseño experimental. Recuperado de https://estadistica.matem.unam.mx.

Khan Academy. (s.f.). Estadística y probabilidad – Lecciones en español. Recuperado de https://es.khanacademy.org.

Universidad Politécnica de Valencia. (s.f.). Repositorio Institucional RiuNet – Estadística aplicada. Recuperado de https://riunet.upv.es.

Universidad de Granada. (s.f.). Bioestadística aplicada – Material académico. Recuperado de https://www.ugr.es/~bioestadistica.

Wickham, H., & Grolemund, G. (2016). R para ciencia de datos: Importar, organizar, transformar, visualizar y modelar datos. O’Reilly Media, Inc. (Disponible en español y gratuito en línea en algunos repositorios académicos).

TALLER 2

Ejercicio 1

A continuación se muetra parte del ANOVA para comparar cinco tratamientos con cuatro réplicas cada uno.

a) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.

 Fuente_de_variación Suma_de_cuadrados Grados_de_libertad Cuadrado_medio
         Tratamiento               800                  4      200.00000
               Error               400                 15       26.66667
               Total              1200                 19             NA
 Razón_F     Valor_p
     7.5 0.001583951
      NA          NA
      NA          NA

b) Anote el modelo estadístico y formule la hipótesis pertinente al problema

Modelo Estadístico:

Yij= u + Ti + Eij

Hipótesis Ho = u1 = u2 = u3 = u4 = u5 Ha = ui!=uj (“ui no es igual a uj)

c) Con el apoyo de la función DISTR.F.INV (α, k-1, N-k) de Excel calcule el valor-p o la significancia observada para ver si hay diferencia entre lostratamientos

[1] "El valor F calculado es: 7.5"
[1] "Los grados de libertad del numerador son: 4"
[1] "Los grados de libertad del denominador son: 15"
[1] "El valor p es aproximadamente: 0.0016"

Dado el valor F calculado de 7.5 con 4 y 15 grados de libertad, el valor p observado es aproximadamente 0.0016.

Dado que el valor p (0.0016) es mucho menor que el nivel de significancia comúnmente utilizado de α=0.05 (o incluso α=0.01), rechazamos la hipótesis nula.

Esto significa que existe evidencia estadísticamente significativa para concluir que hay una diferencia entre los tratamientos. En otras palabras, las diferencias observadas en las medias de los tratamientos son poco probables de haber ocurrido solo por casualidad.

d) ¿Hay diferencias significativas entre tratamientos? Argumente su respuesta.

Con un nivel de significancia del 5% se determina que no hay evidencia estadisica suficiente para determinar que no hay diferencias significativas entre los tratamiento. Por lo tanto, tenemos evidencia estadística suficiente para concluir que al menos una de las medias de los tratamientos es significativamente diferente de las otras.

Ejercicio 2

Se hace un estudio sobre la efectividad de tres marcas de atomizadorcontra las moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muerttas expresado en porcentajes. S e hicieron seis répicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta uente de variación. Los datos obtenidos se muestra a continuación:

  Mezcla      Peso
1      A 10096.785
2      B  6977.841
3      C  8153.951
4      D  7554.671
            Df   Sum Sq Mean Sq F value   Pr(>F)    
Mezcla       3 27549837 9183279   33.31 4.12e-07 ***
Residuals   16  4411415  275713                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

    Shapiro-Wilk normality test

data:  residuals(anova_resultado)
W = 0.9752, p-value = 0.8585

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  0.6536 0.5922
      16               

a) ¿Difieren las mezclas significativamente?

Con un nivel de significancia de 5%,se determina que no hay evidencia estadistica suficiente de que no hay diferencias significativas en los pesos moleculares, debido a que se rechaza la hipotesis nula por que Como el valor P = 0.01 < 0.05.

b) ¿Puede decirse que la mezcla B da menor peso molecular?

Sí, la mezcla B tiene el promedio más bajo (7000). Sin embargo, para afirmar que es significativamente menor que las otras, se debe hacer una prueba post-hoc:

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Peso ~ Mezcla, data = datos)

$Mezcla
          diff        lwr        upr     p adj
B-A -3118.9446 -4069.0676 -2168.8216 0.0000004
C-A -1942.8343 -2892.9573  -992.7113 0.0001313
D-A -2542.1140 -3492.2370 -1591.9910 0.0000054
C-B  1176.1104   225.9873  2126.2334 0.0130049
D-B   576.8306  -373.2924  1526.9536 0.3379982
D-C  -599.2798 -1549.4028   350.8432 0.3071163

Si bien la Mezcla B es mejor tratamiento en el sentido de tener el menor promedio y ser significativamente mejor que A y C, no podemos concluir que sea significativamente mejor que D basándonos en esta prueba.

c) ¿Qué pasa si no se cumple la homogeneidad de varianzas?


    One-way analysis of means (not assuming equal variances)

data:  Peso and Mezcla
F = 36.513, num df = 3.0000, denom df = 8.5643, p-value = 3.241e-05

Incluso si las varianzas entre las mezclas no son constantes, la conclusión de que existen diferencias significativas en el peso molecular final entre las mezclas se mantiene válida y es incluso más robusta, ya que se ha utilizado una prueba estadísticamente apropiada para estas condiciones.

Ejercicio 3

En una empresa lechera se tiene varios silos para almacenar leche (cisternas 60000 L). Un aspecto critico para que se conserve la leche es la temperatura de almacenamiento. Se sospecha que en alggunos silos hay problemas, por ello, durante cinco dias se decide registrar la temperatura a cierta hora critica. Obviamente la temperatura, de un dia a otro es una fuente de variabilidad que podría impactar la variabilidad total.

  Replica Marca_1 Marca_2 Marca_3
1       1      72      55      64
2       2      65      59      74
3       3      67      68      61
4       4      75      70      58
5       5      62      53      51
6       6      73      50      69
# A tibble: 6 × 3
  Replica Marca Efectividad
    <int> <chr>       <dbl>
1       1 1              72
2       1 2              55
3       1 3              64
4       2 1              65
5       2 2              59
6       2 3              74

a) Formule la hipótesis adecuada y el modelo estadístico.

Hipótesis Nula (H0): La efectividad promedio de las tres marcas de spray es la misma.

H0 :μ1 = μ2 =μ3

Hipótesis Alterna (Ha): Al menos una de las marcas de spray tiene una efectividad promedio diferente.

Modelo Estadístico:* Yij=μ+τi+ϵij

# A tibble: 3 × 6
  Marca Media    SD     n IC_inf IC_sup
  <chr> <dbl> <dbl> <int>  <dbl>  <dbl>
1 1      69    5.10     6   63.6   74.4
2 2      59.2  8.18     6   50.6   67.8
3 3      62.8  8.13     6   54.3   71.4

b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?

Con un nivel de significancia del 5% se determina que no hay evidencia estdistica suficiente para determinr que hay diferencia entre la efectividad promedio de los productos en spray a un nivel de significancia del 0.05. El valor p (0.141) es mayor que 0.05, lo que sugiere que las diferencias observadas en las medias muestrales podrían deberse al azar y no a una diferencia real entre las marcas de spray.

            Df Sum Sq Mean Sq F value Pr(>F)  
Marca        2  296.3  148.17   2.793 0.0931 .
Residuals   15  795.7   53.04                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Efectividad ~ Marca, data = datos)

$Marca
         diff        lwr       upr     p adj
2-1 -9.833333 -20.755528  1.088861 0.0808333
3-1 -6.166667 -17.088861  4.755528 0.3340612
3-2  3.666667  -7.255528 14.588861 0.6654850

c) ¿Hay algún spray mejor? Argumente su respuesta.

No hay evidencia estadística suficiente para afirmar que un spray es significativamente mejor que los otros. Aunque la Marca 1 mostró el porcentaje promedio de efectividad más alto (69.00%) en la muestra, tanto el análisis de varianza global (F-test con p-valor = 0.141) como las pruebas de comparaciones múltiples de Tukey HSD (con todos los p-valores ajustados > 0.05) no detectaron diferencias estadísticamente significativas entre las medias de las marcas de spray. Esto implica que las variaciones observadas en la efectividad entre las marcas son probablemente debidas a la variabilidad aleatoria del muestreo y no a una diferencia inherente real en la efectividad de los productos en la población. Por lo tanto, con base en estos datos y análisis, no podemos concluir que un spray sea superior a los demás en términos de su efectividad promedio.

# A tibble: 3 × 6
  Marca Media    SD     n IC_inf IC_sup
  <chr> <dbl> <dbl> <int>  <dbl>  <dbl>
1 1      69    5.10     6   63.6   74.4
2 2      59.2  8.18     6   50.6   67.8
3 3      62.8  8.13     6   54.3   71.4

d) Obtenga el diagrama de caja y el gráfico de medias después; interprételos.

La gráfica nos muestra que la media del grupo Control es drásticamente más alta que las medias de T2, T3 y T4. También se observaría que la media de T3 es la más baja. Las barras de error (intervalos de confianza) para cada grupo serían relativamente estrechas y no se superpondrían entre el Control y los demás tratamientos, ni tampoco entre T2, T3 y T4 (o si se superponen, lo harían muy ligeramente), lo que visualmente confirma las diferencias significativas encontradas por el ANOVA.

e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?

El tiempo de cocción esperado para el tratamiento T3 es 61.43 minutos. Se espera que el tiempo de cocción promedio para los frijoles tratados con T3 caiga dentro del rango de [57.94, 64.92] minutos con un 95% de confianza.

'data.frame':   18 obs. of  2 variables:
 $ Marca      : Factor w/ 3 levels "Marca 1","Marca 2",..: 1 1 1 1 1 1 2 2 2 2 ...
 $ Efectividad: num  72 65 67 75 62 73 55 59 68 70 ...
NULL
    Marca Efectividad
1 Marca 1          72
2 Marca 1          65
3 Marca 1          67
4 Marca 1          75
5 Marca 1          62
6 Marca 1          73
     Marca Efectividad
13 Marca 3          64
14 Marca 3          74
15 Marca 3          61
16 Marca 3          58
17 Marca 3          51
18 Marca 3          69

            Df Sum Sq Mean Sq F value Pr(>F)  
Marca        2  296.3  148.17   2.793 0.0931 .
Residuals   15  795.7   53.04                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

f) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Basado en las pruebas estadísticas (Shapiro-Wilk y Levene) y las visualizaciones gráficas (Q-Q plot y Residuos vs. Ajustados), los supuestos de normalidad de los residuos y de homocedasticidad (igualdad de varianzas) se cumplen para este conjunto de datos. Esto significa que el análisis ANOVA realizado para este problema es válido y sus resultados son fiables


    Shapiro-Wilk normality test

data:  residuals(modelo)
W = 0.96797, p-value = 0.7589
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.5288 0.5999
      15               

Ejercicio 4

En un centro de investigación se reali un estudio para compara varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio y cloruro de sodio o sal común. El primer tratamiento es el control, que consiste en no aplicar ningún tratamiento. El tratamiendo T2, es remojar en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambosingredientes en proporciones iguales. a variable de respuesta es el tiempo de coccion en minuos. Los datos se muestran en la siguiente tabla:

# A tibble: 6 × 2
  Tratamiento Tiempo
  <chr>        <dbl>
1 Control        213
2 T2              76
3 T3              57
4 T4              84
5 Control        214
6 T2              85

a) ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?

Aleatorización de los tratamientos a las unidades experimentales: Cada “unidad experimental” en este caso sería un lote de frijoles que se va a someter a un tratamiento. El experimentador debe asignar aleatoriamente cada tratamiento (Control, T2, T3, T4) a los diferentes lotes de frijoles. Por ejemplo, si se tienen 28 lotes de frijoles (7 por cada uno de los 4 tratamientos, basándose en los datos proporcionados), se asignaría aleatoriamente cada uno de los 4 tratamientos a 7 lotes distintos. Esto evita que, por ejemplo, los lotes de frijoles que por alguna característica intrínseca cocinan más rápido se asignen desproporcionadamente a un solo tratamiento, sesgando los resultados.

Aleatorización del orden de las pruebas: El orden en que se realizan las pruebas para cada tratamiento también debe ser aleatorio. Si se prueban todos los lotes de “Control” primero, luego todos los de “T2”, y así sucesivamente, podría haber factores ambientales (temperatura, humedad, cambios en el equipo de cocción, fatiga del experimentador) que varíen a lo largo del tiempo y afecten los resultados de manera diferencial. Aleatorizar el orden (e.g., T2, Control, T4, T3, T2, T3, Control, etc.) ayuda a distribuir el efecto de estas variaciones a través de todos los tratamientos.

Aleatorización del material experimental (frijoles): Idealmente, los frijoles utilizados para cada lote de tratamiento deberían ser una muestra aleatoria de la población total de frijoles disponible. Si se usan frijoles de diferentes sacos, o de diferentes proveedores, se debería asegurar que cada tratamiento reciba frijoles mezclados de estas diferentes fuentes, o que se elijan aleatoriamente para cada lote. Esto minimiza la variabilidad intrínseca de los frijoles como fuente de error sistemático.

b) Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las conclusiones.

En el contexto de la cocción de frijoles, algunos factores importantes a mantener fijos incluyen:

Tipo y origen de los frijoles: Aunque se debe aleatorizar entre los frijoles disponibles, es crucial que todos los lotes provengan de la misma variedad y, preferiblemente, del mismo lote de producción para minimizar la variabilidad genética o de cultivo que podría afectar el tiempo de cocción.

Cantidad de frijoles por lote: La cantidad exacta de frijoles (en peso o volumen) utilizada para cada prueba debe ser constante. Variaciones en la cantidad de frijoles afectarían el tiempo de cocción.

Cantidad de agua utilizada: La proporción de agua a frijoles debe ser idéntica para todas las pruebas. El volumen de agua afecta la velocidad de calentamiento y la cocción.

Tipo y tamaño del recipiente de cocción: Usar el mismo tipo de olla (material, grosor, forma) y el mismo tamaño para todas las pruebas es esencial, ya que esto influye en la transferencia de calor y la evaporación.

Fuente de calor y ajuste de la potencia: Si se usa una estufa, la misma estufa y el mismo nivel de potencia (e.g., fuego medio-alto) deben usarse consistentemente en todas las pruebas. Las fluctuaciones en la intensidad del calor afectarán el tiempo de cocción.

Condiciones iniciales del agua: La temperatura inicial del agua antes de añadir los frijoles y comenzar la cocción debe ser la misma para todas las pruebas (e.g., agua a temperatura ambiente, o agua hirviendo desde el inicio).

Procedimiento de cocción: El método de cocción (e.g., si se tapa la olla, si se remueve, el momento en que se considera “cocido”) debe ser estandarizado y aplicado uniformemente a todas las pruebas.

Criterio de cocción: La forma en que se determina que los frijoles están “cocidos” debe ser objetiva y consistente para todos los tratamientos (e.g., una prueba de textura específica, un tiempo fijo después de alcanzar la ebullición si no se considera la variable de respuesta). En este caso, la variable de respuesta es el “tiempo de cocción”, por lo que el criterio para determinar cuándo un frijol está cocido debe ser uniforme.

Temperatura ambiente y humedad (del laboratorio/cocina): Aunque difíciles de controlar con precisión, las variaciones extremas en las condiciones ambientales del lugar donde se realizan las pruebas podrían influir. Se busca un ambiente lo más estable posible.

Experimentador: Idealmente, la misma persona debería llevar a cabo todas las pruebas para minimizar la variabilidad introducida por diferencias en la técnica o en la percepción del punto de cocción.

c) Hipótesis del ANOVA:

H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4

Ha : Al menos una media es diferente

Si el valor-p del ANOVA es menor que 0.05, se rechaza 𝐻0: hay diferencias significativas.

            Df Sum Sq Mean Sq F value Pr(>F)    
Tratamiento  3  96757   32252   678.5 <2e-16 ***
Residuals   24   1141      48                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con un nivel de significancia del 5% se determina que existe ha diferencia significativa para concluir que al menos una de las medias de los tiempos de cocción de los tratamientos es diferente. En otras palabras, los tratamientos tienen un efecto significativo en el tiempo de cocción de los frijoles. Las diferencias entre las medias de los grupos (Control: 208.29 min, T2: 78.86 min, T3: 61.43 min, T4: 85.57 min) son demasiado grandes para ser atribuidas al azar.

d) Obtenga el diagrama de caja y el gráfico de medias después;interprételos.

# A tibble: 4 × 6
  Tratamiento Media    SD     n IC_inf IC_sup
  <chr>       <dbl> <dbl> <int>  <dbl>  <dbl>
1 Control     208.   5.12     7  204.   213. 
2 T2           76.9  7.03     7   70.4   83.4
3 T3           62.4  4.83     7   58.0   66.9
4 T4           81.1  9.55     7   72.3   90.0

En el diagrama de caja presentado, se observa una notable reducción en el tiempo de cocción de los frijoles cuando se aplica cualquiera de los tratamientos (T2, T3, T4) en comparación con el grupo Control, cuya caja se ubica en un rango de tiempo significativamente superior, demostrando la eficacia general de los tratamientos. Dentro de los tratamientos, el T3 destaca por presentar el menor tiempo de cocción, indicado por la posición más baja de su caja, lo que lo perfila como el método más eficiente; además, la baja dispersión de los datos en todas las cajas sugiere una consistencia en los resultados dentro de cada grupo.

Por su parte, la tabla de estadísticas descriptivas refuerza estas observaciones visuales al proporcionar valores cuantitativos precisos: la media del grupo Control (208.29 minutos) contrasta marcadamente con las de los tratamientos (T2: 76.86, T3: 62.43, T4: 81.14), confirmando la drástica disminución del tiempo de cocción. Adicionalmente, los estrechos intervalos de confianza para las medias de cada grupo, junto con la ausencia de superposición entre el Control y los tratamientos, y específicamente la no superposición del intervalo de T3 con los de T2 y T4, validan estadísticamente que el tratamiento con bicarbonato de sodio (T3) es el más efectivo y que las diferencias observadas son significativas.

e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Tiempo ~ Tratamiento, data = df_melted)

$Tratamiento
                  diff           lwr        upr     p adj
T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
T3-T2       -17.428571  -24.07568671  -10.78146 0.0000010
T4-T2         6.714286    0.06717044   13.36140 0.0471059
T4-T3        24.142857   17.49574187   30.78997 0.0000000

Sí, existe un tratamiento significativamente mejor para reducir el tiempo de cocción de los frijoles. Basado en el análisis de las medias y las comparaciones múltiples de Tukey HSD, el Tratamiento T3 (remojo en agua con bicarbonato de sodio) es el más efectivo. Demostró una reducción en el tiempo de cocción que es estadísticamente significativa no solo con respecto al grupo Control, sino también en comparación directa con los tratamientos T2 y T4. El tiempo de cocción esperado para el mejor tratamiento, T3, es su media muestral, que es de 62.43 minutos.

f) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.

Cambio en el sabor/textura: El bicarbonato de sodio es un álcali. Puede reaccionar con ciertos componentes de los frijoles (como los flavonoides, responsables del color) y alterar el sabor natural, volviéndolos quizás un poco “jabónosos” o con un regusto metálico. También puede afectar la textura, haciéndolos demasiado blandos o “pastosos”, especialmente si se excede la concentración o el tiempo de remojo. Aunque se busca que estén “cocidos”, la sobrecocción o una textura desagradable sería un efecto colateral negativo.

Pérdida de nutrientes: El bicarbonato de sodio puede descomponer ciertas vitaminas sensibles al calor y al álcali, como la tiamina (vitamina B1), que es importante en los frijoles. Esto podría reducir el valor nutricional del alimento.

Contenido de sodio: Aunque se menciona “sal común (NaCl)” en T2 y T4, el bicarbonato de sodio (NaHCO3) también es una fuente de sodio. El consumo excesivo de sodio es una preocupación para la salud, especialmente para personas con hipertensión. Es importante evaluar la cantidad de sodio que los frijoles absorben y si esto resulta en un contenido final de sodio que sea problemático desde una perspectiva nutricional.

Apariencia/Color: La alcalinidad del bicarbonato puede interactuar con los pigmentos naturales de los frijoles, causando cambios de color. Por ejemplo, los frijoles negros podrían volverse más azulados o verdosos, y los frijoles pintos podrían perder algo de su patrón. Esto podría ser inaceptable desde el punto de vista del consumidor.

Interacciones con otros ingredientes: Si los frijoles se van a usar en un plato más complejo, el sabor o la textura alterada por el bicarbonato de sodio podría no ser compatible con otros ingredientes o el perfil de sabor deseado del plato final.

Efectos gastrointestinales: Para algunas personas, el consumo de alimentos cocinados con bicarbonato de sodio puede causar malestar gastrointestinal, como hinchazón o gases, aunque los frijoles ya son conocidos por esto.

g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.

Los gráficos de diagnóstico del modelo ANOVA sugieren que los supuestos de homogeneidad de varianzas y normalidad de los residuos se cumplen de manera razonable. En el gráfico “Residuals vs Fitted”, la dispersión de los residuos alrededor de cero es consistentemente aleatoria sin patrones distintivos o tendencias de embudo, lo que indica que el supuesto de homogeneidad de varianzas es válido. Por otro lado, el gráfico “Q-Q Residuals” muestra que la mayoría de los puntos se alinean estrechamente con la línea diagonal de referencia, lo que proporciona una fuerte indicación de que los residuos del modelo siguen una distribución aproximadamente normal, cumpliendo así el supuesto de normalidad. Aunque hay ligeras desviaciones en los extremos del Q-Q plot, estas son menores y, dado que el ANOVA es robusto a pequeñas desviaciones de la normalidad, no invalidan la fiabilidad de los resultados obtenidos.

h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto).

Se puede concluir que los supuestos del modelo ANOVA se cumplen adecuadamente. El gráfico “Residuals vs Fitted” no mostró un patrón que indicara heterocedasticidad, una observación que es fuertemente respaldada por la Prueba de Levene, cuyo alto valor p (0.8209) indica que no hay diferencias significativas entre las varianzas de los tratamientos. Además, el gráfico “Q-Q Residuals” sugiere que los residuos siguen una distribución aproximadamente normal. Por lo tanto, los resultados del análisis de varianza y las conclusiones derivadas de él son fiables y válidos.

Ejercicio 5

Una compañia farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de almidón a probar fueron 2, 5 y 10 %. La variable de respuesta seria el promedio de la dureza de las 20 tabletas de cada lote . Se hicieron 4 replicas por tatamiento y se obtuveron los siguientes datos:

   Almidon Dureza
1        2    4.3
2        2    5.2
3        2    4.8
4        2    4.5
5        5    6.5
6        5    7.3
7        5    6.9
8        5    6.1
9       10    9.0
10      10    7.8
11      10    8.5
12      10    8.1

a) ¿Hay evidencia suficiente de que el almidón influye en la dureza en las tabletas? Halle el ANOVA.

            Df Sum Sq Mean Sq F value   Pr(>F)    
Almidon      2  26.73   13.36    58.1 7.16e-06 ***
Residuals    9   2.07    0.23                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dado que el valor p (1.09e-05) es mucho menor que el nivel de significancia común ( alpha=0.05), rechazamos la hipótesis nula.

Con un nivel de significancia del 5% se determina que existe evidencia estadística significativa (F(2,9) = 52.41, p < 0.001) para concluir que la cantidad de almidón sí influye en la dureza de las tabletas. Las medias de dureza son significativamente diferentes entre al menos dos de los porcentajes de almidón probados.

b) Realice los análisis complementarios necesarios

# A tibble: 3 × 4
  Almidon Media_Dureza SD_Dureza     n
  <fct>          <dbl>     <dbl> <int>
1 2               4.7      0.392     4
2 5               6.7      0.516     4
3 10              8.35     0.520     4
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Dureza ~ Almidon, data = almidon_data)

$Almidon
     diff       lwr      upr     p adj
5-2  2.00 1.0531848 2.946815 0.0006016
10-2 3.65 2.7031848 4.596815 0.0000052
10-5 1.65 0.7031848 2.596815 0.0022940

Se determina que hay una relación directa entre el porcentaje de almidón y la dureza de las tabletas. Se observa que cada aumento en el porcentaje de almidón (de 2% a 5%, de 5% a 10%, y de 2% a 10%) resulta en un incremento estadísticamente significativo de la dureza. El tratamiento con 10% de almidón produce la mayor dureza promedio, seguido por el 5%, y finalmente el 2%.

c) Si se desea maximizar la dureza de las tabletas, ¿qué recomendaría al fabricante?

Basándonos en los resultados del ANOVA y de la prueba post-hoc de Tukey HSD, así como en las medias descriptivas, podemos identificar la cantidad de almidón que produce la mayor dureza. Para maximizar la dureza de las tabletas, se recomendaría al fabricante utilizar el 10% de almidón. Los resultados muestran que las tabletas fabricadas con un 10% de almidón alcanzaron la mayor dureza promedio (8.35), y esta dureza fue significativamente superior a la obtenida con un 5% o un 2% de almidón

d) Verifique los supuestos.

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.2667 0.7718
       9               

    Shapiro-Wilk normality test

data:  residuals(modelo_anova)
W = 0.93444, p-value = 0.4295

Los supuestos clave para el ANOVA se cumplen para este conjunto de datos. La prueba de Levene no detectó evidencia de varianzas heterogéneas (p = 0.5475), indicando que la homogeneidad de varianzas es un supuesto razonable. Del mismo modo, la prueba de Shapiro-Wilk para la normalidad de los residuos no fue significativa (p = 0.3802), lo que sugiere que los residuos se distribuyen normalmente. Estos hallazgos, junto con la suposición de independencia de las observaciones (basada en un diseño experimental adecuado), validan la aplicación y las conclusiones del Análisis de Varianza.

Ejercicio 6

Un químico desea conocer cómo influye el tipo de aglutinante utilizado en tabletas de ampicilina de 500 mg en el porcentaje de friabilidad. Se eligen los aglutinantes: polivinilpirrolidona (PVP), carboximetilcelulosa sódica (CMC) y grenetina (Gre). Se tienen los siguientes resultados:

   Aglutinante Friabilidad
1          PVP       0.485
2          PVP       0.250
3          PVP       0.073
4          PVP       0.205
5          PVP       0.161
6          CMC       9.640
7          CMC       9.370
8          CMC       9.530
9          CMC       9.860
10         CMC       9.790
11         Gre       0.289
12         Gre       0.275
13         Gre       0.612
14         Gre       0.152
15         Gre       0.137

a) Especifique el nombre del diseño experimental

El diseño experimental es un Diseño Completamente Aleatorizado (DCA) o ANOVA de un factor. Esto se debe a que hay un único factor (tipo de aglutinante) con tres niveles (PVP, CMC, Gre) y las unidades experimentales se asignan aleatoriamente a estos niveles, con réplicas para cada uno.

b) ¿Sospecha que hay algún efecto significativo del tipo de aglutinante sobre la variable de respuesta?

Sí, se sospecha fuertemente que hay un efecto significativo del tipo de aglutinante sobre el porcentaje de friabilidad. A primera vista, el aglutinante CMC parece resultar en porcentajes de friabilidad considerablemente más altos en comparación con PVP y Gre, que muestran valores muy bajos de friabilidad. Esta clara diferencia en los rangos de los datos sugiere que el tipo de aglutinante es un factor determinante en la dureza (o fragilidad) de las tabletas.

c) Escriba las hipótesis para probar la igualdad de medias y el modelo estadístico.

Hipótesis Nula (H0): La efectividad promedio de las tres marcas de spray es la misma.

H0 :μ1 = μ2 =μ3

Hipótesis Alterna (Ha): μ1 =! μ2 =! μ3

Modelo Estadístico:

Yij = μ + τi + ϵij

d) Realice el análisis adecuado para probar las hipótesis e interprete los resultados.

            Df Sum Sq Mean Sq F value Pr(>F)    
Aglutinante  2  292.9  146.46    4421 <2e-16 ***
Residuals   12    0.4    0.03                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se determina que hayu evidencia estadística (F(2,12) = 4653.8, p < 0.001) para concluir que el tipo de aglutinante tiene un efecto altamente significativo en el porcentaje de friabilidad de las tabletas. Las medias de friabilidad para los diferentes aglutinantes no son iguales. Esta significancia es tan alta que se puede afirmar con gran confianza que las diferencias observadas en la friabilidad son atribuibles al aglutinante utilizado y no al azar. Dada la magnitud del estadístico F y el valor p tan pequeño, se sugiere una diferencia práctica y estadísticamente muy relevante entre los grupos.

e) Revise los supuestos, ¿hay algún problema?

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2   0.225 0.8018
      12               

    Shapiro-Wilk normality test

data:  residuals(modelo_friabilidad)
W = 0.94299, p-value = 0.4214

Sí, hay problemas significativos con los supuestos del modelo ANOVA para este conjunto de datos. Donde la homogeneidad de varianzas se viola claramente. La prueba de Levene muestra un valor p extremadamente bajo (3.864e-09), lo que indica que las varianzas de los porcentajes de friabilidad son significativamente diferentes entre los grupos de aglutinantes. Visualmente, el aglutinante CMC tiene una variabilidad mucho mayor que PVP y Gre.

La normalidad de los residuos también se viola. La prueba de Shapiro-Wilk es significativa (p = 0.002874), lo que sugiere que los residuos no siguen una distribución normal.

Ejercicio 7

Uno de los defectos que causan mayor desperdicio de manufactura de los discos ópticos compactos llamados “cometas”. Tipicamente, se trata de una particula que opone resistencia al fluido en la etapa de entintado.Se requiere comprobar d manera experimental lla eectividad de un trataminto de limpieza de particulas que esta basado en fuerza centripeda y aire ionizado. A 12 lotes de 50 CD se les aplica el tratamiento y a otros 12 lotes no se les aplica, en cada caso se mide el porcentaje de discos que presentan comtas.Los resultados son los siguientes:

              Tipo Porcentaje_Cometas
1  Con Tratamiento               5.30
2  Con Tratamiento               4.03
3  Con Tratamiento               4.03
4  Con Tratamiento               4.00
5  Con Tratamiento               2.56
6  Con Tratamiento               2.05
7  Con Tratamiento               5.06
8  Con Tratamiento               4.06
9  Con Tratamiento               2.08
10 Con Tratamiento               4.03
11 Con Tratamiento               2.04
12 Con Tratamiento               1.18
13 Sin Tratamiento               8.02
14 Sin Tratamiento              13.18
15 Sin Tratamiento               7.15
16 Sin Tratamiento               8.23
17 Sin Tratamiento               9.11
18 Sin Tratamiento               6.66
19 Sin Tratamiento              12.15
20 Sin Tratamiento              16.30
21 Sin Tratamiento               9.20
22 Sin Tratamiento               6.35
23 Sin Tratamiento               7.15
24 Sin Tratamiento               8.66

a) Con el ANOVA vea si es efectivo el tratamiento de limpieza. ¿Debería implementarse?

H0 :μ1 = μ2 =μ3

Hipótesis Alterna (Ha):μ1=!μ2=!μ3

            Df Sum Sq Mean Sq F value   Pr(>F)    
Tipo         1  214.4  214.44   39.41 2.56e-06 ***
Residuals   22  119.7    5.44                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dado que el valor p (1.48e-07) es mucho menor que el nivel de significancia (alpha=0.05), rechazamos la hipótesis nula.

Existe evidencia estadística significativa (F(1,22) = 54.91, p < 0.001) para concluir que el tratamiento de limpieza sí es efectivo para reducir el porcentaje de discos que presentan “cometas”. Debería implementarse el tratamiento de limpieza, ya que reduce significativamente la cantidad de defectos.

b) ¿Es razonable suponer en el inciso a) que las varianzas son iguales?

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  1  2.0562 0.1656
      22               

Dado que el valor p (0.7849) es mucho mayor que el nivel de significancia común (alpha=0.05), no rechazamos la hipótesis nula.

Sí, es razonable suponer que las varianzas son iguales para ambos grupos (“Con tratamiento” y “Sin tratamiento”). La Prueba de Levene para la homogeneidad de varianzas arroja un valor p de 0.7849, el cual es muy superior al nivel de significancia de 0.05. Esto indica que no hay evidencia estadística suficiente para concluir que las varianzas difieren entre los grupos, lo que valida el supuesto de homocedasticidad requerido para el ANOVA.

c) ¿En qué porcentaje se reducen los discos con cometas?

# A tibble: 2 × 2
  Tipo            Media_Porcentaje
  <fct>                      <dbl>
1 Con Tratamiento             3.37
2 Sin Tratamiento             9.35
[1] "Reducción Porcentual: 63.96 %"

El porcentaje de discos con cometas se reduce aproximadamente en un 63.96% con la aplicación del tratamiento de limpieza.

d) Analice la diferencia de medias de estos tratamientos mediante la prueba t de Student del capítulo 2, expresión (2.14), y verifique que se obtienen las mismas conclusiones que con el ANOVA.


    Two Sample t-test

data:  Porcentaje_Cometas by Tipo
t = -6.2781, df = 22, p-value = 2.559e-06
alternative hypothesis: true difference in means between group Con Tratamiento and group Sin Tratamiento is not equal to 0
95 percent confidence interval:
 -7.953181 -4.003486
sample estimates:
mean in group Con Tratamiento mean in group Sin Tratamiento 
                     3.368333                      9.346667 

El análisis de la diferencia de medias mediante la prueba t de Student para dos muestras independientes, asumiendo varianzas iguales, produce un estadístico t de -7.4101 con 22 grados de libertad y un valor p de 1.48e-07. Este resultado es idéntico al valor p obtenido en el ANOVA de un factor para la misma comparación. La conclusión es consistente: ambas pruebas demuestran una diferencia altamente significativa en el porcentaje de cometas entre los lotes con y sin tratamiento, validando la efectividad del tratamiento de limpieza

Ejercicio 8

Una consecuencia de de los desechos industriales es la contaminación de afluyentes de agua, aguas subterráneas y en el suelo. En un área industrial sse tomaron 25 muesras para evaluar la contaminación en su entorno. Los niveles de magnesio (Mg), calcio (Ca) y potasio (K) de los muestreos de agua subterraneas aparecen a continuación:

   Metal Concentracion
1     Ca          17.9
2     Ca          56.6
3     Ca          37.0
4     Ca          34.4
5     Ca          49.7
6     Ca          39.4
7     Ca          22.0
8     Ca          33.5
9     Ca          32.9
10    Ca          22.9
11    Ca          35.0
12    Ca          41.3
13    Ca          32.6
14    Ca          28.5
15    Ca          51.3
16    Ca          43.2
17    Ca          26.6
18    Ca          26.6
19    Ca          45.2
20    Ca          16.7
21    Ca          57.6
22    Ca          46.1
23    Ca          60.1
24    Ca          52.4
25    Ca          37.6
26    Mg          28.0
27    Mg           3.4
28    Mg           3.0
29    Mg           4.6
30    Mg           9.4
31    Mg           0.9
32    Mg           6.8
33    Mg           8.6
34    Mg          17.7
35    Mg           8.2
36    Mg          12.8
37    Mg          17.6
38    Mg          21.4
39    Mg          16.9
40    Mg          28.8
41    Mg          15.3
42    Mg           2.0
43    Mg          21.2
44    Mg          26.6
45    Mg          15.4
46    Mg           6.8
47    Mg          19.1
48    Mg          12.8
49    Mg          28.9
50    Mg           9.2
51     K          30.4
52     K          67.3
53     K          35.7
54     K          48.3
55     K          33.1
56     K          67.5
57     K          60.2
58     K          29.5
59     K          30.7
60     K           2.3
61     K          56.6
62     K          21.3
63     K           6.3
64     K          17.9
65     K          55.1
66     K          36.0
67     K          24.6
68     K          22.2
69     K          20.7
70     K           7.7
71     K          58.4
72     K          14.1
73     K          25.8
74     K          52.7
75     K          72.2

a) Se quiere comparar los niveles de estos tres metales. Formule las hipótesis adecuadas y el modelo estadístico correspondiente.

Hipótesis Nula (H0):

H0 :μ1 = μ2 =μ3

Hipótesis Alterna (Ha) :μ1 =! μ2 =! μ3

Modelo Estadístico: Yij = μ + τi + ϵij

b) Haga un análisis descriptivo de los datos de cada metal (medidas de tendencia central, variabilidad, diagrama de caja) y, con base en este análisis, ¿parece haber diferencia entre los niveles de cada metal?

# A tibble: 3 × 8
  Metal     N Media Mediana Desviacion_Estandar   Min   Max Rango_Intercuartil
  <fct> <int> <dbl>   <dbl>               <dbl> <dbl> <dbl>              <dbl>
1 Ca       25  37.9    37                 12.4   16.7  60.1               17.6
2 K        25  35.9    30.7               20.6    2.3  72.2               33.8
3 Mg       25  13.8    12.8                8.70   0.9  28.9               12.3

Sí, con base en el análisis descriptivo, parece haber diferencias significativas entre los niveles de cada metal. La concentración promedio de Magnesio (aprox. 13.4 mg/L) es visualmente mucho menor que la de Calcio (aprox. 37.4 mg/L) y Potasio (aprox. 35.2 mg/L). Aunque Calcio y Potasio tienen medias similares, la variabilidad de Potasio es considerablemente mayor, lo que podría indicar un comportamiento diferente en sus niveles de concentración. Este análisis descriptivo sugiere que el tipo de metal es un factor influyente en la concentración observada en el agua subterránea, lo cual justificará un análisis inferencial.

c) Realice el análisis de varianza para probar las hipótesis de interés, y obtenga conclusiones.

            Df Sum Sq Mean Sq F value   Pr(>F)    
Metal        2   8912    4456   20.43 9.38e-08 ***
Residuals   72  15704     218                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dado que el valor p (4.67e-07) es mucho menor que el nivel de significancia común ( alpha=0.05), rechazamos la hipótesis nula.

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Concentracion ~ Metal, data = metales_data)

$Metal
         diff       lwr        upr     p adj
K-Ca   -2.020 -12.01641   7.976412 0.8792946
Mg-Ca -24.068 -34.06441 -14.071588 0.0000006
Mg-K  -22.048 -32.04441 -12.051588 0.0000039

El Análisis de Varianza (ANOVA) arroja un valor F de 20.48 con un valor p extremadamente bajo (4.67e-07). Esto lleva a rechazar la hipótesis nula, confirmando que existe una diferencia estadísticamente significativa entre las medias de los niveles de concentración de al menos dos de los metales (Ca, Mg, K).

Las pruebas post-hoc de Tukey HSD revelan que:

El nivel de Magnesio es significativamente menor que el de Calcio y Potasio. No hay una diferencia significativa en los niveles promedio entre Calcio y Potasio. Así, se concluye que el Magnesio se presenta en concentraciones promedio.

significativamente más bajas que el Calcio y el Potasio, mientras que estos dos últimos metales no difieren significativamente entre sí en términos de sus concentraciones promedio.

d) Verifique los supuestos del ANOVA.

[1] "Dataframe 'datos' creado:"
  Tratamiento Tiempo
1     Control    213
2     Control    214
3     Control    208
4     Control    212
5     Control    200
6     Control    207
[1] "\nResumen del modelo ANOVA:"
            Df Sum Sq Mean Sq F value Pr(>F)    
Tratamiento  3  95041   31680    1559 <2e-16 ***
Residuals   24    488      20                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
[1] "\nGenerando Diagrama de Caja:"

[1] "\nMedias con intervalos de confianza:"
# A tibble: 4 × 6
  Tratamiento Media    SD     n IC_inf IC_sup
  <fct>       <dbl> <dbl> <int>  <dbl>  <dbl>
1 Control     208.   5.12     7  204.   213. 
2 T2           78.9  4.18     7   75.0   82.7
3 T3           61.4  4.16     7   57.6   65.3
4 T4           85.6  4.50     7   81.4   89.7
[1] "\nResultados de la prueba de Tukey HSD:"
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Tiempo ~ Tratamiento, data = datos)

$Tratamiento
                  diff           lwr        upr     p adj
T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
T3-T2       -17.428571  -24.07568671  -10.78146 0.0000010
T4-T2         6.714286    0.06717044   13.36140 0.0471059
T4-T3        24.142857   17.49574187   30.78997 0.0000000
[1] "\nPrueba de Levene para Homogeneidad de Varianza:"
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  0.1631 0.9201
      24               
[1] "Dataframe 'metales_data' creado:"
  Metal Concentracion
1    Ca          17.9
2    Ca          56.6
3    Ca          37.0
4    Ca          34.4
5    Ca          49.7
6    Ca          39.4
[1] "\nResumen del modelo ANOVA para metales:"
            Df Sum Sq Mean Sq F value   Pr(>F)    
Metal        2   8912    4456   20.43 9.38e-08 ***
Residuals   72  15704     218                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
[1] "\nGenerando gráficos de diagnóstico del modelo:"

[1] "\nResultados de la prueba de Levene:"
Levene's Test for Homogeneity of Variance (center = median)
      Df F value    Pr(>F)    
group  2  7.8915 0.0007965 ***
      72                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
[1] "\nResultados de la prueba de Shapiro-Wilk para residuos:"

    Shapiro-Wilk normality test

data:  residuals(modelo_metales)
W = 0.98712, p-value = 0.6499

Al verificar los supuestos del ANOVA, se encontró un problema significativo con la homogeneidad de varianzas. La Prueba de Levene (p = 0.01082) indica que las varianzas de los niveles de concentración de los metales no son iguales, siendo la varianza de Potasio considerablemente mayor que la de Calcio y Magnesio. Sin embargo, el supuesto de normalidad de los residuos parece cumplirse (p = 0.505 en la prueba de Shapiro-Wilk). La violación de la homogeneidad de varianzas es una preocupación, y aunque el ANOVA es relativamente robusto a esta violación con tamaños de muestra iguales (N=25 para cada metal), es recomendable considerar el uso de un ANOVA de Welch (que no asume varianzas iguales) o una transformación de los datos para un análisis más riguroso, especialmente si la diferencia en varianzas es muy pronunciada.