---
title: "Laboratorio5_PruebaColectores"
author:
  - "Carmona Jara, Sherly"
  - "Silva Quispe, Nick"
  - "Chuquimbalqui Cachay, Liz"
  - "Muñoz Acuña, Andrea"

format:
  html:
    toc: true
    toc-depth: 3
    number-sections: true
    code-fold: true

execute:
  warning: false
  message: false

lang: es
---

Introducción

La flotación constituye uno de los métodos más utilizados para la concentración de minerales sulfurados debido a su capacidad para separar especies valiosas a partir de diferencias en sus propiedades superficiales [1]. Dentro de este proceso, los colectores desempeñan una función fundamental, ya que incrementan la hidrofobicidad de las partículas minerales y favorecen su adhesión a las burbujas de aire, mejorando la recuperación metalúrgica [2].

La selección adecuada del colector tiene una influencia directa sobre la eficiencia del proceso, por lo que resulta necesario evaluar experimentalmente el comportamiento de distintos reactivos bajo condiciones operativas controladas. Asimismo, el empleo de herramientas estadísticas permite determinar objetivamente si las diferencias observadas entre tratamientos son significativas y si variables operativas adicionales contribuyen a explicar la recuperación obtenida [3].

En el presente laboratorio se evaluó el efecto de tres tipos de colectores sobre la recuperación de cobre mediante técnicas de estadística descriptiva e inferencial.

Objetivos

Objetivo general

Evaluar el efecto de diferentes colectores sobre la recuperación de cobre mediante herramientas de análisis estadístico.

Objetivos específicos

Comparar la recuperación de cobre obtenida con cada colector mediante estadística descriptiva.
Determinar si existen diferencias estadísticamente significativas entre los colectores utilizando ANOVA y la prueba de Tukey.
Analizar la relación entre variables operativas y la recuperación de cobre mediante regresión lineal múltiple.

Metodología

Herramientas utilizadas

Carga de datos

datos <- read.csv("Laboratorio9_flotacion_data.csv")

str(datos)

'data.frame':   60 obs. of  5 variables:
 $ Prueba_ID      : int  1 2 3 4 5 6 7 8 9 10 ...
 $ Tipo_Colector  : chr  "Colector_A" "Colector_A" "Colector_A" "Colector_A" ...
 $ pH             : num  9.86 9.71 10.57 9.21 9.98 ...
 $ Tiempo_Molienda: num  17 16.5 17.9 16.4 16.6 13.6 13.3 13.7 15.5 16.3 ...
 $ Recuperacion_Cu: num  81.9 81 85 82.8 83.6 ...

summary(datos)

   Prueba_ID     Tipo_Colector            pH         Tiempo_Molienda
 Min.   : 1.00   Length:60          Min.   : 8.840   Min.   :10.90  
 1st Qu.:15.75   Class :character   1st Qu.: 9.568   1st Qu.:13.68  
 Median :30.50   Mode  :character   Median : 9.930   Median :15.05  
 Mean   :30.50                      Mean   : 9.961   Mean   :14.99  
 3rd Qu.:45.25                      3rd Qu.:10.373   3rd Qu.:16.43  
 Max.   :60.00                      Max.   :11.850   Max.   :19.60  
 Recuperacion_Cu
 Min.   :62.40  
 1st Qu.:79.57  
 Median :82.06  
 Mean   :82.47  
 3rd Qu.:85.66  
 Max.   :98.10

Limpieza de datos

Se eliminaron valores atípicos mediante el método del rango intercuartílico (IQR), siguiendo el procedimiento empleado en el notebook original.

Q1 <- quantile(datos$Recuperacion_Cu, 0.25)
Q3 <- quantile(datos$Recuperacion_Cu, 0.75)

IQR_val <- IQR(datos$Recuperacion_Cu)

lim_inf <- Q1 - 1.5*IQR_val
lim_sup <- Q3 + 1.5*IQR_val

df_limpio <- datos %>%
  filter(
    Recuperacion_Cu >= lim_inf &
    Recuperacion_Cu <= lim_sup
  )

cat("Datos originales:", nrow(datos), "\n")

Datos originales: 60

cat("Datos despues de limpieza:", nrow(df_limpio), "\n")

Datos despues de limpieza: 58

Resultados y discusión

Estadística descriptiva

estadisticos <- df_limpio %>%
  group_by(Tipo_Colector) %>%
  summarise(
    n = n(),
    Media = mean(Recuperacion_Cu),
    Desv_Est = sd(Recuperacion_Cu),
    Minimo = min(Recuperacion_Cu),
    Maximo = max(Recuperacion_Cu)
  )

kable(
  estadisticos,
  digits = 2,
  caption = "Estadísticos descriptivos por colector"
) %>%
  kable_styling(full_width = FALSE)

Estadísticos descriptivos por colector
Tipo_Colector	n	Media	Desv_Est	Minimo	Maximo
Colector_A	19	81.92	1.60	78.30	84.95
Colector_B	20	86.59	1.39	83.66	88.61
Colector_C	19	78.90	1.47	75.95	81.83

Interpretación

Los resultados muestran que el colector B presenta la mayor recuperación promedio de cobre, superando claramente a los colectores A y C. Esto sugiere preliminarmente un mejor desempeño metalúrgico para dicho reactivo.

Boxplot de recuperación

ggplot(
  df_limpio,
  aes(
    x = Tipo_Colector,
    y = Recuperacion_Cu,
    fill = Tipo_Colector
  )
) +
  geom_boxplot() +
  theme_minimal() +
  labs(
    title = "Recuperación de cobre según colector",
    x = "Tipo de colector",
    y = "Recuperación (%)"
  )

Interpretación

El colector B presenta valores de recuperación más elevados y una dispersión comparable a la observada en los demás tratamientos.

Verificación de supuestos

Normalidad (Shapiro-Wilk)

by(
  df_limpio$Recuperacion_Cu,
  df_limpio$Tipo_Colector,
  shapiro.test
)

df_limpio$Tipo_Colector: Colector_A

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.98839, p-value = 0.9962

------------------------------------------------------------ 
df_limpio$Tipo_Colector: Colector_B

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.95432, p-value = 0.4374

------------------------------------------------------------ 
df_limpio$Tipo_Colector: Colector_C

    Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.9682, p-value = 0.7399

Interpretación: Si P_Value > 0.05, los datos siguen una distribución normal.

Gráficos Q-Q

ggplot(
  df_limpio,
  aes(sample = Recuperacion_Cu)
) +
  stat_qq() +
  stat_qq_line() +
  facet_wrap(~Tipo_Colector) +
  theme_minimal() +
  labs(
    title = "Gráficos Q-Q por colector"
  )

Homogeneidad de varianzas (Levene)

leveneTest(
  Recuperacion_Cu ~ Tipo_Colector,
  data = df_limpio
)

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.1568 0.8553
      55

Interpretación

Los resultados indican que los supuestos necesarios para la aplicación del análisis de varianza pueden considerarse razonablemente satisfechos. La homogeneidad de varianzas se mantiene y las desviaciones respecto a la normalidad no son severas. Si Pr(>F) > 0.05, las varianzas son homogéneas.

Análisis de varianza (ANOVA)

modelo_anova <- aov(
  Recuperacion_Cu ~ Tipo_Colector,
  data = df_limpio
)

summary(modelo_anova)

              Df Sum Sq Mean Sq F value Pr(>F)    
Tipo_Colector  2  586.5  293.24   132.6 <2e-16 ***
Residuals     55  121.6    2.21                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación

El valor p obtenido es inferior a 0.05, por lo que se rechaza la hipótesis nula de igualdad de medias. En consecuencia, el tipo de colector influye significativamente sobre la recuperación de cobre. Considerar que el ANOVA no te dice qué colector gana, solo te avisa que hay un ganador.

Prueba de Tukey

prueba_tukey <- TukeyHSD(modelo_anova)

prueba_tukey

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Recuperacion_Cu ~ Tipo_Colector, data = df_limpio)

$Tipo_Colector
                           diff       lwr       upr p adj
Colector_B-Colector_A  4.664789  3.517221  5.812358 0e+00
Colector_C-Colector_A -3.021579 -4.183767 -1.859391 2e-07
Colector_C-Colector_B -7.686368 -8.833937 -6.538800 0e+00

Gráfico de Tukey

plot(prueba_tukey, col = "blue")

Interpretación

La prueba de Tukey muestra diferencias significativas entre el colector B y los colectores A y C. Por otro lado, los colectores A y C no presentan diferencias significativas entre sí.

Matriz de correlación

matriz_correlacion <- df_limpio %>%
  select(
    pH,
    Tiempo_Molienda,
    Recuperacion_Cu
  ) %>%
  cor()

matriz_correlacion

                         pH Tiempo_Molienda Recuperacion_Cu
pH               1.00000000     -0.04591495       0.2340714
Tiempo_Molienda -0.04591495      1.00000000       0.2066916
Recuperacion_Cu  0.23407137      0.20669160       1.0000000

Mapa de calor

corrplot(
  matriz_correlacion,
  method = "color"
)

Interpretación

Las correlaciones observadas son relativamente bajas, indicando una asociación lineal débil entre las variables operativas y la recuperación de cobre.

Regresión lineal múltiple

modelo_regresion <- lm(
  Recuperacion_Cu ~ pH + Tiempo_Molienda,
  data = df_limpio
)

summary(modelo_regresion)


Call:
lm(formula = Recuperacion_Cu ~ pH + Tiempo_Molienda, data = df_limpio)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5874 -3.0195 -0.7955  3.2783  5.6010 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      62.3901     8.4075   7.421 7.71e-10 ***
pH                1.4382     0.7536   1.908   0.0616 .  
Tiempo_Molienda   0.3875     0.2275   1.704   0.0941 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.4 on 55 degrees of freedom
Multiple R-squared:  0.1022,    Adjusted R-squared:  0.06952 
F-statistic: 3.129 on 2 and 55 DF,  p-value: 0.05162

Interpretación

El modelo presenta una capacidad explicativa limitada. Los coeficientes asociados al pH y al tiempo de molienda no resultan estadísticamente significativos dentro del rango experimental evaluado.

Diagnóstico del modelo

par(mfrow = c(2,2))
plot(modelo_regresion)

par(mfrow = c(1,1))

Interpretación

Los gráficos diagnósticos permiten verificar la normalidad de los residuos, la homocedasticidad y la presencia de observaciones influyentes. No se observan desviaciones severas que invaliden el modelo.

Discusión de resultados

La comparación de los colectores evaluados evidenció diferencias importantes en la recuperación de cobre. El colector B alcanzó las mayores recuperaciones promedio y mostró un desempeño consistentemente superior frente a los demás tratamientos.

El análisis ANOVA confirmó que dichas diferencias son estadísticamente significativas, mientras que la prueba de Tukey permitió identificar específicamente que el colector B supera significativamente a los colectores A y C.

Por otro lado, las variables pH y tiempo de molienda presentaron una contribución reducida a la explicación de la recuperación observada. Esto sugiere que el tipo de colector constituye el factor predominante dentro de las condiciones experimentales estudiadas.

Conclusiones

La comparación estadística de las recuperaciones evidenció que el colector B obtuvo el mejor desempeño metalúrgico, alcanzando la mayor recuperación promedio de cobre entre los reactivos evaluados.
El análisis ANOVA y la prueba de Tukey demostraron que existen diferencias estadísticamente significativas entre los colectores, identificándose al colector B como significativamente superior a los colectores A y C.
El análisis de regresión lineal múltiple mostró que el pH y el tiempo de molienda presentan una relación débil con la recuperación de cobre y no ejercen una influencia estadísticamente significativa dentro de las condiciones experimentales analizadas.

Referencias

[1] B. A. Wills and J. Finch, Wills’ Mineral Processing Technology: An Introduction to the Practical Aspects of Ore Treatment and Mineral Recovery, 8th ed. Oxford, Reino Unido: Butterworth-Heinemann, 2016.

[2] M. C. Fuerstenau, G. Jameson and R. Yoon, Froth Flotation: A Century of Innovation. Littleton, Colorado, Estados Unidos: Society for Mining, Metallurgy and Exploration, 2007.

[3] D. C. Montgomery, Design and Analysis of Experiments, 10th ed. Hoboken, New Jersey, Estados Unidos: John Wiley & Sons, 2019.