ENUNCIADO: En un estudio geológico, se quiere investigar si tres tipos diferentes de rocas sedimentarias (arenisca, lutita y caliza) presentan diferencias significativas en su porosidad. La porosidad es una medida importante porque afecta la capacidad de las rocas para almacenar y transmitir agua y petróleo. Se seleccionaron aleatoriamente cinco muestras de cada tipo de roca de diferentes yacimientos geológicos para estudiar su porosidad. ¿Hay diferencias significativas en la porosidad entre los tres tipos de rocas? ¿Cuál de los tipos de rocas presenta mayor porosidad en promedio?

# Datos
arenisca <- c(14, 15, 13, 16, 14)
lutita <- c(6, 7, 8, 5, 6)
caliza <- c(12, 11, 12, 10, 13)

library(tidyr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(hrbrthemes)

datos <- data.frame(
  Tipo_Roca = factor(rep(c("Arenisca", "Lutita", "Caliza"), each = 5)),
  Porosidad = c(arenisca, lutita, caliza)
)

modelo_anova <- aov(Porosidad ~ Tipo_Roca, data = datos)
anova_summary <- summary(modelo_anova)

# Inspeccionar la estructura de anova_summary
str(anova_summary)
## List of 1
##  $ :Classes 'anova' and 'data.frame':    2 obs. of  5 variables:
##   ..$ Df     : num [1:2] 2 12
##   ..$ Sum Sq : num [1:2] 164.8 15.6
##   ..$ Mean Sq: num [1:2] 82.4 1.3
##   ..$ F value: num [1:2] 63.4 NA
##   ..$ Pr(>F) : num [1:2] 4.18e-07 NA
##  - attr(*, "class")= chr [1:2] "summary.aov" "listof"
# Prueba de Tukey para comparaciones múltiples
library(multcomp)
## Loading required package: mvtnorm
## Loading required package: survival
## Loading required package: TH.data
## Loading required package: MASS
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
## 
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
## 
##     geyser
comparaciones <- glht(modelo_anova, linfct = mcp(Tipo_Roca = "Tukey"))
tukey_result <- summary(comparaciones)

# Mostrar respuestas como comentarios en el código
# ¿Hay diferencias significativas en la porosidad entre los tres tipos de rocas?
# Respuesta:
if (anova_summary[[1]]["Tipo_Roca", "Pr(>F)"] < 0.05) {
  cat("Sí, hay diferencias significativas en la porosidad entre los tres tipos de rocas.\n")
} else {
  cat("No, no hay diferencias significativas en la porosidad entre los tres tipos de rocas.\n")
}
## Sí, hay diferencias significativas en la porosidad entre los tres tipos de rocas.
# ¿Cuál de los tipos de rocas presenta mayor porosidad en promedio?
# Respuesta:
roca_con_mayor_porosidad <- tukey_result$test$grp[which.max(tukey_result$test$estimate)]
cat("El tipo de roca que presenta mayor porosidad en promedio es:", roca_con_mayor_porosidad, "\n")
## El tipo de roca que presenta mayor porosidad en promedio es:
ggplot(datos, aes(x = Tipo_Roca, y = Porosidad, fill = Tipo_Roca)) +
  geom_boxplot(color = "black", fill = c("#FF5733", "#7EFF99", "#33C7FF")) +
  labs(title = "Porosidad de diferentes tipos de rocas sedimentarias",
       x = "Tipo de Roca",
       y = "Porosidad") +
  theme_ipsum()