Introduccion

En este reporte están los códigos de los resultados de la tesis de Pregrado Elaboracion de una matriz de respuestas biológicas frente a la temperatura e hipoxia para la evaluación de riesgos en cultivo de fondo de Argopecten purpuratus, concha de abanico, en la Bahía de Sechura

Para la ejecución de la tesis se utilizaron los datos del artículo Cueto-Vega et al. 2022 y los datos recopilados por Aguirre-Velarde durante la mortalidad de concha de abanico del 2019.

Programa de monitoreo Parámetro ambiental Periodo de registro
Cueto-Vega et al.2022 Temperatura y Saturacion OD 07/11/2013-07/10/2015 & 23/03/2017-07/02/2018
Aguirre-Velarde Temperatura y Saturacion OD 08/01/2019-26/03/2019

Limpiando los datos

Para limpiar las base de datos se seguiran los siguientes pasos:

  1. Uniformizar el formato de las horas: timezone UTC, con el nombre Hora_Lima
  2. Asignar el mismo nombre a la variable temperatura de fondo: Temp_fond
  3. Asignar el mismo nombre a la variable saturacion de oxigeno disuelto: DO_sat
  4. En caso haya mas de un dato por hora, btener un valor promedio
  5. Verificar si hay filas duplicadas, valores NA, valores negativos.
  6. Asignar una columna con el nombre de la base de datos de origen.

Limpieza de bdd: Cueto-Vega et al. 2022

constante_loggers <- read_csv("datos/bd-ARTURO-PICES_Sechura_Stressors/CONSTANTE_loggers_historico.csv") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%Y-%m-%d %H:%M:%S", tz = "UTC"),
    Temp_fond = Temp  
    ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
    ) 

valores_duplicados <- constante_loggers$Hora_Lima[duplicated(constante_loggers$Hora_Lima)]
print(unique(valores_duplicados)) 

colSums(is.na(constante_loggers))  
eliminar <- which(apply(is.na(constante_loggers), 1, any)) #Hay 11821 filas que no tiene datos de DO_sat
constante_loggers <- constante_loggers[-eliminar, ] 
colSums(is.nan(as.matrix(constante_loggers)))  
any(constante_loggers < 0, na.rm = TRUE)
constante_loggers <- filter(constante_loggers, DO_sat >= 0, DO_sat <=100, !is.na(DO_sat))

constante_loggers <- constante_loggers %>%
  mutate(
    bdd = "Cueto-Vega_2022",
    Zona = "Constante") 

Limpeza de bdd: Aguirre-Velarde 2019 Los datos recopilados por Aguirre-Velarde en el 2019 estan conformados por dos archivos csv:

  • Constante_loggers.csv (08 enero 2019 - 04 marzo 2019)
### BDD Constante_loggers ####
constante_TDO <- read.csv("datos/Informe_SechuraMort2019/Constante_loggers.csv", header = TRUE, dec = ".", sep = ",") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%d/%m/%Y %H:%M", tz="UTC"),
    Temp_fond = Temp  
    ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
    )

valores_duplicados <- constante_TDO$Hora_Lima[duplicated(constante_TDO$Hora_Lima)]
print(unique(valores_duplicados)) 

colSums(is.na(constante_TDO))  
which(apply(is.na(constante_TDO), 1, any)) #La fila 1321 no tiene datos
constante_TDO <- constante_TDO[-1321, ]

colSums(is.nan(as.matrix(constante_TDO)))  

any(constante_TDO < 0, na.rm = TRUE)

constante_TDO <- constante_TDO %>%
  mutate(
    bdd = "Constante_TDO",
    Zona = "Constante")  
  • Constante_multi.csv (05 marzo - 26 de marzo 2019)

En esta base de datos, el oxígeno esta en mg/L, por lo que se debe convertir DO_c (mg/l) en DO_sat (%). Para ello, se seguirán las ecuaciones propuestas por Benson y Krause, 1984; utilizadas por YDOC: empresa holandesa especializada en mediciones por data loggers.

### BDD constante_multi ######
constante_multi <- read.csv("datos/Informe_SechuraMort2019/constante_multi.csv", 
                            header = TRUE, dec = ".", sep = ",") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%d/%m/%Y %H:%M:%S", tz="UTC"),
    Hora_Lima = make_datetime(year(Hora_Lima), month(Hora_Lima), day(Hora_Lima), hour(Hora_Lima)),
    DO_c = DO_fond,  
    Temp_fond = T_fond,
    Temp_kelvin = Temp_fond + 273.15  # Convertir temperatura a Kelvin
  ) %>%
  select(Hora_Lima, Temp_fond, Temp_kelvin, DO_c) %>%
  group_by(Hora_Lima) %>%
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_c = mean(DO_c, na.rm = TRUE),
    Temp_kelvin=mean(Temp_kelvin, na.rm=TRUE)
  )

valores_duplicados <- constante_multi$Hora_Lima[duplicated(constante_multi$Hora_Lima)]
print(unique(valores_duplicados))

colSums(is.na(constante_multi))
eliminar <- which(apply(is.na(constante_multi), 1, any))
constante_multi <- constante_multi[-eliminar,] 
colSums(is.nan(as.matrix(constante_multi)))

any(constante_TDO < 0, na.rm = TRUE)

## Convertir DO_c (mg/l) en DO_sat (%) siguiendo ecuaciones de Benson and Krause, 1984
# Definir salinidad en ppt (g/kg)
SAL <- 35

# Calcular DO_C (corrigiendo por salinidad)
constante_multi <- constante_multi %>%
  mutate(
    DO_C = DO_c * exp(-1 * SAL * (0.017674 + (-10.754 + 2140.7 / Temp_kelvin) / Temp_kelvin))
  )

# Calcular DO saturado en mg/L
constante_multi <- constante_multi %>%
  mutate(
    DO_sat_mgL = exp(-139.34411 + (1.575701e5 + (-6.642308e7 + 
                                                   (1.2438e10 - 8.621949e11 / Temp_kelvin) / Temp_kelvin) / Temp_kelvin) / Temp_kelvin) *
      exp(-1 * SAL * (0.017674 + (-10.754 + 2140.7 / Temp_kelvin) / Temp_kelvin))
  )

# Calcular DO saturado en % 
constante_multi <- constante_multi %>%
  mutate(
    DO_sat = (DO_C / DO_sat_mgL) * 100
  ) %>%
select(Hora_Lima, Temp_fond, DO_sat) 

#Agregar columnas bdd
constante_multi <- constante_multi %>%
  mutate(
    bdd = "Constante_multi",
    Zona = "Constante") 

Finalmente, las bases de datos se unirán en una sola, la cual será llamada “constante”. En esta nueva bdd, se agregará la columna “Mortalidad”.

  • Mortalidad 2015: 21 febrero - 02 marzo - 15 marzo 2015
  • Mortalidad 2019: 19 febrero - 04 marzo - 13 marzo 2019
  • No mortalidad: resto de datos
barrancos <- read_csv("datos/bd-ARTURO-PICES_Sechura_Stressors/BARRANCOS_loggers_historico.csv") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%Y-%m-%d %H:%M:%S", tz = "UTC"),
    Temp_fond = Temp  
  ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
  ) 
  valores_duplicados <- barrancos$Hora_Lima[duplicated(barrancos$Hora_Lima)]
  a <- colSums(is.na(barrancos))  
  eliminar <- which(apply(is.na(barrancos), 1, any)) 
  barrancos <- barrancos[-eliminar, ] 
  a <- colSums(is.nan(as.matrix(barrancos)))  
  a <- any(barrancos < 0, na.rm = TRUE)
  barrancos <- filter(barrancos, DO_sat >= 0, DO_sat <=100, !is.na(DO_sat))
  barrancos <- barrancos %>%
    mutate(
      bdd = "Cueto-Vega_2022",
      Zona = "Barrancos")  

  barrancos_filtr <- barrancos %>%
  filter(Hora_Lima >= as.POSIXct("2015-02-21", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-15", tz="UTC"))
constante <-  bind_rows(constante_loggers, constante_TDO, constante_multi) 

total <-  bind_rows(constante, barrancos_filtr) 

total <- total %>%
  mutate(
    Year = format(Hora_Lima, "%Y"),  # Extraer el año
    Mortalidad = case_when(
      (Zona == "Barrancos" & Hora_Lima >= as.POSIXct("2015-02-21", tz = "UTC") & Hora_Lima < as.POSIXct("2015-03-15", tz = "UTC")) ~ "Mortalidad 2015 - Barrancos",
      (Zona == "Constante" & Hora_Lima >= as.POSIXct("2015-02-21", tz = "UTC") & Hora_Lima < as.POSIXct("2015-03-15", tz = "UTC")) ~ "Mortalidad 2015 - Constante",
      (Zona == "Constante" & Hora_Lima >= as.POSIXct("2019-02-19", tz = "UTC") & Hora_Lima < as.POSIXct("2019-03-13", tz = "UTC")) ~ "Mortalidad 2019 - Constante",
      TRUE ~ "No Mortalidad"
    )
  )

# Contar observaciones por categoría de Mortalidad y Zona
conteo_obs <- total %>%
  group_by(Mortalidad) %>%
  summarise(Conteo = n(), .groups = "drop")

# Ver los resultados
print(conteo_obs)

Visualizacion de datos:

Mortalidad 2015 y 2019

De oxígeno disuelto y temperatura, en fondo, durante la mortalidad 2015 y 2019

Diferencias durante la Mortalidad 2015: Barrancos vs Constante??

# Función para agregar grupos según huecos mayores a 24 horas
agregar_grupos <- function(data) {
  data <- data %>%
    arrange(Hora_Lima) %>%  # Asegúrate de que esté ordenado por tiempo
    mutate(
      time_diff = as.numeric(difftime(Hora_Lima, lag(Hora_Lima), units = "hours")),
      group = cumsum(ifelse(is.na(time_diff) | time_diff > 24, 1, 0))
    )
  return(data)
}

#Periodos a graficar 
barrancos_2015 <- barrancos %>%
  filter(Hora_Lima >= as.POSIXct("2015-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-18", tz="UTC"))

constante_2015 <- constante %>%
  filter(Hora_Lima >= as.POSIXct("2015-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-18", tz="UTC"))

constante_2019 <- constante %>%
  filter(Hora_Lima >= as.POSIXct("2019-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2019-03-18", tz="UTC"))

# Aplicar la función a los datasets
barrancos_2015 <- agregar_grupos(barrancos_2015)
constante_2015 <-  agregar_grupos(constante_2015)
constante_2019 <- agregar_grupos(constante_2019)

# Actualizar los gráficos para usar 'group'
grafico_barrancos_2015 <- ggplot(barrancos_2015, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2015-03-02", tz = "UTC"),
                xmax = as.POSIXct("2015-03-14", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24.4, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2015-01-17", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") +  
  labs( x="",
    y = "Saturación de oxígeno (%)",
    title = "Mortalidad 2015 - Barrancos") +
  theme_minimal(base_size = 12) 

grafico_constante_2015 <- ggplot(constante_2015, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2015-03-02", tz = "UTC"),
                xmax = as.POSIXct("2015-03-14", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24.4, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2015-01-18", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") +  
  labs( x= "",
    y = "Saturación de oxígeno (%)", title = "Mortalidad 2015 - Constante") +
  theme_minimal(base_size = 12) 

grafico_constante_2019 <- ggplot(constante_2019, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2019-03-04", tz = "UTC"),
                xmax = as.POSIXct("2019-03-13", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2019-01-16", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") + 
  labs(y = "Saturación de oxígeno (%)", title = "Mortalidad 2019", x = "Tiempo (día/mes)") +
  theme_minimal(base_size = 12) 

# Combinar los gráficos
grid.arrange(
  grafico_barrancos_2015, 
  grafico_constante_2015, 
  grafico_constante_2019, 
  ncol = 1)

Análisis estadísticos

ver cuantos datos por grupo : cuantos registros por hora para cada tipo de mortalidad (histograma) ver normalidad de los datos por grupo

Deberia hacer bootstrapping?

Para realizar el análisis estadístico, se llevará a cabo un análisis preliminar para determinar si los datos cumplen con los requisitos para realizar análisis paramétricos o no paramétricos. Este análisis preliminar incluirá las pruebas de normalidad (Shapiro-Wilk) y homogeneidad de varianzas (Levene). Dependiendo de los resultados de este análisis preliminar, se emplearán las pruebas estadísticas adecuadas para determinar si existen diferencias significativas (p-valor < 0.05) durante el tiempo de muestreo. Si los datos cumplen con los supuestos de normalidad y homogeneidad de varianzas, se utilizará el análisis de varianza (ANOVA). En caso contrario, se emplearán pruebas no paramétricas como la prueba de Kruskal-Wallis. Los análisis y gráficos serán realizados en R Studio (versión 4. 3. 0; R Core Team, 2023).

Normalidad - Prueba de Shapiro-Wilk

Resultados

# Categorías únicas de mortalidad
categorias <- c("Mortalidad 2015 - Barrancos","Mortalidad 2015 - Constante","Mortalidad 2019 - Constante")

# Función para evaluar cada categoría
shapiro <- function(categoria, data) {
  # Filtrar el grupo
  datos <- data %>% filter(Mortalidad == categoria)
  
  # Normalidad: Shapiro-Wilk
  shapiro_result <- shapiro.test(datos$DO_sat)
  print(paste("Prueba de Shapiro-Wilk para", categoria, ":", shapiro_result$p.value))
  
}

# Aplicar la función a cada categoría
walk(categorias, ~ shapiro(.x, total))
## [1] "Prueba de Shapiro-Wilk para Mortalidad 2015 - Barrancos : 8.25766075342584e-14"
## [1] "Prueba de Shapiro-Wilk para Mortalidad 2015 - Constante : 2.85939201546272e-09"
## [1] "Prueba de Shapiro-Wilk para Mortalidad 2019 - Constante : 3.45117739406515e-16"
datos_nomortalidad<- total %>%
  filter(Mortalidad == "No Mortalidad")
kolmogorov_result <- ks.test(x=datos_nomortalidad$DO_sat,y='pnorm',alternative='two.sided')
  print(paste("Prueba de Kolmogorov-Smirnov para el periodo de No Mortalidad:",
            format(kolmogorov_result$p.value, scientific = TRUE)))
## [1] "Prueba de Kolmogorov-Smirnov para el periodo de No Mortalidad: 0e+00"

Plots

# Categorías únicas de mortalidad
categorias <- c("Mortalidad 2015 - Barrancos","Mortalidad 2015 - Constante","Mortalidad 2019 - Constante", "No Mortalidad")
# Función para procesar cada categoría
plots <- function(categoria, data) {
  # Filtrar el grupo
  datos <- data %>% filter(Mortalidad == categoria)
  
  # Curva de densidad
  densidad <- ggplot(datos, aes(x = DO_sat)) +
    geom_density(fill = "#56B4E9", alpha = 0.5, color = "#0072B2", size = 1.2) +
    labs(
      title = paste("Curva de densidad -", categoria),
      x = "Saturación de Oxígeno (DO_sat)",
      y = "Densidad"
    ) +
    theme_minimal(base_size = 14) +
    theme(
      plot.title = element_text(face = "bold", size = 16),
      axis.title = element_text(size = 14)
    )

  # Boxplot horizontal
  boxplot <- ggplot(datos, aes(x = DO_sat, y = "")) +
    geom_boxplot(fill = "#E69F00", color = "black", alpha = 0.7, width = 0.3) +
    labs(x = "Saturación de Oxígeno (DO_sat)", y = "") +
    theme_minimal(base_size = 14) +
    theme(
      axis.title.y = element_blank(),
      axis.text.y = element_blank(),
      axis.ticks.y = element_blank(),
      plot.title = element_blank()
    )

  # Combinar el gráfico de densidad y el boxplot
  combinado <- densidad / boxplot + plot_layout(heights = c(3, 1))
  print(combinado)
}

# Aplicar la función a cada categoría
walk(categorias, ~ plots(.x, total))

Homogeneidad de varianzas - Prueba de Levene

Resultados

# Homogeneidad de varianzas: Prueba de Levene
levene_result <- leveneTest(DO_sat ~ Mortalidad, data = total)
# Extraer el valor p del resultado
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
# Crear un mensaje personalizado
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")
## Prueba de Levene para homogeneidad de varianzas: p = 1.29e-84

Plots

ggplot(total, aes(x = Mortalidad, y = DO_sat, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) + # Sin outliers para no duplicar puntos
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Dispersion de SatOD por Mortalidad",
    x = "Mortalidad",
    y = ""
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

ggplot(total, aes(x = DO_sat, fill = Mortalidad)) +
  geom_density(alpha = 0.6) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Densidad de DO_sat por Mortalidad",
    x = "(DO_sat)",
    y = "Densidad"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.title = element_blank()
  )

Pruebas No Parametricas

Si los datos no son normales o no cumplen la homogeneidad: Usar la prueba de Kruskal-Wallis seguida de un análisis post-hoc (Dunn o Wilcoxon) para comparaciones múltiples. comparacion con unequal variances??

# # Kruskal-Wallis
kruskal_result <- kruskal.test(DO_sat ~ Mortalidad, data = total)
kruskal_result
## 
##  Kruskal-Wallis rank sum test
## 
## data:  DO_sat by Mortalidad
## Kruskal-Wallis chi-squared = 800.2, df = 3, p-value < 2.2e-16
# Post-hoc con Dunn
dunn_result <- dunnTest(DO_sat ~ Mortalidad, data = total, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Sat_OD entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
Resultados del Test de Dunn
Comparaciones de Sat_OD entre grupos de Mortalidad
Grupos Comparados Estadístico Z P-valor (sin ajustar) P-valor (ajustado)
Mortalidad 2015 - Barrancos - Mortalidad 2015 - Constante −16.722 0.000 0.000
Mortalidad 2015 - Barrancos - Mortalidad 2019 - Constante 2.694 0.007 0.042
Mortalidad 2015 - Constante - Mortalidad 2019 - Constante 19.150 0.000 0.000
Mortalidad 2015 - Barrancos - No Mortalidad −18.120 0.000 0.000
Mortalidad 2015 - Constante - No Mortalidad 5.219 0.000 0.000
Mortalidad 2019 - Constante - No Mortalidad −21.282 0.000 0.000

Bootstrapping?

Varaibilidad Diaria de la Saturación OD

Para el análisis de datos, primero se realizará la caracterización ambiental de los registros hipóxicos en Constante. Para ello se analizará la variabilidad diaria de la saturación de OD en el fondo, los registros se clasificarán entre día (06:00 – 17:59) y noche (18:00 – 05:59), y se representarán mediante diagrama de cajas. Para evaluar la variabilidad del ciclo diario se ajustará una función sinusoidal a las medianas del análisis del diagrama de caja, con el fin de determinar y comparar la amplitud y la fase del ciclo diario durante el tiempo de muestreo. Este análisis sigue la metodología planteada por Igarza et al. (2024).

# Extraer solo la Hora en una nueva columna
total <- total %>%
  mutate(
    Hora = as.integer(format(Hora_Lima, "%H")),
    DiaNoche = ifelse(Hora >= 6 & Hora <= 17, "Día", "Noche")
  )

# Definir los colores
colores <- c("Día" = "gray100", "Noche" = "gray80")

# Crear el gráfico con boxplots por cada hora
ggplot(total, aes(x = factor(Hora), y = DO_sat, fill = DiaNoche)) +
  geom_boxplot(width = 0.6, alpha = 0.8, outlier.alpha = 0.5, outlier.size = 1) +
  facet_wrap(~ Mortalidad, ncol = 2) +  # Una faceta por cada periodo de mortalidad
  labs(
    x = "Hora del Día",
    y = "Saturación OD (%)",
    fill = "Momento del Día",
    title = "Variabilidad Diara de Saturación de Oxígeno"
  ) +
  scale_x_discrete(breaks = seq(0, 23, by = 2)) +
  scale_fill_manual(values = colores) +
  geom_hline(yintercept = 24.4, linetype = "dashed", color = "red", size = 0.5) +
  theme_minimal() +
  theme(
    strip.background = element_rect(fill = "gray95", color = "black"),  # Fondo de las facetas
    strip.text = element_text(face = "bold", size = 12),  # Texto en las facetas
    axis.text = element_text(size = 10),  # Tamaño de texto de los ejes
    axis.title = element_text(size = 12),  # Tamaño de texto de títulos de ejes
    panel.grid.major = element_blank(),  # Quitar líneas de grilla mayor
    panel.grid.minor = element_blank(),  # Quitar líneas de grilla menor
    axis.line = element_line(color = "black"),  # Añadir líneas de los ejes
    axis.ticks = element_line(color = "black")  # Añadir marcas en los ejes
  )

# 1. Calcular la mediana de DO_sat por Hora y Mortalidad
mediana_por_hora <- total %>%
  group_by(Mortalidad, Hora) %>%
  summarise(
    Mediana_DO_sat = median(DO_sat, na.rm = TRUE),
    .groups = "drop"
  )

# 2. Definir la función sinusoidal
sinusoidal <- function(x, amplitud, frecuencia, fase, desplazamiento) {
  amplitud * sin(frecuencia * x + fase) + desplazamiento
}

# 3. Ajustar la función sinusoidal a los datos
ajustes <- mediana_por_hora %>%
  group_by(Mortalidad) %>%
  summarise(
    # Calcular parámetros iniciales
    amplitud_inicio = (max(Mediana_DO_sat, na.rm = TRUE) - min(Mediana_DO_sat, na.rm = TRUE)) / 2,
    desplazamiento_inicio = mean(Mediana_DO_sat, na.rm = TRUE),
    ajuste = list(
      nlsLM(
        Mediana_DO_sat ~ sinusoidal(Hora, amplitud, frecuencia, fase, desplazamiento),
        data = cur_data(),
        start = list(
          amplitud = amplitud_inicio,
          frecuencia = 2 * pi / 24, # Frecuencia para ciclo de 24 horas
          fase = 0, # Inicialmente sin desplazamiento
          desplazamiento = desplazamiento_inicio
        )
      )
    ),
    .groups = "drop"
  )

# 4. Extraer los parámetros ajustados y corregir amplitud y fase
parametros <- ajustes %>%
  mutate(
    coeficientes = map(ajuste, coef)
  ) %>%
  select(Mortalidad, coeficientes) %>%
  unnest_wider(coeficientes) %>%
  mutate(
    Amplitud = abs(amplitud), # Asegurar amplitud positiva
    Fase = ifelse(amplitud < 0, fase + pi, fase), # Corregir fase si amplitud era negativa
    Horamax = (-Fase / frecuencia) %% 24 # Calcular la hora del máximo y asegurar 0-24
  ) %>%
  select(Mortalidad, Amplitud, Frecuencia = frecuencia, Fase, Desplazamiento = desplazamiento, Horamax)

# Imprimir los parámetros ajustados
print(parametros)
## # A tibble: 4 × 6
##   Mortalidad                  Amplitud Frecuencia  Fase Desplazamiento Horamax
##   <chr>                          <dbl>      <dbl> <dbl>          <dbl>   <dbl>
## 1 Mortalidad 2015 - Barrancos     8.62      0.324  3.30           15.4   13.8 
## 2 Mortalidad 2015 - Constante    12.1       0.353 -2.88           46.0    8.16
## 3 Mortalidad 2019 - Constante     6.92      0.310  3.24           12.6   13.6 
## 4 No Mortalidad                   3.46      0.298  3.24           33.5   13.1
# 5. Crear datos ajustados con la onda sinusoidal
datos_ajustados <- mediana_por_hora %>%
  left_join(parametros, by = "Mortalidad") %>%
  mutate(
    Ajuste = Amplitud * sin(Frecuencia * Hora + Fase) + Desplazamiento
  )

# 6. Graficar datos reales y ajustados con escala fija de 0 a 100
ggplot(datos_ajustados, aes(x = Hora)) +
  geom_line(aes(y = Ajuste, color = Mortalidad), linetype = "dashed") +
  geom_point(aes(y = Mediana_DO_sat, color = Mortalidad), size = 1) +
  facet_wrap(~ Mortalidad, scales = "fixed") +  # Escala fija en Y
  scale_y_continuous(limits = c(0, 60)) +  # Fijar límites de 0 a 100
  labs(
    title = "Ajuste de función sinusoidal",
    x = "Hora del día",
    y = "Mediana de Saturación de Oxígeno (DO_sat)"
  ) +
  theme_minimal()

# 7. Crear datos ajustados sin desplazamiento vertical (solo amplitud y fase)
datos_ajustados_sin_d <- mediana_por_hora %>%
  left_join(parametros, by = "Mortalidad") %>%
  mutate(
    Ajuste_sin_d = Amplitud * sin(Frecuencia * Hora + Fase)  # Eliminar el desplazamiento vertical
  )

# 8. Graficar las ondas sinusoidales sin desplazamiento vertical
ggplot(datos_ajustados_sin_d, aes(x = Hora, y = Ajuste_sin_d, color = Mortalidad)) +
  geom_line(size = 1, linetype = "solid") +
  labs(
    title = "Comparación de ondas sinusoidales",
    x = "Hora del día",
    y = "Oscilación relativa de DO_sat"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    legend.position = "bottom",
    legend.title = element_blank()
  )

La amplitud indica cuánto varía la saturación de oxígeno a lo largo del día, desde el nivel medio (Desplazamiento) hasta los picos (positivos o negativos). Es una medida de la variabilidad diaria:

Mayor amplitud → Mayor variación diaria entre día y noche. Menor amplitud → Ciclo diario menos marcado (saturación más estable).

La frecuencia está relacionada con el número de ciclos completados en un período de tiempo. Interpretación: La frecuencia debería ser aproximadamente 0.2618 si las oscilaciones ocurren exactamente cada 24 horas. Tus resultados tienen ligeras diferencias:

  • Mortalidad 2015 - Constante (0.353): Frecuencia un poco mayor, lo que podría indicar oscilaciones más rápidas (ligeramente desfasadas del ciclo diario perfecto).

  • No Mortalidad (0.298): Frecuencia más baja, lo que sugiere oscilaciones más lentas y un ciclo más “extendido”.

En general, estas pequeñas diferencias podrían deberse a ruido o a fenómenos biológicos que desvíen el ciclo de un patrón estrictamente diario.

La fase indica el desplazamiento horizontal de la onda sinusoidal, es decir, en qué momento del día ocurre el máximo o mínimo de saturación.

Indicadores de hipoxia

Se evaluará la variabilidad de hipoxia mediante los siguientes indicadores: el porcentaje de registros hipóxicos, las horas de hipoxia al día, la mediana de saturación de OD al día y el valor mínimo de saturación de OD al día.

Después del análisis de la variabilidad del ciclo diario de saturación de OD, se realizará el análisis de los eventos hipóxicos. Para determinar un evento hipóxico, este debe ser igual o inferior al 24.4% de saturación de OD y durar al menos seis horas consecutivas (Shields y Weidman, 2008).

Numero de horas hipoxicas al dia

Numero de horas hipoxicas al dia:

# Función para agregar columna de hipoxia
agregar_columna_hipoxia <- function(data) {
  data$Hipoxia <- ifelse(data$DO_sat <= 24.4, 1, 0)
  return(data)
}

total <- agregar_columna_hipoxia(total)

# Función para calcular horas de hipoxia por día
calcular_horas_hipoxia <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(Horas_Hipoxia = sum(Hipoxia), .groups = 'drop')
}

horas_hipoxicas <- calcular_horas_hipoxia(total)

# Normalidad de los datos
horas_hipoxicas %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(Horas_Hipoxia)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Barrancos : p = 0.0238
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Constante : p = 2.25e-05
## Prueba de Shapiro-Wilk para Mortalidad 2019 - Constante : p = 0.00032
## Prueba de Shapiro-Wilk para No Mortalidad : p = 5.03e-28
# Homogeneidad de los datos
levene_result<- leveneTest(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas)
# Extraer el valor p del resultado
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)

# Crear un mensaje personalizado
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")
## Prueba de Levene para homogeneidad de varianzas: p = 0.659
# Kruskal-Wallis
kruskal_result <- kruskal.test(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas)
print(kruskal_result)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Horas_Hipoxia by Mortalidad
## Kruskal-Wallis chi-squared = 29.169, df = 3, p-value = 2.063e-06
# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Horas Hipoxicas entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
Resultados del Test de Dunn
Comparaciones de Horas Hipoxicas entre grupos de Mortalidad
Grupos Comparados Estadístico Z P-valor (sin ajustar) P-valor (ajustado)
Mortalidad 2015 - Barrancos - Mortalidad 2015 - Constante 3.627 0.000 0.002
Mortalidad 2015 - Barrancos - Mortalidad 2019 - Constante 0.297 0.766 1.000
Mortalidad 2015 - Constante - Mortalidad 2019 - Constante −3.507 0.000 0.003
Mortalidad 2015 - Barrancos - No Mortalidad 3.749 0.000 0.001
Mortalidad 2015 - Constante - No Mortalidad −1.301 0.193 1.000
Mortalidad 2019 - Constante - No Mortalidad 3.696 0.000 0.001

Cual tipo de grafico usar?

# Boxplots
ggplot(horas_hipoxicas, aes(x = Mortalidad, y = Horas_Hipoxia, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Horas Hipóxicas al día",
    x = "",
    y = "Horas"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Violinplot
ggplot(horas_hipoxicas, aes(x = Mortalidad, y = Horas_Hipoxia, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Horas Hipóxicas al día",
    x = "",
    y = "Horas"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Reordenar los niveles de la variable 'Mortalidad'
horas_hipoxicas$Mortalidad <- factor(
  horas_hipoxicas$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)

# Stats + graph
ggbetweenstats(
  data = horas_hipoxicas,
  x = Mortalidad,
  y = Horas_Hipoxia,
  title = NULL, # Elimina el título
  results.subtitle = F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Horas en hipoxia al día",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño de título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  ) +
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00"))

Porcentaje de registros hipóxicos al día

Porcentaje de registros hipóxicos al dia:

# Función para calcular el porcentaje de horas hipóxicas por día
calcular_porcentaje_hipoxia <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(
      Horas_Hipoxia = sum(Hipoxia),  # Contar las horas hipóxicas
      Horas_Totales = n(),  # Contar el número total de registros por día
      Porcentaje = (Horas_Hipoxia / Horas_Totales) * 100,  # Calcular el porcentaje de horas hipóxicas
      .groups = 'drop'
    )
}

# Aplicar la función a tu dataframe
porcentaje_hipoxia <- calcular_porcentaje_hipoxia(total)

# Normalidad de los datos
porcentaje_hipoxia %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(Porcentaje)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Barrancos : p = 0.000592
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Constante : p = 1.45e-05
## Prueba de Shapiro-Wilk para Mortalidad 2019 - Constante : p = 2.91e-05
## Prueba de Shapiro-Wilk para No Mortalidad : p = 7.13e-28
# Homogeneidad de los datos
levene_result<- leveneTest(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")
## Prueba de Levene para homogeneidad de varianzas: p = 0.00132
# Kruskal-Wallis
kruskal_result <- kruskal.test(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia)
print(kruskal_result)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Porcentaje by Mortalidad
## Kruskal-Wallis chi-squared = 52.345, df = 3, p-value = 2.529e-11
# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
Resultados del Test de Dunn
Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad
Grupos Comparados Estadístico Z P-valor (sin ajustar) P-valor (ajustado)
Mortalidad 2015 - Barrancos - Mortalidad 2015 - Constante 3.696 0.000 0.001
Mortalidad 2015 - Barrancos - Mortalidad 2019 - Constante −1.108 0.268 1.000
Mortalidad 2015 - Constante - Mortalidad 2019 - Constante −4.985 0.000 0.000
Mortalidad 2015 - Barrancos - No Mortalidad 3.969 0.000 0.000
Mortalidad 2015 - Constante - No Mortalidad −1.177 0.239 1.000
Mortalidad 2019 - Constante - No Mortalidad 5.993 0.000 0.000
ggplot(porcentaje_hipoxia, aes(x = Mortalidad, y = Porcentaje, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Registros Hipóxicos al día",
    x = "",
    y = "Porcentaje %"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

ggplot(porcentaje_hipoxia, aes(x = Mortalidad, y = Porcentaje, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Registros Hipóxicos al día",
    x = "",
    y = "Porcentaje %"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Reordenar los niveles de la variable 'Mortalidad'
porcentaje_hipoxia$Mortalidad <- factor(
  porcentaje_hipoxia$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)


# Stats + graph
ggbetweenstats(
  data = porcentaje_hipoxia,
  x = Mortalidad,
  y = Porcentaje,
  title = NULL, # Elimina el título
  results.subtitle =F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Registros hipóxicos al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )

Minimo de Sat OD al dia

Minimo de Saturacion de oxígeno al día:

# Función para calcular mínimo de DO_sat por día 
calcular_min_od <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(minimo = min(DO_sat), .groups = 'drop')
}

# Aplicar calcular_min_od a cada conjunto de datos
min_od <- calcular_min_od(total)

# Normalidad de los datos
min_od %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(minimo)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Barrancos : p = 2.85e-05
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Constante : p = 0.325
## Prueba de Shapiro-Wilk para Mortalidad 2019 - Constante : p = 0.000499
## Prueba de Shapiro-Wilk para No Mortalidad : p = 3.28e-16
# Homogeneidad de los datos
levene_result<- leveneTest(minimo ~ Mortalidad, data = min_od)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")
## Prueba de Levene para homogeneidad de varianzas: p = 1.51e-07
# Kruskal-Wallis
kruskal_result <- kruskal.test(minimo ~ Mortalidad, data = min_od)
print(kruskal_result)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  minimo by Mortalidad
## Kruskal-Wallis chi-squared = 58.723, df = 3, p-value = 1.102e-12
# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(minimo ~ Mortalidad, data = min_od, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
Resultados del Test de Dunn
Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad
Grupos Comparados Estadístico Z P-valor (sin ajustar) P-valor (ajustado)
Mortalidad 2015 - Barrancos - Mortalidad 2015 - Constante −3.661 0.000 0.002
Mortalidad 2015 - Barrancos - Mortalidad 2019 - Constante 1.432 0.152 0.913
Mortalidad 2015 - Constante - Mortalidad 2019 - Constante 5.272 0.000 0.000
Mortalidad 2015 - Barrancos - No Mortalidad −4.006 0.000 0.000
Mortalidad 2015 - Constante - No Mortalidad 1.091 0.275 1.000
Mortalidad 2019 - Constante - No Mortalidad −6.508 0.000 0.000
ggplot(min_od, aes(x = Mortalidad, y = minimo, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Minima saturacion de oxígeno al día",
    x = "",
    y = "Saturacion OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

ggplot(min_od, aes(x = Mortalidad, y = minimo, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Minima saturacion de oxígeno al día",
    x = "",
    y = "Saturacion de OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Reordenar los niveles de la variable 'Mortalidad'
min_od$Mortalidad <- factor(
  min_od$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)

# Stats + graph
ggbetweenstats(
  data = min_od,
  x = Mortalidad,
  y = minimo,
  title = NULL, # Elimina el título
  results.subtitle = F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Minima saturación OD al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )

Mediana de Sat OD al dia

Mediana de Saturacion de oxigeno al dia:

# Función para calcular mediana de DO_sat por día y zona
calcular_median_od <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(median= median(DO_sat), .groups = 'drop')
}

# Aplicar calcular_min_od a cada conjunto de datos
med_od <- calcular_median_od(total)

# Normalidad de los datos
med_od %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(median)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Barrancos : p = 0.00683
## Prueba de Shapiro-Wilk para Mortalidad 2015 - Constante : p = 0.2
## Prueba de Shapiro-Wilk para Mortalidad 2019 - Constante : p = 0.143
## Prueba de Shapiro-Wilk para No Mortalidad : p = 8.92e-11
# Homogeneidad de los datos
levene_result<- leveneTest(median ~ Mortalidad, data = med_od)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")
## Prueba de Levene para homogeneidad de varianzas: p = 4.54e-06
# Kruskal-Wallis
kruskal_result <- kruskal.test(median ~ Mortalidad, data = med_od)
print(kruskal_result)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  median by Mortalidad
## Kruskal-Wallis chi-squared = 63.399, df = 3, p-value = 1.104e-13
# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(median ~ Mortalidad, data = med_od, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
Resultados del Test de Dunn
Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad
Grupos Comparados Estadístico Z P-valor (sin ajustar) P-valor (ajustado)
Mortalidad 2015 - Barrancos - Mortalidad 2015 - Constante −3.946 0.000 0.000
Mortalidad 2015 - Barrancos - Mortalidad 2019 - Constante 1.340 0.180 1.000
Mortalidad 2015 - Constante - Mortalidad 2019 - Constante 5.478 0.000 0.000
Mortalidad 2015 - Barrancos - No Mortalidad −4.278 0.000 0.000
Mortalidad 2015 - Constante - No Mortalidad 1.216 0.224 1.000
Mortalidad 2019 - Constante - No Mortalidad −6.672 0.000 0.000
ggplot(med_od, aes(x = Mortalidad, y = median, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Mediana de la saturacion de oxígeno al día",
    x = "",
    y = "Saturacion OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

ggplot(med_od, aes(x = Mortalidad, y = median, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Mediana de la saturacion de oxígeno al día",
    x = "",
    y = "Saturacion de OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Crear el gráficO

med_od$Mortalidad <- factor(
  med_od$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)


# Stats + graph
ggbetweenstats(
  data = med_od,
  x = Mortalidad,
  y = median,
  title = NULL, # Elimina el título
  results.subtitle = FALSE, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Mediana de Saturación OD al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )

Desarrollo de una matriz de respuesas biologicas de A. purpuratus frente a la temperatura e hipoxia

BARRANCOS MORTALIDAD 2015

# Ahora asignamos la categoria de Temp_fond y DO_sat
df_indice <- barrancos_2015

df_indice <- df_indice %>%
  mutate(
    Categoria_T = case_when(
      Temp_fond <= 16 ~ "<=16",
      Temp_fond > 16 & Temp_fond <= 20 ~ "]16-20]",
      Temp_fond > 20 & Temp_fond <= 25 ~ "]20-25]",
      Temp_fond > 25 & Temp_fond <= 29 ~ "]25-29]",
      Temp_fond > 29 ~ ">29"
    ),
    Categoria_DO = case_when(
      DO_sat <= 2 ~ "<=2",
      DO_sat > 2 & DO_sat <= 5 ~ "]2-5]",
      DO_sat > 5 & DO_sat <= 24.4 ~ "]5-24]",
      DO_sat > 24.4 ~ ">24"
    ),
    Categoria_total = paste(Categoria_T, Categoria_DO, sep = ";")
  )

# Identificar los cambios en las categorías de Categoria_total dentro de cada group 
df_indice <- df_indice %>%
  group_by(group) %>%
  mutate(change = Categoria_total != lag(Categoria_total, default = first(Categoria_total))) %>%
  mutate(group_id = cumsum(change)) %>%
  ungroup ()

# Calcular la fecha de inicio y fin de cada grupo de categorías continuas
df_agrupado <- df_indice %>%
  group_by(
    group,
    group_id) %>%
  summarize(
    fecha_inicio = min(Hora_Lima),
    fecha_fin = max(Hora_Lima),
    duracion = as.numeric(difftime(max(Hora_Lima), min(Hora_Lima), units = "hours"))+1,
    Categoria_total = first(Categoria_total),
    Categoria_DO = first (Categoria_DO))

# Agregar columna Hipoxico con valores Hipoxia o Normoxia
df_agrupado <- df_agrupado %>%
 mutate(Hipoxia = ifelse(Categoria_DO %in% c("<=2", "]2-5]","]5-24]"), "Hipoxia", "Normoxia")) #%>%
  #ungroup() #%>% # Eliminar agrupaciones activas
  #select(-group)

# Crear una copia del dataframe original
df_resultado <- df_agrupado

# Identificar periodos menores a 6 horas
df_resultado <- df_resultado %>%
  mutate(is_short = duracion < 6)

# Procesar los bloques
procesar_bloques <- function(df) {
  bloque_id <- 1
  df <- df %>%
    mutate(bloque = 0)  # Inicializamos con 0 para los bloques
  
  for (i in 1:nrow(df)) {
    if (i == 1) {
      # Asignar el primer bloque
      df$bloque[i] <- bloque_id
    } else if (df$group[i] != df$group[i - 1]) {
      # Si cambia el grupo, crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && df$is_short[i]) {
      # Si el periodo actual y el anterior son cortos, pertenecen al mismo bloque
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && !df$is_short[i]) {
      # Si el periodo anterior era corto pero este no, verificamos la duración acumulada
      bloque_duracion <- sum(df$duracion[df$bloque == bloque_id])
      if (bloque_duracion < 6) {
        # Vía B: Ignorar la interrupción y extender el bloque al siguiente
        df$bloque[i] <- bloque_id
      } else {
        # Vía A: Crear un nuevo bloque
        bloque_id <- bloque_id + 1
        df$bloque[i] <- bloque_id
      }
    } else {
      # Crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    }
  }
  
  return(df)
}

df_resultado <- procesar_bloques(df_resultado)

# Calcular resultados finales por bloque
df_final <- df_resultado %>%
  group_by(bloque, group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion_total = sum(duracion),
    Categoria_total = Categoria_total[which.max(duracion)],
    Categoria_DO = Categoria_DO[which.max(duracion)]
  ) %>%
  ungroup()

# Agrupar por bloques consecutivos con el mismo Categoria_total
df_consolidado <- df_final %>%
  mutate(
    grupo_categoria = cumsum(Categoria_total != lag(Categoria_total, default = first(Categoria_total)))
  ) %>%
  group_by(grupo_categoria,group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion = sum(duracion_total),
    Categoria_total = first(Categoria_total),
    Categoria_DO = first(Categoria_DO) # Consideramos la misma lógica para Categoria_DO
  ) %>%
  ungroup()


# Asignar las categorias
df_consolidado <- df_consolidado %>%
  mutate(
    Indice = case_when(
      duracion < 12 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion < 12 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "<=16;]2-5]"~ "Estres fisiologico",
      duracion<12 & Categoria_total =="<=16;<=2" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion<12 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total =="]16-20];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]16-20];<=2" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion <12 & Categoria_total == "]20-25];]5-24]"~"Estres fisiologico",
      duracion<12 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == "25-29];>24" ~ "Sin informacion",
      duracion <12 & Categoria_total == "]25-29];]5-24]"~"Sin informacion",
      duracion<12 & Categoria_total == "]25-29];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]25-29];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == ">29;>24" ~ "Probabilidad de mortalidad",
      duracion <12 & Categoria_total == ">29;5-24]"~ "Letal",
      duracion<12 & Categoria_total== ">29;]2-5]" ~ "Letal",
      duracion<12 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;<=2"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24  & Categoria_total == "]16-20];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];>24"  ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];>24"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 &Categoria_total == "]25-29];]5-24]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];]2-5]"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;>24"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;5-24]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;]2-5]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total  == ">29;<=2"  ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;>24"  ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;<=2" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]2-5]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;>24"~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;5-24]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;]2-5]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]20-25];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == ">29;>24" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;5-24]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >=120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      TRUE ~ "Sin informacion"
    )
  )

# Ordenar el dataframe por fecha de inicio
df_consolidado <- df_consolidado %>% arrange(fecha_inicio)

# Convertir las columnas de fecha a POSIXct si no lo están
df_consolidado$fecha_inicio <- as.POSIXct(df_consolidado$fecha_inicio, tz="UTC")
df_consolidado$fecha_fin <- as.POSIXct(df_consolidado$fecha_fin, tz="UTC")

#Función para calcular el punto medio de un intervalo de fechas
interval_midpoint <- function(start, end) {
  return(start + (end - start) / 2)
}

# Agregar la columna Hora_Lima a df_agrupado usando interval_midpoint
df_consolidado <- df_consolidado %>%
  mutate(Hora_Lima = interval_midpoint(fecha_inicio, fecha_fin))

# Definir los colores de las categorías
colores_categorias <- c("Letal" = "#800000",  # Rojo oscuro
                        "Probabilidad de mortalidad" = "red",
                        "Estres fisiologico" = "orange",
                        "Inocuo" = "green",
                        "Sin informacion" = "grey")


ggplot() +
  # Capa 1: fondo con rectángulos de df_consolidado
  geom_rect(
    data = df_consolidado,
    aes(
      xmin = as.POSIXct(fecha_inicio, tz = "UTC"),
      xmax = as.POSIXct(fecha_fin, tz = "UTC"),
      ymin = -Inf,
      ymax = Inf,
      fill = Indice
    ),
    alpha = 0.8,
    color = NA
  ) +
  scale_fill_manual(values = colores_categorias) +
  
  # Capa 2: líneas de barrancos_2015 con agrupación
  geom_line(
    data = barrancos_2015,
    aes(x = Hora_Lima, y = DO_sat, group = group),
    color = "black"
  ) +
  
  # Capa 3: punto crítico de oxígeno
  geom_text(
    data = data.frame(
      x = as.POSIXct("2015-01-15", tz = "UTC"),
      y = 27,
      label = "Punto crítico de oxígeno"
    ),
    aes(x = x, y = y, label = label),
    color = "red",
    size = 3.5
  ) +
  
  # Capa 4: línea horizontal crítica
  geom_hline(yintercept = 24, color = "red") +
  
  # Tema y personalización
  theme_minimal() +
  scale_x_datetime(breaks = "1 week", date_labels = "%d/%b") +
  labs(x = "", y = "Saturación de oxígeno (%)", title = "Mortalidad 2015 - Barrancos") +
  theme(
    title = element_text(size = 20),
    axis.text.x = element_text(size = 10, color = "black"),
    axis.text.y = element_text(size = 14, color = "black"),
    axis.title.x = element_text(size = 16),
    axis.title.y = element_text(size = 16),
    legend.text = element_text(size = 12),
    legend.title = element_text(size = 14),
    legend.position = "bottom",
    axis.ticks.length = unit(5, "pt"), # Longitud de los ticks
    axis.ticks.x = element_line(color = "black"), # Color de los ticks X
    axis.ticks.y = element_line(color = "black"),  # Color de los ticks Y
    axis.line.x = element_line(color = "black", size = 0.5), # Línea horizontal del eje
    axis.line.y = element_line(color = "black", size = 0.5)  # Línea vertical del eje
  ) +
  
  # Anotaciones adicionales
  annotate(
    "rect",
    xmin = as.POSIXct("2015-03-02", tz = "UTC"),
    xmax = as.POSIXct("2015-03-15", tz = "UTC"),
    ymin = -Inf,
    ymax = Inf,
    alpha = 0,
    color = "#636363",
    size = 0.7,
    linetype = "dashed"
  ) +
  geom_text(
    data = data.frame(
      x = as.POSIXct("2015-03-09", tz = "UTC"),
      y = 98,
      label = "Mortalidad"
    ),
    aes(x = x, y = y, label = label),
    color = "#636363",
    size = 4
  )

CONSTANTE MORTALIDAD 2019

# Ahora asignamos la categoria de Temp_fond y DO_sat
df_indice <- constante_2019

df_indice <- df_indice %>%
  mutate(
    Categoria_T = case_when(
      Temp_fond <= 16 ~ "<=16",
      Temp_fond > 16 & Temp_fond <= 20 ~ "]16-20]",
      Temp_fond > 20 & Temp_fond <= 25 ~ "]20-25]",
      Temp_fond > 25 & Temp_fond <= 29 ~ "]25-29]",
      Temp_fond > 29 ~ ">29"
    ),
    Categoria_DO = case_when(
      DO_sat <= 2 ~ "<=2",
      DO_sat > 2 & DO_sat <= 5 ~ "]2-5]",
      DO_sat > 5 & DO_sat <= 24.4 ~ "]5-24]",
      DO_sat > 24.4 ~ ">24"
    ),
    Categoria_total = paste(Categoria_T, Categoria_DO, sep = ";")
  )

# Identificar los cambios en las categorías de Categoria_total dentro de cada group 
df_indice <- df_indice %>%
  group_by(group) %>%
  mutate(change = Categoria_total != lag(Categoria_total, default = first(Categoria_total))) %>%
  mutate(group_id = cumsum(change)) %>%
  ungroup ()

# Calcular la fecha de inicio y fin de cada grupo de categorías continuas
df_agrupado <- df_indice %>%
  group_by(
    group,
    group_id) %>%
  summarize(
    fecha_inicio = min(Hora_Lima),
    fecha_fin = max(Hora_Lima),
    duracion = as.numeric(difftime(max(Hora_Lima), min(Hora_Lima), units = "hours"))+1,
    Categoria_total = first(Categoria_total),
    Categoria_DO = first (Categoria_DO))

# Agregar columna Hipoxico con valores Hipoxia o Normoxia
df_agrupado <- df_agrupado %>%
 mutate(Hipoxia = ifelse(Categoria_DO %in% c("<=2", "]2-5]","]5-24]"), "Hipoxia", "Normoxia")) #%>%
  #ungroup() #%>% # Eliminar agrupaciones activas
  #select(-group)

# Crear una copia del dataframe original
df_resultado <- df_agrupado

# Identificar periodos menores a 6 horas
df_resultado <- df_resultado %>%
  mutate(is_short = duracion < 6)

# Procesar los bloques
procesar_bloques <- function(df) {
  bloque_id <- 1
  df <- df %>%
    mutate(bloque = 0)  # Inicializamos con 0 para los bloques
  
  for (i in 1:nrow(df)) {
    if (i == 1) {
      # Asignar el primer bloque
      df$bloque[i] <- bloque_id
    } else if (df$group[i] != df$group[i - 1]) {
      # Si cambia el grupo, crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && df$is_short[i]) {
      # Si el periodo actual y el anterior son cortos, pertenecen al mismo bloque
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && !df$is_short[i]) {
      # Si el periodo anterior era corto pero este no, verificamos la duración acumulada
      bloque_duracion <- sum(df$duracion[df$bloque == bloque_id])
      if (bloque_duracion < 6) {
        # Vía B: Ignorar la interrupción y extender el bloque al siguiente
        df$bloque[i] <- bloque_id
      } else {
        # Vía A: Crear un nuevo bloque
        bloque_id <- bloque_id + 1
        df$bloque[i] <- bloque_id
      }
    } else {
      # Crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    }
  }
  
  return(df)
}

df_resultado <- procesar_bloques(df_resultado)

# Calcular resultados finales por bloque
df_final <- df_resultado %>%
  group_by(bloque, group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion_total = sum(duracion),
    Categoria_total = Categoria_total[which.max(duracion)],
    Categoria_DO = Categoria_DO[which.max(duracion)]
  ) %>%
  ungroup()

# Agrupar por bloques consecutivos con el mismo Categoria_total
df_consolidado <- df_final %>%
  mutate(
    grupo_categoria = cumsum(Categoria_total != lag(Categoria_total, default = first(Categoria_total)))
  ) %>%
  group_by(grupo_categoria,group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion = sum(duracion_total),
    Categoria_total = first(Categoria_total),
    Categoria_DO = first(Categoria_DO) # Consideramos la misma lógica para Categoria_DO
  ) %>%
  ungroup()


# Asignar las categorias
df_consolidado <- df_consolidado %>%
  mutate(
    Indice = case_when(
      duracion < 12 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion < 12 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "<=16;]2-5]"~ "Estres fisiologico",
      duracion<12 & Categoria_total =="<=16;<=2" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion<12 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total =="]16-20];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]16-20];<=2" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion <12 & Categoria_total == "]20-25];]5-24]"~"Estres fisiologico",
      duracion<12 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == "25-29];>24" ~ "Sin informacion",
      duracion <12 & Categoria_total == "]25-29];]5-24]"~"Sin informacion",
      duracion<12 & Categoria_total == "]25-29];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]25-29];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == ">29;>24" ~ "Probabilidad de mortalidad",
      duracion <12 & Categoria_total == ">29;5-24]"~ "Letal",
      duracion<12 & Categoria_total== ">29;]2-5]" ~ "Letal",
      duracion<12 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;<=2"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24  & Categoria_total == "]16-20];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];>24"  ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];>24"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 &Categoria_total == "]25-29];]5-24]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];]2-5]"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;>24"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;5-24]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;]2-5]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total  == ">29;<=2"  ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;>24"  ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;<=2" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]2-5]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;>24"~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;5-24]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;]2-5]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]20-25];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == ">29;>24" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;5-24]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >=120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      TRUE ~ "Sin informacion"
    )
  )

# Ordenar el dataframe por fecha de inicio
df_consolidado <- df_consolidado %>% arrange(fecha_inicio)

# Convertir las columnas de fecha a POSIXct si no lo están
df_consolidado$fecha_inicio <- as.POSIXct(df_consolidado$fecha_inicio, tz="UTC")
df_consolidado$fecha_fin <- as.POSIXct(df_consolidado$fecha_fin, tz="UTC")

#Función para calcular el punto medio de un intervalo de fechas
interval_midpoint <- function(start, end) {
  return(start + (end - start) / 2)
}

# Agregar la columna Hora_Lima a df_agrupado usando interval_midpoint
df_consolidado <- df_consolidado %>%
  mutate(Hora_Lima = interval_midpoint(fecha_inicio, fecha_fin))

# Definir los colores de las categorías
colores_categorias <- c("Letal" = "#800000",  # Rojo oscuro
                        "Probabilidad de mortalidad" = "red",
                        "Estres fisiologico" = "orange",
                        "Inocuo" = "green",
                        "Sin informacion" = "grey")

df_consolidado <- df_consolidado %>%
  mutate(fecha_fin = fecha_fin - microseconds(1))  # Restamos 1 segundo para que fecha_fin sea inclusiva

ggplot() +
  # Capa 1: fondo con rectángulos de df_consolidado
  geom_rect(
    data = df_consolidado,
    aes(
      xmin = as.POSIXct(fecha_inicio, tz = "UTC"),
      xmax = as.POSIXct(fecha_fin, tz = "UTC"),
      ymin = -Inf,
      ymax = Inf,
      fill = Indice
    ),
    alpha = 0.8,
    color = NA
  ) +
  scale_fill_manual(values = colores_categorias) +
  
  # Capa 2: líneas de constnate_2019 con agrupación
  geom_line(
    data = constante_2019,
    aes(x = Hora_Lima, y = DO_sat, group = group),
    color = "black"
  ) +
  
  # Capa 3: punto crítico de oxígeno
  geom_text(
    data = data.frame(
      x = as.POSIXct("2019-01-15", tz = "UTC"),
      y = 27,
      label = "Punto crítico de oxígeno"
    ),
    aes(x = x, y = y, label = label),
    color = "red",
    size = 3.5
  ) +
  
  # Capa 4: línea horizontal crítica
  geom_hline(yintercept = 24, color = "red") +
  
  # Tema y personalización
  theme_minimal() +
  scale_x_datetime(breaks = "1 week", date_labels = "%d/%b") +
  labs(x = "", y = "Saturación de oxígeno (%)", title = "Mortalidad 2019 - Constante") +
  theme(
    title = element_text(size = 20),
    axis.text.x = element_text(size = 10, color = "black"),
    axis.text.y = element_text(size = 14, color = "black"),
    axis.title.x = element_text(size = 16),
    axis.title.y = element_text(size = 16),
    legend.text = element_text(size = 12),
    legend.title = element_text(size = 14),
    legend.position = "bottom",
    axis.ticks.length = unit(5, "pt"), # Longitud de los ticks
    axis.ticks.x = element_line(color = "black"), # Color de los ticks X
    axis.ticks.y = element_line(color = "black"),  # Color de los ticks Y
    axis.line.x = element_line(color = "black", size = 0.5), # Línea horizontal del eje
    axis.line.y = element_line(color = "black", size = 0.5)  # Línea vertical del eje
  ) +
  
  # Anotaciones adicionales
  annotate(
    "rect",
    xmin = as.POSIXct("2019-03-04", tz = "UTC"),
    xmax = as.POSIXct("2019-03-13", tz = "UTC"),
    ymin = -Inf,
    ymax = Inf,
    alpha = 0,
    color = "#636363",
    size = 0.7,
    linetype = "dashed"
  ) +
  geom_text(
    data = data.frame(
      x = as.POSIXct("2019-03-10", tz = "UTC"),
      y = 98,
      label = "Mortalidad"
    ),
    aes(x = x, y = y, label = label),
    color = "#636363",
    size = 4
  )

Puntos negativos:

  • Antes del periodo de Mortalidad, no sale “Probabilidad de mortalidad”, por lo que, en ese caso, el sistema de alerta temprana no funciona.

  • Durante la Mortalidad, el periodo de letalidad es muy corto, no abarca el evento entero.

  • Podría ser todo letal, pero la toma de datos durante la mortalidad no fue estrictamente todas las horas, por ende, no cumple con el criterio de duracion >6h… dificil de clasificar dentro de la categoria Letal.

---
title: "Reporte Tesis Pregrado"
subtitle: "Resultados"
output: 
  html_document:
    toc: true
    toc_float: true
    code_folding: hide
    code_download: true
    self_contained: true
author: "Rebeca Campos Cuellar"
date: "2025-01-18"
---
# Introduccion

En este reporte están los códigos de los resultados de la tesis de Pregrado **Elaboracion de una matriz de respuestas biológicas frente a la temperatura e hipoxia para la evaluación de riesgos en cultivo de fondo de *Argopecten purpuratus*, concha de abanico, en la Bahía de Sechura**

Para la ejecución de la tesis se utilizaron los datos del artículo **[Cueto-Vega et al. 2022](https://onlinelibrary.wiley.com/doi/full/10.1111/jwas.12777)** y los datos recopilados por **Aguirre-Velarde** durante la mortalidad de concha de abanico del 2019.
<br>      
<table>
Programa de monitoreo        Parámetro ambiental         Periodo de registro 
---------------------------  -------------------------   --------------------- 
Cueto-Vega et al.2022        Temperatura y Saturacion OD  07/11/2013-07/10/2015                                                                         **&**  23/03/2017-07/02/2018 
Aguirre-Velarde              Temperatura y Saturacion OD  08/01/2019-26/03/2019          

</table>

# Limpiando los datos 
Para limpiar las base de datos se seguiran los siguientes pasos:

 1. Uniformizar el formato de las horas: timezone UTC, con el nombre Hora_Lima
 2. Asignar el mismo nombre a la variable temperatura de fondo: Temp_fond
 3. Asignar el mismo nombre a la variable saturacion de oxigeno disuelto: DO_sat
 4. En caso haya mas de un dato por hora, btener un valor promedio
 5. Verificar si hay filas duplicadas, valores NA, valores negativos.
 6. Asignar una columna con el nombre de la base de datos de origen.

```{r}
#| include = FALSE
library(dplyr)
library(ggplot2)
library(lubridate)
library(readr)
library(sn)
library(gridExtra)
library(knitr)
library(patchwork)
library(car)
library(ggdist) 
library(purrr)
library(FSA)
library(gt)
library(ggstatsplot)
library(minpack.lm)
library(tidyr)
library(plotly)
```
**Limpieza de bdd: Cueto-Vega et al. 2022**
```{r limpiando Cueto-Vega, echo=TRUE,results="hide", message=FALSE, warning=FALSE}
constante_loggers <- read_csv("datos/bd-ARTURO-PICES_Sechura_Stressors/CONSTANTE_loggers_historico.csv") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%Y-%m-%d %H:%M:%S", tz = "UTC"),
    Temp_fond = Temp  
    ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
    ) 

valores_duplicados <- constante_loggers$Hora_Lima[duplicated(constante_loggers$Hora_Lima)]
print(unique(valores_duplicados)) 

colSums(is.na(constante_loggers))  
eliminar <- which(apply(is.na(constante_loggers), 1, any)) #Hay 11821 filas que no tiene datos de DO_sat
constante_loggers <- constante_loggers[-eliminar, ] 
colSums(is.nan(as.matrix(constante_loggers)))  
any(constante_loggers < 0, na.rm = TRUE)
constante_loggers <- filter(constante_loggers, DO_sat >= 0, DO_sat <=100, !is.na(DO_sat))

constante_loggers <- constante_loggers %>%
  mutate(
    bdd = "Cueto-Vega_2022",
    Zona = "Constante") 
```
**Limpeza de bdd: Aguirre-Velarde 2019**
Los datos recopilados por Aguirre-Velarde en el 2019 estan conformados por dos archivos csv:

* Constante_loggers.csv (08 enero 2019 - 04 marzo 2019)
```{r limpiando Constante_loggers, echo=TRUE, results="hide", message=FALSE, warning=FALSE}
### BDD Constante_loggers ####
constante_TDO <- read.csv("datos/Informe_SechuraMort2019/Constante_loggers.csv", header = TRUE, dec = ".", sep = ",") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%d/%m/%Y %H:%M", tz="UTC"),
    Temp_fond = Temp  
    ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
    )

valores_duplicados <- constante_TDO$Hora_Lima[duplicated(constante_TDO$Hora_Lima)]
print(unique(valores_duplicados)) 

colSums(is.na(constante_TDO))  
which(apply(is.na(constante_TDO), 1, any)) #La fila 1321 no tiene datos
constante_TDO <- constante_TDO[-1321, ]

colSums(is.nan(as.matrix(constante_TDO)))  

any(constante_TDO < 0, na.rm = TRUE)

constante_TDO <- constante_TDO %>%
  mutate(
    bdd = "Constante_TDO",
    Zona = "Constante")  
``` 
* Constante_multi.csv (05 marzo - 26 de marzo 2019)

En esta base de datos, el oxígeno esta en mg/L, por lo que se debe convertir DO_c (mg/l) en DO_sat (%). Para ello, se seguirán las ecuaciones propuestas por Benson y Krause, 1984; utilizadas por [YDOC](https://ydoc.biz/dissolved-oxygen-measurements/): empresa holandesa especializada en mediciones por data loggers.
```{r limpiando Constante_multi, echo=TRUE, results="hide", message=FALSE, warning=FALSE}
### BDD constante_multi ######
constante_multi <- read.csv("datos/Informe_SechuraMort2019/constante_multi.csv", 
                            header = TRUE, dec = ".", sep = ",") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%d/%m/%Y %H:%M:%S", tz="UTC"),
    Hora_Lima = make_datetime(year(Hora_Lima), month(Hora_Lima), day(Hora_Lima), hour(Hora_Lima)),
    DO_c = DO_fond,  
    Temp_fond = T_fond,
    Temp_kelvin = Temp_fond + 273.15  # Convertir temperatura a Kelvin
  ) %>%
  select(Hora_Lima, Temp_fond, Temp_kelvin, DO_c) %>%
  group_by(Hora_Lima) %>%
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_c = mean(DO_c, na.rm = TRUE),
    Temp_kelvin=mean(Temp_kelvin, na.rm=TRUE)
  )

valores_duplicados <- constante_multi$Hora_Lima[duplicated(constante_multi$Hora_Lima)]
print(unique(valores_duplicados))

colSums(is.na(constante_multi))
eliminar <- which(apply(is.na(constante_multi), 1, any))
constante_multi <- constante_multi[-eliminar,] 
colSums(is.nan(as.matrix(constante_multi)))

any(constante_TDO < 0, na.rm = TRUE)

## Convertir DO_c (mg/l) en DO_sat (%) siguiendo ecuaciones de Benson and Krause, 1984
# Definir salinidad en ppt (g/kg)
SAL <- 35

# Calcular DO_C (corrigiendo por salinidad)
constante_multi <- constante_multi %>%
  mutate(
    DO_C = DO_c * exp(-1 * SAL * (0.017674 + (-10.754 + 2140.7 / Temp_kelvin) / Temp_kelvin))
  )

# Calcular DO saturado en mg/L
constante_multi <- constante_multi %>%
  mutate(
    DO_sat_mgL = exp(-139.34411 + (1.575701e5 + (-6.642308e7 + 
                                                   (1.2438e10 - 8.621949e11 / Temp_kelvin) / Temp_kelvin) / Temp_kelvin) / Temp_kelvin) *
      exp(-1 * SAL * (0.017674 + (-10.754 + 2140.7 / Temp_kelvin) / Temp_kelvin))
  )

# Calcular DO saturado en % 
constante_multi <- constante_multi %>%
  mutate(
    DO_sat = (DO_C / DO_sat_mgL) * 100
  ) %>%
select(Hora_Lima, Temp_fond, DO_sat) 

#Agregar columnas bdd
constante_multi <- constante_multi %>%
  mutate(
    bdd = "Constante_multi",
    Zona = "Constante") 

```
Finalmente, las bases de datos se unirán en una sola, la cual será llamada **"constante".**
En esta nueva bdd, se agregará la columna "Mortalidad".  

* Mortalidad 2015: 21 febrero - **02 marzo - 15 marzo 2015**
* Mortalidad 2019: 19 febrero - **04 marzo - 13 marzo 2019**
* No mortalidad: resto de datos
```{r, echo=TRUE, results="hide", message=FALSE, warning=FALSE}
barrancos <- read_csv("datos/bd-ARTURO-PICES_Sechura_Stressors/BARRANCOS_loggers_historico.csv") %>%
  mutate(
    Hora_Lima = as.POSIXct(Hora_Lima, format = "%Y-%m-%d %H:%M:%S", tz = "UTC"),
    Temp_fond = Temp  
  ) %>%
  select(Hora_Lima, Temp_fond, DO_sat) %>%
  group_by(Hora_Lima) %>% 
  summarise(
    Temp_fond = mean(Temp_fond, na.rm = TRUE),
    DO_sat = mean(DO_sat, na.rm = TRUE)
  ) 
  valores_duplicados <- barrancos$Hora_Lima[duplicated(barrancos$Hora_Lima)]
  a <- colSums(is.na(barrancos))  
  eliminar <- which(apply(is.na(barrancos), 1, any)) 
  barrancos <- barrancos[-eliminar, ] 
  a <- colSums(is.nan(as.matrix(barrancos)))  
  a <- any(barrancos < 0, na.rm = TRUE)
  barrancos <- filter(barrancos, DO_sat >= 0, DO_sat <=100, !is.na(DO_sat))
  barrancos <- barrancos %>%
    mutate(
      bdd = "Cueto-Vega_2022",
      Zona = "Barrancos")  

  barrancos_filtr <- barrancos %>%
  filter(Hora_Lima >= as.POSIXct("2015-02-21", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-15", tz="UTC"))

```

```{r, echo=TRUE,results="hide", message=FALSE, warning=FALSE}
constante <-  bind_rows(constante_loggers, constante_TDO, constante_multi) 

total <-  bind_rows(constante, barrancos_filtr) 

total <- total %>%
  mutate(
    Year = format(Hora_Lima, "%Y"),  # Extraer el año
    Mortalidad = case_when(
      (Zona == "Barrancos" & Hora_Lima >= as.POSIXct("2015-02-21", tz = "UTC") & Hora_Lima < as.POSIXct("2015-03-15", tz = "UTC")) ~ "Mortalidad 2015 - Barrancos",
      (Zona == "Constante" & Hora_Lima >= as.POSIXct("2015-02-21", tz = "UTC") & Hora_Lima < as.POSIXct("2015-03-15", tz = "UTC")) ~ "Mortalidad 2015 - Constante",
      (Zona == "Constante" & Hora_Lima >= as.POSIXct("2019-02-19", tz = "UTC") & Hora_Lima < as.POSIXct("2019-03-13", tz = "UTC")) ~ "Mortalidad 2019 - Constante",
      TRUE ~ "No Mortalidad"
    )
  )

# Contar observaciones por categoría de Mortalidad y Zona
conteo_obs <- total %>%
  group_by(Mortalidad) %>%
  summarise(Conteo = n(), .groups = "drop")

# Ver los resultados
print(conteo_obs)
```

# Visualizacion de datos: 

## Mortalidad 2015 y 2019 

De oxígeno disuelto y temperatura, en fondo, durante la mortalidad 2015 y 2019

**Diferencias durante la Mortalidad 2015: Barrancos vs Constante??**

```{r, fig.height=12, fig.width=8, echo=TRUE, message=FALSE, warning=FALSE}
# Función para agregar grupos según huecos mayores a 24 horas
agregar_grupos <- function(data) {
  data <- data %>%
    arrange(Hora_Lima) %>%  # Asegúrate de que esté ordenado por tiempo
    mutate(
      time_diff = as.numeric(difftime(Hora_Lima, lag(Hora_Lima), units = "hours")),
      group = cumsum(ifelse(is.na(time_diff) | time_diff > 24, 1, 0))
    )
  return(data)
}

#Periodos a graficar 
barrancos_2015 <- barrancos %>%
  filter(Hora_Lima >= as.POSIXct("2015-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-18", tz="UTC"))

constante_2015 <- constante %>%
  filter(Hora_Lima >= as.POSIXct("2015-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2015-03-18", tz="UTC"))

constante_2019 <- constante %>%
  filter(Hora_Lima >= as.POSIXct("2019-01-08", tz="UTC") & Hora_Lima <= as.POSIXct("2019-03-18", tz="UTC"))

# Aplicar la función a los datasets
barrancos_2015 <- agregar_grupos(barrancos_2015)
constante_2015 <-  agregar_grupos(constante_2015)
constante_2019 <- agregar_grupos(constante_2019)

# Actualizar los gráficos para usar 'group'
grafico_barrancos_2015 <- ggplot(barrancos_2015, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2015-03-02", tz = "UTC"),
                xmax = as.POSIXct("2015-03-14", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24.4, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2015-01-17", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") +  
  labs( x="",
    y = "Saturación de oxígeno (%)",
    title = "Mortalidad 2015 - Barrancos") +
  theme_minimal(base_size = 12) 

grafico_constante_2015 <- ggplot(constante_2015, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2015-03-02", tz = "UTC"),
                xmax = as.POSIXct("2015-03-14", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24.4, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2015-01-18", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") +  
  labs( x= "",
    y = "Saturación de oxígeno (%)", title = "Mortalidad 2015 - Constante") +
  theme_minimal(base_size = 12) 

grafico_constante_2019 <- ggplot(constante_2019, aes(x = Hora_Lima, y = DO_sat, group = group)) +
  geom_rect(aes(xmin = as.POSIXct("2019-03-04", tz = "UTC"),
                xmax = as.POSIXct("2019-03-13", tz = "UTC"),
                ymin = -Inf, ymax = Inf),
            fill = "pink", alpha = 0.03) +  
  geom_line(color = "black", size = 0.5) +  
  geom_hline(yintercept = 24, color = "red", linetype = "solid", size = 0.5) +  
  annotate("text", x = as.POSIXct("2019-01-16", tz = "UTC"), y = 26.5,
           label = "Punto crítico de oxígeno", color = "red", size = 4) +
  scale_x_datetime(date_breaks = "1 week", date_labels = "%d/%b") + 
  labs(y = "Saturación de oxígeno (%)", title = "Mortalidad 2019", x = "Tiempo (día/mes)") +
  theme_minimal(base_size = 12) 

# Combinar los gráficos
grid.arrange(
  grafico_barrancos_2015, 
  grafico_constante_2015, 
  grafico_constante_2019, 
  ncol = 1)
```

# Análisis estadísticos

ver cuantos datos por grupo : cuantos registros por hora para cada tipo de mortalidad (histograma) 
ver normalidad de los datos por grupo

Deberia hacer bootstrapping?


Para realizar el análisis estadístico, se llevará a cabo un análisis preliminar para determinar si los datos cumplen con los requisitos para realizar análisis paramétricos o no paramétricos. Este análisis preliminar incluirá las pruebas de normalidad (Shapiro-Wilk) y homogeneidad de varianzas (Levene). Dependiendo de los resultados de este análisis preliminar, se emplearán las pruebas estadísticas adecuadas para determinar si existen diferencias significativas (p-valor < 0.05) **durante el tiempo de muestreo**. Si los datos cumplen con los supuestos de normalidad y homogeneidad de varianzas, se utilizará el análisis de varianza (ANOVA). En caso contrario, se emplearán pruebas no paramétricas como la prueba de Kruskal-Wallis. Los análisis y gráficos serán realizados en R Studio (versión 4. 3. 0; R Core Team, 2023).

## Normalidad - Prueba de Shapiro-Wilk {.tabset}

### Resultados

```{r, echo=TRUE, message=FALSE, warning=FALSE}

# Categorías únicas de mortalidad
categorias <- c("Mortalidad 2015 - Barrancos","Mortalidad 2015 - Constante","Mortalidad 2019 - Constante")

# Función para evaluar cada categoría
shapiro <- function(categoria, data) {
  # Filtrar el grupo
  datos <- data %>% filter(Mortalidad == categoria)
  
  # Normalidad: Shapiro-Wilk
  shapiro_result <- shapiro.test(datos$DO_sat)
  print(paste("Prueba de Shapiro-Wilk para", categoria, ":", shapiro_result$p.value))
  
}

# Aplicar la función a cada categoría
walk(categorias, ~ shapiro(.x, total))

datos_nomortalidad<- total %>%
  filter(Mortalidad == "No Mortalidad")
kolmogorov_result <- ks.test(x=datos_nomortalidad$DO_sat,y='pnorm',alternative='two.sided')
  print(paste("Prueba de Kolmogorov-Smirnov para el periodo de No Mortalidad:",
            format(kolmogorov_result$p.value, scientific = TRUE)))
```

### Plots

```{r, echo=TRUE, message=FALSE, warning=FALSE}
# Categorías únicas de mortalidad
categorias <- c("Mortalidad 2015 - Barrancos","Mortalidad 2015 - Constante","Mortalidad 2019 - Constante", "No Mortalidad")
# Función para procesar cada categoría
plots <- function(categoria, data) {
  # Filtrar el grupo
  datos <- data %>% filter(Mortalidad == categoria)
  
  # Curva de densidad
  densidad <- ggplot(datos, aes(x = DO_sat)) +
    geom_density(fill = "#56B4E9", alpha = 0.5, color = "#0072B2", size = 1.2) +
    labs(
      title = paste("Curva de densidad -", categoria),
      x = "Saturación de Oxígeno (DO_sat)",
      y = "Densidad"
    ) +
    theme_minimal(base_size = 14) +
    theme(
      plot.title = element_text(face = "bold", size = 16),
      axis.title = element_text(size = 14)
    )

  # Boxplot horizontal
  boxplot <- ggplot(datos, aes(x = DO_sat, y = "")) +
    geom_boxplot(fill = "#E69F00", color = "black", alpha = 0.7, width = 0.3) +
    labs(x = "Saturación de Oxígeno (DO_sat)", y = "") +
    theme_minimal(base_size = 14) +
    theme(
      axis.title.y = element_blank(),
      axis.text.y = element_blank(),
      axis.ticks.y = element_blank(),
      plot.title = element_blank()
    )

  # Combinar el gráfico de densidad y el boxplot
  combinado <- densidad / boxplot + plot_layout(heights = c(3, 1))
  print(combinado)
}

# Aplicar la función a cada categoría
walk(categorias, ~ plots(.x, total))
```

## Homogeneidad de varianzas - Prueba de Levene {.tabset}

### Resultados

```{r, echo=TRUE, message=FALSE, warning=FALSE}
# Homogeneidad de varianzas: Prueba de Levene
levene_result <- leveneTest(DO_sat ~ Mortalidad, data = total)
# Extraer el valor p del resultado
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
# Crear un mensaje personalizado
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")

```

### Plots

```{r, echo=TRUE, fig.width=10, message=FALSE, warning=FALSE}
ggplot(total, aes(x = Mortalidad, y = DO_sat, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) + # Sin outliers para no duplicar puntos
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Dispersion de SatOD por Mortalidad",
    x = "Mortalidad",
    y = ""
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

ggplot(total, aes(x = DO_sat, fill = Mortalidad)) +
  geom_density(alpha = 0.6) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Densidad de DO_sat por Mortalidad",
    x = "(DO_sat)",
    y = "Densidad"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.title = element_blank()
  )

```


## Pruebas No Parametricas

Si los datos no son normales o no cumplen la homogeneidad: Usar la prueba de Kruskal-Wallis seguida de un análisis post-hoc (Dunn o Wilcoxon) para comparaciones múltiples.
comparacion con unequal variances??

```{r, echo=TRUE, message=FALSE, warning=FALSE}
# # Kruskal-Wallis
kruskal_result <- kruskal.test(DO_sat ~ Mortalidad, data = total)
kruskal_result

# Post-hoc con Dunn
dunn_result <- dunnTest(DO_sat ~ Mortalidad, data = total, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Sat_OD entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )

```

## Bootstrapping?

# Varaibilidad Diaria de la Saturación OD 

Para el análisis de datos, primero se realizará la caracterización ambiental de los registros hipóxicos en Constante. Para ello se analizará la variabilidad diaria de la saturación de OD en el fondo, los registros se clasificarán entre día (06:00 – 17:59) y noche (18:00 – 05:59), y se representarán mediante diagrama de cajas. **Para evaluar la variabilidad del ciclo diario se ajustará una función sinusoidal a las medianas del análisis del diagrama de caja, con el fin de determinar y comparar la amplitud y la fase del ciclo diario durante el tiempo de muestreo. Este análisis sigue la metodología planteada por Igarza et al. (2024)**.

```{r, echo=TRUE, fig.width=8, message=FALSE, warning=FALSE}
# Extraer solo la Hora en una nueva columna
total <- total %>%
  mutate(
    Hora = as.integer(format(Hora_Lima, "%H")),
    DiaNoche = ifelse(Hora >= 6 & Hora <= 17, "Día", "Noche")
  )

# Definir los colores
colores <- c("Día" = "gray100", "Noche" = "gray80")

# Crear el gráfico con boxplots por cada hora
ggplot(total, aes(x = factor(Hora), y = DO_sat, fill = DiaNoche)) +
  geom_boxplot(width = 0.6, alpha = 0.8, outlier.alpha = 0.5, outlier.size = 1) +
  facet_wrap(~ Mortalidad, ncol = 2) +  # Una faceta por cada periodo de mortalidad
  labs(
    x = "Hora del Día",
    y = "Saturación OD (%)",
    fill = "Momento del Día",
    title = "Variabilidad Diara de Saturación de Oxígeno"
  ) +
  scale_x_discrete(breaks = seq(0, 23, by = 2)) +
  scale_fill_manual(values = colores) +
  geom_hline(yintercept = 24.4, linetype = "dashed", color = "red", size = 0.5) +
  theme_minimal() +
  theme(
    strip.background = element_rect(fill = "gray95", color = "black"),  # Fondo de las facetas
    strip.text = element_text(face = "bold", size = 12),  # Texto en las facetas
    axis.text = element_text(size = 10),  # Tamaño de texto de los ejes
    axis.title = element_text(size = 12),  # Tamaño de texto de títulos de ejes
    panel.grid.major = element_blank(),  # Quitar líneas de grilla mayor
    panel.grid.minor = element_blank(),  # Quitar líneas de grilla menor
    axis.line = element_line(color = "black"),  # Añadir líneas de los ejes
    axis.ticks = element_line(color = "black")  # Añadir marcas en los ejes
  )
```
```{r, echo=TRUE, message=FALSE, warning=FALSE}

# 1. Calcular la mediana de DO_sat por Hora y Mortalidad
mediana_por_hora <- total %>%
  group_by(Mortalidad, Hora) %>%
  summarise(
    Mediana_DO_sat = median(DO_sat, na.rm = TRUE),
    .groups = "drop"
  )

# 2. Definir la función sinusoidal
sinusoidal <- function(x, amplitud, frecuencia, fase, desplazamiento) {
  amplitud * sin(frecuencia * x + fase) + desplazamiento
}

# 3. Ajustar la función sinusoidal a los datos
ajustes <- mediana_por_hora %>%
  group_by(Mortalidad) %>%
  summarise(
    # Calcular parámetros iniciales
    amplitud_inicio = (max(Mediana_DO_sat, na.rm = TRUE) - min(Mediana_DO_sat, na.rm = TRUE)) / 2,
    desplazamiento_inicio = mean(Mediana_DO_sat, na.rm = TRUE),
    ajuste = list(
      nlsLM(
        Mediana_DO_sat ~ sinusoidal(Hora, amplitud, frecuencia, fase, desplazamiento),
        data = cur_data(),
        start = list(
          amplitud = amplitud_inicio,
          frecuencia = 2 * pi / 24, # Frecuencia para ciclo de 24 horas
          fase = 0, # Inicialmente sin desplazamiento
          desplazamiento = desplazamiento_inicio
        )
      )
    ),
    .groups = "drop"
  )

# 4. Extraer los parámetros ajustados y corregir amplitud y fase
parametros <- ajustes %>%
  mutate(
    coeficientes = map(ajuste, coef)
  ) %>%
  select(Mortalidad, coeficientes) %>%
  unnest_wider(coeficientes) %>%
  mutate(
    Amplitud = abs(amplitud), # Asegurar amplitud positiva
    Fase = ifelse(amplitud < 0, fase + pi, fase), # Corregir fase si amplitud era negativa
    Horamax = (-Fase / frecuencia) %% 24 # Calcular la hora del máximo y asegurar 0-24
  ) %>%
  select(Mortalidad, Amplitud, Frecuencia = frecuencia, Fase, Desplazamiento = desplazamiento, Horamax)

# Imprimir los parámetros ajustados
print(parametros)

# 5. Crear datos ajustados con la onda sinusoidal
datos_ajustados <- mediana_por_hora %>%
  left_join(parametros, by = "Mortalidad") %>%
  mutate(
    Ajuste = Amplitud * sin(Frecuencia * Hora + Fase) + Desplazamiento
  )

# 6. Graficar datos reales y ajustados con escala fija de 0 a 100
ggplot(datos_ajustados, aes(x = Hora)) +
  geom_line(aes(y = Ajuste, color = Mortalidad), linetype = "dashed") +
  geom_point(aes(y = Mediana_DO_sat, color = Mortalidad), size = 1) +
  facet_wrap(~ Mortalidad, scales = "fixed") +  # Escala fija en Y
  scale_y_continuous(limits = c(0, 60)) +  # Fijar límites de 0 a 100
  labs(
    title = "Ajuste de función sinusoidal",
    x = "Hora del día",
    y = "Mediana de Saturación de Oxígeno (DO_sat)"
  ) +
  theme_minimal()

# 7. Crear datos ajustados sin desplazamiento vertical (solo amplitud y fase)
datos_ajustados_sin_d <- mediana_por_hora %>%
  left_join(parametros, by = "Mortalidad") %>%
  mutate(
    Ajuste_sin_d = Amplitud * sin(Frecuencia * Hora + Fase)  # Eliminar el desplazamiento vertical
  )

# 8. Graficar las ondas sinusoidales sin desplazamiento vertical
ggplot(datos_ajustados_sin_d, aes(x = Hora, y = Ajuste_sin_d, color = Mortalidad)) +
  geom_line(size = 1, linetype = "solid") +
  labs(
    title = "Comparación de ondas sinusoidales",
    x = "Hora del día",
    y = "Oscilación relativa de DO_sat"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    legend.position = "bottom",
    legend.title = element_blank()
  )
```
La amplitud indica cuánto varía la saturación de oxígeno a lo largo del día, desde el nivel medio (Desplazamiento) hasta los picos (positivos o negativos). Es una medida de la variabilidad diaria:

Mayor amplitud → Mayor variación diaria entre día y noche.
Menor amplitud → Ciclo diario menos marcado (saturación más estable).

La frecuencia está relacionada con el número de ciclos completados en un período de tiempo. Interpretación:
La frecuencia debería ser aproximadamente 0.2618 si las oscilaciones ocurren exactamente cada 24 horas.
Tus resultados tienen ligeras diferencias:

* Mortalidad 2015 - Constante (0.353): Frecuencia un poco mayor, lo que podría indicar oscilaciones más rápidas (ligeramente desfasadas del ciclo diario perfecto).

* No Mortalidad (0.298): Frecuencia más baja, lo que sugiere oscilaciones más lentas y un ciclo más "extendido".

En general, estas pequeñas diferencias podrían deberse a ruido o a fenómenos biológicos que desvíen el ciclo de un patrón estrictamente diario.

La fase indica el desplazamiento horizontal de la onda sinusoidal, es decir, en qué momento del día ocurre el máximo o mínimo de saturación.

# Indicadores de hipoxia {.tabset}

Se evaluará la variabilidad de hipoxia mediante los siguientes indicadores: el porcentaje de registros hipóxicos, las horas de hipoxia al día, la mediana de saturación de OD al día y el valor mínimo de saturación de OD al día. 

Después del análisis de la variabilidad del ciclo diario de saturación de OD, se realizará el **análisis de los eventos hipóxicos**. Para determinar un evento hipóxico, este debe ser igual o inferior al 24.4% de saturación de OD y durar al menos seis horas consecutivas (Shields y Weidman, 2008).

## Numero de horas hipoxicas al dia

**Numero de horas hipoxicas al dia:**

```{r, echo=TRUE, fig.width=10,message=FALSE, warning=FALSE}
# Función para agregar columna de hipoxia
agregar_columna_hipoxia <- function(data) {
  data$Hipoxia <- ifelse(data$DO_sat <= 24.4, 1, 0)
  return(data)
}

total <- agregar_columna_hipoxia(total)

# Función para calcular horas de hipoxia por día
calcular_horas_hipoxia <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(Horas_Hipoxia = sum(Hipoxia), .groups = 'drop')
}

horas_hipoxicas <- calcular_horas_hipoxia(total)

# Normalidad de los datos
horas_hipoxicas %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(Horas_Hipoxia)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea

# Homogeneidad de los datos
levene_result<- leveneTest(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas)
# Extraer el valor p del resultado
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)

# Crear un mensaje personalizado
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")

# Kruskal-Wallis
kruskal_result <- kruskal.test(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas)
print(kruskal_result)

# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(Horas_Hipoxia ~ Mortalidad, data = horas_hipoxicas, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Horas Hipoxicas entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )

```

Cual tipo de grafico usar?
```{r, echo=TRUE, fig.width=10,message=FALSE, warning=FALSE}
# Boxplots
ggplot(horas_hipoxicas, aes(x = Mortalidad, y = Horas_Hipoxia, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Horas Hipóxicas al día",
    x = "",
    y = "Horas"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Violinplot
ggplot(horas_hipoxicas, aes(x = Mortalidad, y = Horas_Hipoxia, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Horas Hipóxicas al día",
    x = "",
    y = "Horas"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Reordenar los niveles de la variable 'Mortalidad'
horas_hipoxicas$Mortalidad <- factor(
  horas_hipoxicas$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)

# Stats + graph
ggbetweenstats(
  data = horas_hipoxicas,
  x = Mortalidad,
  y = Horas_Hipoxia,
  title = NULL, # Elimina el título
  results.subtitle = F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Horas en hipoxia al día",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño de título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  ) +
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00"))



```

## Porcentaje de registros hipóxicos al día

**Porcentaje de registros hipóxicos al dia:**

```{r, echo=TRUE, message=FALSE, warning=FALSE}
# Función para calcular el porcentaje de horas hipóxicas por día
calcular_porcentaje_hipoxia <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(
      Horas_Hipoxia = sum(Hipoxia),  # Contar las horas hipóxicas
      Horas_Totales = n(),  # Contar el número total de registros por día
      Porcentaje = (Horas_Hipoxia / Horas_Totales) * 100,  # Calcular el porcentaje de horas hipóxicas
      .groups = 'drop'
    )
}

# Aplicar la función a tu dataframe
porcentaje_hipoxia <- calcular_porcentaje_hipoxia(total)

# Normalidad de los datos
porcentaje_hipoxia %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(Porcentaje)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea

# Homogeneidad de los datos
levene_result<- leveneTest(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")

# Kruskal-Wallis
kruskal_result <- kruskal.test(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia)
print(kruskal_result)

# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(Porcentaje ~ Mortalidad, data = porcentaje_hipoxia, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )

```

```{r, echo=TRUE, fig.width=10,message=FALSE, warning=FALSE}
ggplot(porcentaje_hipoxia, aes(x = Mortalidad, y = Porcentaje, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Registros Hipóxicos al día",
    x = "",
    y = "Porcentaje %"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )


ggplot(porcentaje_hipoxia, aes(x = Mortalidad, y = Porcentaje, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Registros Hipóxicos al día",
    x = "",
    y = "Porcentaje %"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )

# Reordenar los niveles de la variable 'Mortalidad'
porcentaje_hipoxia$Mortalidad <- factor(
  porcentaje_hipoxia$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)


# Stats + graph
ggbetweenstats(
  data = porcentaje_hipoxia,
  x = Mortalidad,
  y = Porcentaje,
  title = NULL, # Elimina el título
  results.subtitle =F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Registros hipóxicos al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )


```

## Minimo de Sat OD al dia

**Minimo de Saturacion de oxígeno al día:**
```{r, echo=TRUE, message=FALSE, warning=FALSE}
# Función para calcular mínimo de DO_sat por día 
calcular_min_od <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(minimo = min(DO_sat), .groups = 'drop')
}

# Aplicar calcular_min_od a cada conjunto de datos
min_od <- calcular_min_od(total)

# Normalidad de los datos
min_od %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(minimo)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea

# Homogeneidad de los datos
levene_result<- leveneTest(minimo ~ Mortalidad, data = min_od)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")

# Kruskal-Wallis
kruskal_result <- kruskal.test(minimo ~ Mortalidad, data = min_od)
print(kruskal_result)

# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(minimo ~ Mortalidad, data = min_od, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )

```

```{r, echo=TRUE, fig.width=10,message=FALSE, warning=FALSE}

ggplot(min_od, aes(x = Mortalidad, y = minimo, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Minima saturacion de oxígeno al día",
    x = "",
    y = "Saturacion OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )


ggplot(min_od, aes(x = Mortalidad, y = minimo, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Minima saturacion de oxígeno al día",
    x = "",
    y = "Saturacion de OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )


# Reordenar los niveles de la variable 'Mortalidad'
min_od$Mortalidad <- factor(
  min_od$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)

# Stats + graph
ggbetweenstats(
  data = min_od,
  x = Mortalidad,
  y = minimo,
  title = NULL, # Elimina el título
  results.subtitle = F, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Minima saturación OD al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    plot.subtitle = ggplot2::element_text(size = 0), # Quita el subtítulo
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )




```

## Mediana de Sat OD al dia

**Mediana de Saturacion de oxigeno al dia:**

```{r, echo=TRUE, message=FALSE, warning=FALSE}
# Función para calcular mediana de DO_sat por día y zona
calcular_median_od <- function(df) {
  df %>%
    mutate(Dia = as.Date(Hora_Lima)) %>%
    group_by(Dia, Mortalidad) %>%
    summarise(median= median(DO_sat), .groups = 'drop')
}

# Aplicar calcular_min_od a cada conjunto de datos
med_od <- calcular_median_od(total)

# Normalidad de los datos
med_od %>%
  group_by(Mortalidad) %>%
  summarise(
    mensaje = paste(
      "Prueba de Shapiro-Wilk para", 
      first(Mortalidad), # Obtén el nombre del grupo
      ": p =", signif(shapiro.test(median)$p.value, digits = 3)
    )
  ) %>%
  pull(mensaje) %>% # Extrae solo los mensajes
  cat(sep = "\n") # Los imprime línea por línea

# Homogeneidad de los datos
levene_result<- leveneTest(median ~ Mortalidad, data = med_od)
p_value_levene <- signif(levene_result$`Pr(>F)`[1], digits = 3)
cat("Prueba de Levene para homogeneidad de varianzas: p =", p_value_levene, "\n")

# Kruskal-Wallis
kruskal_result <- kruskal.test(median ~ Mortalidad, data = med_od)
print(kruskal_result)

# Post-hoc con Dunn para identificar diferencias entre pares de grupos
dunn_result <- dunnTest(median ~ Mortalidad, data = med_od, method = "bonferroni")

# Extraer los resultados en formato de dataframe
tabla_dunn <- as.data.frame(dunn_result$res)

# Renombrar columnas para que sean más legibles
colnames(tabla_dunn) <- c("Comparacion", "Estadistico Z", "P sin ajustar", "P ajustado")

# Crear la tabla con gt
tabla_dunn %>%
  gt() %>%
  tab_header(
    title = "Resultados del Test de Dunn",
    subtitle = "Comparaciones de Porcentaje de registros hipoxicos entre grupos de Mortalidad"
  ) %>%
  fmt_number(
    columns = c("Estadistico Z", "P sin ajustar", "P ajustado"),
    decimals = 3
  ) %>%
  cols_label(
    `Comparacion` = "Grupos Comparados",
    `Estadistico Z` = "Estadístico Z",
    `P sin ajustar` = "P-valor (sin ajustar)",
    `P ajustado` = "P-valor (ajustado)"
  )
```



```{r, echo=TRUE, fig.width=10,message=FALSE, warning=FALSE}
ggplot(med_od, aes(x = Mortalidad, y = median, fill = Mortalidad)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, size = 2, alpha = 0.6, color = "black") +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Mediana de la saturacion de oxígeno al día",
    x = "",
    y = "Saturacion OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )


ggplot(med_od, aes(x = Mortalidad, y = median, fill = Mortalidad)) +
  geom_violin(trim = FALSE, alpha = 0.6, color = "black") +
  geom_boxplot(width = 0.1, outlier.shape = NA, alpha = 0.5) +
  scale_fill_manual(values = c("#56B4E9", "#E69F00", "#009E73", "#D55E00")) +
  labs(
    title = "Mediana de la saturacion de oxígeno al día",
    x = "",
    y = "Saturacion de OD (%)"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    legend.position = "none"
  )







# Crear el gráficO

med_od$Mortalidad <- factor(
  med_od$Mortalidad,
  levels = c(
    "Mortalidad 2015 - Barrancos",
    "Mortalidad 2019 - Constante",
    "Mortalidad 2015 - Constante",
    "No Mortalidad"
  ),
  labels = c(
    "Mortalidad 2015\nBarrancos",
    "Mortalidad 2019\nConstante",
    "Mortalidad 2015\nConstante",
    "No Mortalidad"
  )
)


# Stats + graph
ggbetweenstats(
  data = med_od,
  x = Mortalidad,
  y = median,
  title = NULL, # Elimina el título
  results.subtitle = FALSE, # Elimina el subtítulo que contiene la ecuación
  xlab = "",
  ylab = "Mediana de Saturación OD al día (%)",
  type = "nonparametric", # Usa Kruskal-Wallis como test principal
  pairwise.comparisons = TRUE, # Comparaciones post-hoc entre grupos
  var.equal = FALSE,
  pairwise.display = "significant", # Solo muestra pares significativos
  p.adjust.method = "bonferroni", # Corrección para múltiples comparaciones
  ggtheme = ggplot2::theme_minimal(), # Tema minimalista
  violin.args = list(width = 0, linewidth = 0) # Para quitar el violin plot
) +
  # Paleta de colores personalizada
  ggplot2::scale_color_manual(values = c("#56B4E9", "red", "green", "#D55E00")) +
  
  # Personalización del tema
  ggplot2::theme(
    plot.title = ggplot2::element_text(size = 0), # Quita el título
    legend.text = ggplot2::element_text(size = 12), # Tamaño del texto de la leyenda
    axis.text = ggplot2::element_text(size = 12, color = "black"), # Tamaño y color del texto de los ejes
    axis.title = ggplot2::element_text(size = 14), # Tamaño del título de los ejes
    axis.ticks.length = ggplot2::unit(5, "pt"), # Longitud de los ticks
    axis.ticks = ggplot2::element_line(color = "black"), # Color de los ticks
    axis.line = ggplot2::element_line(color = "black", size = 0.5), # Líneas de los ejes
    panel.grid.major = ggplot2::element_blank(), # Elimina las líneas de la grilla mayor
    panel.grid.minor = ggplot2::element_blank()  # Elimina las líneas de la grilla menor
  )

```


# Desarrollo de una matriz de respuesas biologicas de *A. purpuratus* frente a la temperatura e hipoxia

```{r pressure, echo=FALSE, fig.cap="", out.width = '70%'}
include_graphics("Indice1.png")
include_graphics("Indice2.png")
include_graphics("Indice3.png")
include_graphics("Indice4.png")
```

**BARRANCOS MORTALIDAD 2015**

```{r, echo=TRUE,fig.width=8,  message=FALSE, warning=FALSE}

# Ahora asignamos la categoria de Temp_fond y DO_sat
df_indice <- barrancos_2015

df_indice <- df_indice %>%
  mutate(
    Categoria_T = case_when(
      Temp_fond <= 16 ~ "<=16",
      Temp_fond > 16 & Temp_fond <= 20 ~ "]16-20]",
      Temp_fond > 20 & Temp_fond <= 25 ~ "]20-25]",
      Temp_fond > 25 & Temp_fond <= 29 ~ "]25-29]",
      Temp_fond > 29 ~ ">29"
    ),
    Categoria_DO = case_when(
      DO_sat <= 2 ~ "<=2",
      DO_sat > 2 & DO_sat <= 5 ~ "]2-5]",
      DO_sat > 5 & DO_sat <= 24.4 ~ "]5-24]",
      DO_sat > 24.4 ~ ">24"
    ),
    Categoria_total = paste(Categoria_T, Categoria_DO, sep = ";")
  )

# Identificar los cambios en las categorías de Categoria_total dentro de cada group 
df_indice <- df_indice %>%
  group_by(group) %>%
  mutate(change = Categoria_total != lag(Categoria_total, default = first(Categoria_total))) %>%
  mutate(group_id = cumsum(change)) %>%
  ungroup ()

# Calcular la fecha de inicio y fin de cada grupo de categorías continuas
df_agrupado <- df_indice %>%
  group_by(
    group,
    group_id) %>%
  summarize(
    fecha_inicio = min(Hora_Lima),
    fecha_fin = max(Hora_Lima),
    duracion = as.numeric(difftime(max(Hora_Lima), min(Hora_Lima), units = "hours"))+1,
    Categoria_total = first(Categoria_total),
    Categoria_DO = first (Categoria_DO))

# Agregar columna Hipoxico con valores Hipoxia o Normoxia
df_agrupado <- df_agrupado %>%
 mutate(Hipoxia = ifelse(Categoria_DO %in% c("<=2", "]2-5]","]5-24]"), "Hipoxia", "Normoxia")) #%>%
  #ungroup() #%>% # Eliminar agrupaciones activas
  #select(-group)

# Crear una copia del dataframe original
df_resultado <- df_agrupado

# Identificar periodos menores a 6 horas
df_resultado <- df_resultado %>%
  mutate(is_short = duracion < 6)

# Procesar los bloques
procesar_bloques <- function(df) {
  bloque_id <- 1
  df <- df %>%
    mutate(bloque = 0)  # Inicializamos con 0 para los bloques
  
  for (i in 1:nrow(df)) {
    if (i == 1) {
      # Asignar el primer bloque
      df$bloque[i] <- bloque_id
    } else if (df$group[i] != df$group[i - 1]) {
      # Si cambia el grupo, crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && df$is_short[i]) {
      # Si el periodo actual y el anterior son cortos, pertenecen al mismo bloque
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && !df$is_short[i]) {
      # Si el periodo anterior era corto pero este no, verificamos la duración acumulada
      bloque_duracion <- sum(df$duracion[df$bloque == bloque_id])
      if (bloque_duracion < 6) {
        # Vía B: Ignorar la interrupción y extender el bloque al siguiente
        df$bloque[i] <- bloque_id
      } else {
        # Vía A: Crear un nuevo bloque
        bloque_id <- bloque_id + 1
        df$bloque[i] <- bloque_id
      }
    } else {
      # Crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    }
  }
  
  return(df)
}

df_resultado <- procesar_bloques(df_resultado)

# Calcular resultados finales por bloque
df_final <- df_resultado %>%
  group_by(bloque, group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion_total = sum(duracion),
    Categoria_total = Categoria_total[which.max(duracion)],
    Categoria_DO = Categoria_DO[which.max(duracion)]
  ) %>%
  ungroup()

# Agrupar por bloques consecutivos con el mismo Categoria_total
df_consolidado <- df_final %>%
  mutate(
    grupo_categoria = cumsum(Categoria_total != lag(Categoria_total, default = first(Categoria_total)))
  ) %>%
  group_by(grupo_categoria,group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion = sum(duracion_total),
    Categoria_total = first(Categoria_total),
    Categoria_DO = first(Categoria_DO) # Consideramos la misma lógica para Categoria_DO
  ) %>%
  ungroup()


# Asignar las categorias
df_consolidado <- df_consolidado %>%
  mutate(
    Indice = case_when(
      duracion < 12 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion < 12 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "<=16;]2-5]"~ "Estres fisiologico",
      duracion<12 & Categoria_total =="<=16;<=2" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion<12 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total =="]16-20];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]16-20];<=2" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion <12 & Categoria_total == "]20-25];]5-24]"~"Estres fisiologico",
      duracion<12 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == "25-29];>24" ~ "Sin informacion",
      duracion <12 & Categoria_total == "]25-29];]5-24]"~"Sin informacion",
      duracion<12 & Categoria_total == "]25-29];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]25-29];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == ">29;>24" ~ "Probabilidad de mortalidad",
      duracion <12 & Categoria_total == ">29;5-24]"~ "Letal",
      duracion<12 & Categoria_total== ">29;]2-5]" ~ "Letal",
      duracion<12 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;<=2"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24  & Categoria_total == "]16-20];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];>24"  ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];>24"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 &Categoria_total == "]25-29];]5-24]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];]2-5]"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;>24"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;5-24]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;]2-5]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total  == ">29;<=2"  ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;>24"  ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;<=2" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]2-5]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;>24"~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;5-24]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;]2-5]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]20-25];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == ">29;>24" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;5-24]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >=120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      TRUE ~ "Sin informacion"
    )
  )

# Ordenar el dataframe por fecha de inicio
df_consolidado <- df_consolidado %>% arrange(fecha_inicio)

# Convertir las columnas de fecha a POSIXct si no lo están
df_consolidado$fecha_inicio <- as.POSIXct(df_consolidado$fecha_inicio, tz="UTC")
df_consolidado$fecha_fin <- as.POSIXct(df_consolidado$fecha_fin, tz="UTC")

#Función para calcular el punto medio de un intervalo de fechas
interval_midpoint <- function(start, end) {
  return(start + (end - start) / 2)
}

# Agregar la columna Hora_Lima a df_agrupado usando interval_midpoint
df_consolidado <- df_consolidado %>%
  mutate(Hora_Lima = interval_midpoint(fecha_inicio, fecha_fin))

# Definir los colores de las categorías
colores_categorias <- c("Letal" = "#800000",  # Rojo oscuro
                        "Probabilidad de mortalidad" = "red",
                        "Estres fisiologico" = "orange",
                        "Inocuo" = "green",
                        "Sin informacion" = "grey")


ggplot() +
  # Capa 1: fondo con rectángulos de df_consolidado
  geom_rect(
    data = df_consolidado,
    aes(
      xmin = as.POSIXct(fecha_inicio, tz = "UTC"),
      xmax = as.POSIXct(fecha_fin, tz = "UTC"),
      ymin = -Inf,
      ymax = Inf,
      fill = Indice
    ),
    alpha = 0.8,
    color = NA
  ) +
  scale_fill_manual(values = colores_categorias) +
  
  # Capa 2: líneas de barrancos_2015 con agrupación
  geom_line(
    data = barrancos_2015,
    aes(x = Hora_Lima, y = DO_sat, group = group),
    color = "black"
  ) +
  
  # Capa 3: punto crítico de oxígeno
  geom_text(
    data = data.frame(
      x = as.POSIXct("2015-01-15", tz = "UTC"),
      y = 27,
      label = "Punto crítico de oxígeno"
    ),
    aes(x = x, y = y, label = label),
    color = "red",
    size = 3.5
  ) +
  
  # Capa 4: línea horizontal crítica
  geom_hline(yintercept = 24, color = "red") +
  
  # Tema y personalización
  theme_minimal() +
  scale_x_datetime(breaks = "1 week", date_labels = "%d/%b") +
  labs(x = "", y = "Saturación de oxígeno (%)", title = "Mortalidad 2015 - Barrancos") +
  theme(
    title = element_text(size = 20),
    axis.text.x = element_text(size = 10, color = "black"),
    axis.text.y = element_text(size = 14, color = "black"),
    axis.title.x = element_text(size = 16),
    axis.title.y = element_text(size = 16),
    legend.text = element_text(size = 12),
    legend.title = element_text(size = 14),
    legend.position = "bottom",
    axis.ticks.length = unit(5, "pt"), # Longitud de los ticks
    axis.ticks.x = element_line(color = "black"), # Color de los ticks X
    axis.ticks.y = element_line(color = "black"),  # Color de los ticks Y
    axis.line.x = element_line(color = "black", size = 0.5), # Línea horizontal del eje
    axis.line.y = element_line(color = "black", size = 0.5)  # Línea vertical del eje
  ) +
  
  # Anotaciones adicionales
  annotate(
    "rect",
    xmin = as.POSIXct("2015-03-02", tz = "UTC"),
    xmax = as.POSIXct("2015-03-15", tz = "UTC"),
    ymin = -Inf,
    ymax = Inf,
    alpha = 0,
    color = "#636363",
    size = 0.7,
    linetype = "dashed"
  ) +
  geom_text(
    data = data.frame(
      x = as.POSIXct("2015-03-09", tz = "UTC"),
      y = 98,
      label = "Mortalidad"
    ),
    aes(x = x, y = y, label = label),
    color = "#636363",
    size = 4
  )

```

**CONSTANTE MORTALIDAD 2019**

```{r, echo=TRUE,fig.width=8,  message=FALSE, warning=FALSE}

# Ahora asignamos la categoria de Temp_fond y DO_sat
df_indice <- constante_2019

df_indice <- df_indice %>%
  mutate(
    Categoria_T = case_when(
      Temp_fond <= 16 ~ "<=16",
      Temp_fond > 16 & Temp_fond <= 20 ~ "]16-20]",
      Temp_fond > 20 & Temp_fond <= 25 ~ "]20-25]",
      Temp_fond > 25 & Temp_fond <= 29 ~ "]25-29]",
      Temp_fond > 29 ~ ">29"
    ),
    Categoria_DO = case_when(
      DO_sat <= 2 ~ "<=2",
      DO_sat > 2 & DO_sat <= 5 ~ "]2-5]",
      DO_sat > 5 & DO_sat <= 24.4 ~ "]5-24]",
      DO_sat > 24.4 ~ ">24"
    ),
    Categoria_total = paste(Categoria_T, Categoria_DO, sep = ";")
  )

# Identificar los cambios en las categorías de Categoria_total dentro de cada group 
df_indice <- df_indice %>%
  group_by(group) %>%
  mutate(change = Categoria_total != lag(Categoria_total, default = first(Categoria_total))) %>%
  mutate(group_id = cumsum(change)) %>%
  ungroup ()

# Calcular la fecha de inicio y fin de cada grupo de categorías continuas
df_agrupado <- df_indice %>%
  group_by(
    group,
    group_id) %>%
  summarize(
    fecha_inicio = min(Hora_Lima),
    fecha_fin = max(Hora_Lima),
    duracion = as.numeric(difftime(max(Hora_Lima), min(Hora_Lima), units = "hours"))+1,
    Categoria_total = first(Categoria_total),
    Categoria_DO = first (Categoria_DO))

# Agregar columna Hipoxico con valores Hipoxia o Normoxia
df_agrupado <- df_agrupado %>%
 mutate(Hipoxia = ifelse(Categoria_DO %in% c("<=2", "]2-5]","]5-24]"), "Hipoxia", "Normoxia")) #%>%
  #ungroup() #%>% # Eliminar agrupaciones activas
  #select(-group)

# Crear una copia del dataframe original
df_resultado <- df_agrupado

# Identificar periodos menores a 6 horas
df_resultado <- df_resultado %>%
  mutate(is_short = duracion < 6)

# Procesar los bloques
procesar_bloques <- function(df) {
  bloque_id <- 1
  df <- df %>%
    mutate(bloque = 0)  # Inicializamos con 0 para los bloques
  
  for (i in 1:nrow(df)) {
    if (i == 1) {
      # Asignar el primer bloque
      df$bloque[i] <- bloque_id
    } else if (df$group[i] != df$group[i - 1]) {
      # Si cambia el grupo, crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && df$is_short[i]) {
      # Si el periodo actual y el anterior son cortos, pertenecen al mismo bloque
      df$bloque[i] <- bloque_id
    } else if (df$is_short[i - 1] && !df$is_short[i]) {
      # Si el periodo anterior era corto pero este no, verificamos la duración acumulada
      bloque_duracion <- sum(df$duracion[df$bloque == bloque_id])
      if (bloque_duracion < 6) {
        # Vía B: Ignorar la interrupción y extender el bloque al siguiente
        df$bloque[i] <- bloque_id
      } else {
        # Vía A: Crear un nuevo bloque
        bloque_id <- bloque_id + 1
        df$bloque[i] <- bloque_id
      }
    } else {
      # Crear un nuevo bloque
      bloque_id <- bloque_id + 1
      df$bloque[i] <- bloque_id
    }
  }
  
  return(df)
}

df_resultado <- procesar_bloques(df_resultado)

# Calcular resultados finales por bloque
df_final <- df_resultado %>%
  group_by(bloque, group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion_total = sum(duracion),
    Categoria_total = Categoria_total[which.max(duracion)],
    Categoria_DO = Categoria_DO[which.max(duracion)]
  ) %>%
  ungroup()

# Agrupar por bloques consecutivos con el mismo Categoria_total
df_consolidado <- df_final %>%
  mutate(
    grupo_categoria = cumsum(Categoria_total != lag(Categoria_total, default = first(Categoria_total)))
  ) %>%
  group_by(grupo_categoria,group) %>%
  summarize(
    fecha_inicio = min(fecha_inicio),
    fecha_fin = max(fecha_fin),
    duracion = sum(duracion_total),
    Categoria_total = first(Categoria_total),
    Categoria_DO = first(Categoria_DO) # Consideramos la misma lógica para Categoria_DO
  ) %>%
  ungroup()


# Asignar las categorias
df_consolidado <- df_consolidado %>%
  mutate(
    Indice = case_when(
      duracion < 12 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion < 12 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "<=16;]2-5]"~ "Estres fisiologico",
      duracion<12 & Categoria_total =="<=16;<=2" ~ "Estres fisiologico",
      duracion<12 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion<12 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion<12 & Categoria_total =="]16-20];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]16-20];<=2" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion <12 & Categoria_total == "]20-25];]5-24]"~"Estres fisiologico",
      duracion<12 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]20-25];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == "25-29];>24" ~ "Sin informacion",
      duracion <12 & Categoria_total == "]25-29];]5-24]"~"Sin informacion",
      duracion<12 & Categoria_total == "]25-29];]2-5]" ~ "Sin informacion",
      duracion<12 & Categoria_total == "]25-29];<=2" ~ "Probabilidad de mortalidad",
      duracion<12 & Categoria_total == ">29;>24" ~ "Probabilidad de mortalidad",
      duracion <12 & Categoria_total == ">29;5-24]"~ "Letal",
      duracion<12 & Categoria_total== ">29;]2-5]" ~ "Letal",
      duracion<12 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24  & Categoria_total == "<=16;<=2"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 12 & duracion < 24  & Categoria_total == "]16-20];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];>24"  ~ "Inocuo",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]5-24]"  ~ "Estres fisiologico",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];]2-5]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]20-25];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];>24"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 &Categoria_total == "]25-29];]5-24]"  ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];]2-5]"   ~ "Sin informacion",
      duracion >= 12 & duracion < 24 & Categoria_total == "]25-29];<=2"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;>24"  ~ "Probabilidad de mortalidad",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;5-24]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total == ">29;]2-5]"  ~ "Letal",
      duracion >= 12 & duracion < 24 & Categoria_total  == ">29;<=2"  ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;>24"  ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;]2-5]"  ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "<=16;<=2" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];]2-5]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]16-20];<=2"  ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]5-24]" ~ "Estres fisiologico",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;>24"~ "Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;5-24]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;]2-5]"~"Letal",
      duracion >= 24 & duracion < 48 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]5-24]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;]2-5]" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "<=16;<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]16-20];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]16-20];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      duracion >= 48 & duracion < 120& Categoria_total == "]20-25];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];]2-5]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]20-25];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];>24" ~ "Probabilidad de mortalidad",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]5-24]" ~ "Sin informacion",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == "]25-29];<=2" ~ "Letal",
      duracion >= 48 & duracion < 120& Categoria_total == ">29;>24" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;5-24]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;]2-5]" ~ "Letal",
      duracion >= 48 & duracion < 120 & Categoria_total == ">29;<=2" ~ "Letal",
      duracion >=120 & Categoria_total == "<=16;>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]16-20];>24" ~ "Inocuo",
      duracion >=120 & Categoria_total == "]20-25];>24" ~ "Inocuo",
      TRUE ~ "Sin informacion"
    )
  )

# Ordenar el dataframe por fecha de inicio
df_consolidado <- df_consolidado %>% arrange(fecha_inicio)

# Convertir las columnas de fecha a POSIXct si no lo están
df_consolidado$fecha_inicio <- as.POSIXct(df_consolidado$fecha_inicio, tz="UTC")
df_consolidado$fecha_fin <- as.POSIXct(df_consolidado$fecha_fin, tz="UTC")

#Función para calcular el punto medio de un intervalo de fechas
interval_midpoint <- function(start, end) {
  return(start + (end - start) / 2)
}

# Agregar la columna Hora_Lima a df_agrupado usando interval_midpoint
df_consolidado <- df_consolidado %>%
  mutate(Hora_Lima = interval_midpoint(fecha_inicio, fecha_fin))

# Definir los colores de las categorías
colores_categorias <- c("Letal" = "#800000",  # Rojo oscuro
                        "Probabilidad de mortalidad" = "red",
                        "Estres fisiologico" = "orange",
                        "Inocuo" = "green",
                        "Sin informacion" = "grey")

df_consolidado <- df_consolidado %>%
  mutate(fecha_fin = fecha_fin - microseconds(1))  # Restamos 1 segundo para que fecha_fin sea inclusiva

ggplot() +
  # Capa 1: fondo con rectángulos de df_consolidado
  geom_rect(
    data = df_consolidado,
    aes(
      xmin = as.POSIXct(fecha_inicio, tz = "UTC"),
      xmax = as.POSIXct(fecha_fin, tz = "UTC"),
      ymin = -Inf,
      ymax = Inf,
      fill = Indice
    ),
    alpha = 0.8,
    color = NA
  ) +
  scale_fill_manual(values = colores_categorias) +
  
  # Capa 2: líneas de constnate_2019 con agrupación
  geom_line(
    data = constante_2019,
    aes(x = Hora_Lima, y = DO_sat, group = group),
    color = "black"
  ) +
  
  # Capa 3: punto crítico de oxígeno
  geom_text(
    data = data.frame(
      x = as.POSIXct("2019-01-15", tz = "UTC"),
      y = 27,
      label = "Punto crítico de oxígeno"
    ),
    aes(x = x, y = y, label = label),
    color = "red",
    size = 3.5
  ) +
  
  # Capa 4: línea horizontal crítica
  geom_hline(yintercept = 24, color = "red") +
  
  # Tema y personalización
  theme_minimal() +
  scale_x_datetime(breaks = "1 week", date_labels = "%d/%b") +
  labs(x = "", y = "Saturación de oxígeno (%)", title = "Mortalidad 2019 - Constante") +
  theme(
    title = element_text(size = 20),
    axis.text.x = element_text(size = 10, color = "black"),
    axis.text.y = element_text(size = 14, color = "black"),
    axis.title.x = element_text(size = 16),
    axis.title.y = element_text(size = 16),
    legend.text = element_text(size = 12),
    legend.title = element_text(size = 14),
    legend.position = "bottom",
    axis.ticks.length = unit(5, "pt"), # Longitud de los ticks
    axis.ticks.x = element_line(color = "black"), # Color de los ticks X
    axis.ticks.y = element_line(color = "black"),  # Color de los ticks Y
    axis.line.x = element_line(color = "black", size = 0.5), # Línea horizontal del eje
    axis.line.y = element_line(color = "black", size = 0.5)  # Línea vertical del eje
  ) +
  
  # Anotaciones adicionales
  annotate(
    "rect",
    xmin = as.POSIXct("2019-03-04", tz = "UTC"),
    xmax = as.POSIXct("2019-03-13", tz = "UTC"),
    ymin = -Inf,
    ymax = Inf,
    alpha = 0,
    color = "#636363",
    size = 0.7,
    linetype = "dashed"
  ) +
  geom_text(
    data = data.frame(
      x = as.POSIXct("2019-03-10", tz = "UTC"),
      y = 98,
      label = "Mortalidad"
    ),
    aes(x = x, y = y, label = label),
    color = "#636363",
    size = 4
  )
```

**Puntos negativos:** 

* Antes del periodo de Mortalidad, no sale "Probabilidad de mortalidad", por lo que, en ese caso, el sistema de alerta temprana no funciona. 

* Durante la Mortalidad, el periodo de letalidad es muy corto, no abarca el evento entero. 

* Podría ser todo letal, pero la toma de datos durante la mortalidad no fue estrictamente todas las horas, por ende, no cumple con el criterio de duracion >6h... dificil de clasificar dentro de la categoria Letal. 

