library(readxl)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(car)
## Loading required package: carData
## 
## Attaching package: 'car'
## 
## The following object is masked from 'package:dplyr':
## 
##     recode
## 
## The following object is masked from 'package:purrr':
## 
##     some
library(ggplot2)
Oceanografia_Dataset <- read_excel("C:/Users/FREDY/Downloads/Oceanografia_Dataset.xlsx")
head(Oceanografia_Dataset)
## # A tibble: 6 × 10
##   Profundidad_del_agua_m Temperatura_agua_supe…¹ Salinidad_ppm Tipo_fondo_marino
##                    <dbl>                   <dbl>         <dbl> <chr>            
## 1                  2744.                    14.3          37.7 roca             
## 2                  3576.                    16.0          35.4 lodo             
## 3                  3014.                    14.6          39.8 arena            
## 4                  2724.                    19.0          30.7 roca             
## 5                  2118.                    21.0          37.7 arena            
## 6                  3229.                    16.4          32.7 lodo             
## # ℹ abbreviated name: ¹​Temperatura_agua_superficial_C
## # ℹ 6 more variables: Presencia_corales <chr>,
## #   Concentracion_oxigeno_disuelto_mg_L <dbl>, Presencia_algas <chr>,
## #   Velocidad_corriente_m_s <dbl>, Area_geografica <chr>, pH_agua <dbl>
# Prueba de normalidad profundidad
shapiro_test_profundidad <- shapiro.test(Oceanografia_Dataset$Profundidad_del_agua_m)
shapiro_test_profundidad
## 
##  Shapiro-Wilk normality test
## 
## data:  Oceanografia_Dataset$Profundidad_del_agua_m
## W = 0.95246, p-value = 2.341e-16

```r
if (shapiro_test_profundidad$p.value > 0.05) {
  resultado_profundidad <- "Se cumple la hipótesis nula: La variable presenta distribución normal."
} else {
  resultado_profundidad <- "No se cumple la hipótesis nula: La variable no presenta distribución normal."
}
resultado_profundidad
## [1] "No se cumple la hipótesis nula: La variable no presenta distribución normal."
# Prueba de normalidad salinidad
shapiro_test_salinidad <- shapiro.test(Oceanografia_Dataset$Salinidad_ppm)
shapiro_test_salinidad
## 
##  Shapiro-Wilk normality test
## 
## data:  Oceanografia_Dataset$Salinidad_ppm
## W = 0.958, p-value = 2.759e-15
if (shapiro_test_salinidad$p.value > 0.05) {
  resultado_salinidad <- "Se cumple la hipótesis nula: La variable presenta distribución normal."
} else {
  resultado_salinidad <- "No se cumple la hipótesis nula: La variable no presenta distribución normal."
}
resultado_salinidad
## [1] "No se cumple la hipótesis nula: La variable no presenta distribución normal."
# Tabla de contingencia
tabla_chi <- table(Oceanografia_Dataset$Tipo_fondo_marino, Oceanografia_Dataset$Presencia_corales)

# Prueba de chi-cuadrado para tipo de fondo marino y presencia de corales
chi_test <- chisq.test(tabla_chi)
chi_test
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_chi
## X-squared = 3.4607, df = 2, p-value = 0.1772
if (chi_test$p.value > 0.05) {
  resultado_chi <- "Se cumple la hipótesis nula: No existe asociación entre las variables y son independientes."
} else {
  resultado_chi <- "No se cumple la hipótesis nula: Existe asociación entre las variables y son dependientes."
}
resultado_chi
## [1] "Se cumple la hipótesis nula: No existe asociación entre las variables y son independientes."
# ANOVA para presencia de algas y pH del agua
Oceanografia_Dataset$Presencia_algas <- as.factor(Oceanografia_Dataset$Presencia_algas)

anova_result <- aov(pH_agua ~ Presencia_algas, data = Oceanografia_Dataset)
anova_summary <- summary(anova_result)

# Extraer el valor p del ANOVA
p_value_anova <- anova_summary[[1]][["Pr(>F)"]][1]

if (p_value_anova > 0.05) {
  resultado_anova <- "Se cumple la hipótesis nula: No hay diferencias significativas entre las medias."
} else {
  resultado_anova <- "No se cumple la hipótesis nula: Hay diferencias significativas entre las medias."
}
resultado_anova
## [1] "Se cumple la hipótesis nula: No hay diferencias significativas entre las medias."
# Prueba de Barlett de presencia de algas y pH del agua
bartlett_test <- bartlett.test(pH_agua ~ Presencia_algas, data = Oceanografia_Dataset)
bartlett_test
## 
##  Bartlett test of homogeneity of variances
## 
## data:  pH_agua by Presencia_algas
## Bartlett's K-squared = 1.3555, df = 2, p-value = 0.5078
if (bartlett_test$p.value > 0.05) {
  resultado_bartlett <- "Se cumple la hipótesis nula: Las varianzas son iguales."
} else {
  resultado_bartlett <- "No se cumple la hipótesis nula: Las varianzas son distintas."
}
resultado_bartlett
## [1] "Se cumple la hipótesis nula: Las varianzas son iguales."
# Correlacion entre profundidad - salinidad
cor_test <- cor.test(Oceanografia_Dataset$Profundidad_del_agua_m, Oceanografia_Dataset$Salinidad_ppm, method = "pearson")
cor_test
## 
##  Pearson's product-moment correlation
## 
## data:  Oceanografia_Dataset$Profundidad_del_agua_m and Oceanografia_Dataset$Salinidad_ppm
## t = -0.15225, df = 888, p-value = 0.879
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.07079950  0.06062571
## sample estimates:
##          cor 
## -0.005108955
if (cor_test$p.value > 0.05) {
  resultado_correlacion <- "Se cumple la hipótesis nula: No existe relación entre las dos variables."
} else {
  resultado_correlacion <- "No se cumple la hipótesis nula: Existe relación entre las dos variables."
}
resultado_correlacion
## [1] "Se cumple la hipótesis nula: No existe relación entre las dos variables."