library(readxl)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
##
## The following object is masked from 'package:dplyr':
##
## recode
##
## The following object is masked from 'package:purrr':
##
## some
library(ggplot2)
Oceanografia_Dataset <- read_excel("C:/Users/FREDY/Downloads/Oceanografia_Dataset.xlsx")
head(Oceanografia_Dataset)
## # A tibble: 6 × 10
## Profundidad_del_agua_m Temperatura_agua_supe…¹ Salinidad_ppm Tipo_fondo_marino
## <dbl> <dbl> <dbl> <chr>
## 1 2744. 14.3 37.7 roca
## 2 3576. 16.0 35.4 lodo
## 3 3014. 14.6 39.8 arena
## 4 2724. 19.0 30.7 roca
## 5 2118. 21.0 37.7 arena
## 6 3229. 16.4 32.7 lodo
## # ℹ abbreviated name: ¹Temperatura_agua_superficial_C
## # ℹ 6 more variables: Presencia_corales <chr>,
## # Concentracion_oxigeno_disuelto_mg_L <dbl>, Presencia_algas <chr>,
## # Velocidad_corriente_m_s <dbl>, Area_geografica <chr>, pH_agua <dbl>
# Prueba de normalidad profundidad
shapiro_test_profundidad <- shapiro.test(Oceanografia_Dataset$Profundidad_del_agua_m)
shapiro_test_profundidad
##
## Shapiro-Wilk normality test
##
## data: Oceanografia_Dataset$Profundidad_del_agua_m
## W = 0.95246, p-value = 2.341e-16
```r
if (shapiro_test_profundidad$p.value > 0.05) {
resultado_profundidad <- "Se cumple la hipótesis nula: La variable presenta distribución normal."
} else {
resultado_profundidad <- "No se cumple la hipótesis nula: La variable no presenta distribución normal."
}
resultado_profundidad
## [1] "No se cumple la hipótesis nula: La variable no presenta distribución normal."
# Prueba de normalidad salinidad
shapiro_test_salinidad <- shapiro.test(Oceanografia_Dataset$Salinidad_ppm)
shapiro_test_salinidad
##
## Shapiro-Wilk normality test
##
## data: Oceanografia_Dataset$Salinidad_ppm
## W = 0.958, p-value = 2.759e-15
if (shapiro_test_salinidad$p.value > 0.05) {
resultado_salinidad <- "Se cumple la hipótesis nula: La variable presenta distribución normal."
} else {
resultado_salinidad <- "No se cumple la hipótesis nula: La variable no presenta distribución normal."
}
resultado_salinidad
## [1] "No se cumple la hipótesis nula: La variable no presenta distribución normal."
# Tabla de contingencia
tabla_chi <- table(Oceanografia_Dataset$Tipo_fondo_marino, Oceanografia_Dataset$Presencia_corales)
# Prueba de chi-cuadrado para tipo de fondo marino y presencia de corales
chi_test <- chisq.test(tabla_chi)
chi_test
##
## Pearson's Chi-squared test
##
## data: tabla_chi
## X-squared = 3.4607, df = 2, p-value = 0.1772
if (chi_test$p.value > 0.05) {
resultado_chi <- "Se cumple la hipótesis nula: No existe asociación entre las variables y son independientes."
} else {
resultado_chi <- "No se cumple la hipótesis nula: Existe asociación entre las variables y son dependientes."
}
resultado_chi
## [1] "Se cumple la hipótesis nula: No existe asociación entre las variables y son independientes."
# ANOVA para presencia de algas y pH del agua
Oceanografia_Dataset$Presencia_algas <- as.factor(Oceanografia_Dataset$Presencia_algas)
anova_result <- aov(pH_agua ~ Presencia_algas, data = Oceanografia_Dataset)
anova_summary <- summary(anova_result)
# Extraer el valor p del ANOVA
p_value_anova <- anova_summary[[1]][["Pr(>F)"]][1]
if (p_value_anova > 0.05) {
resultado_anova <- "Se cumple la hipótesis nula: No hay diferencias significativas entre las medias."
} else {
resultado_anova <- "No se cumple la hipótesis nula: Hay diferencias significativas entre las medias."
}
resultado_anova
## [1] "Se cumple la hipótesis nula: No hay diferencias significativas entre las medias."
# Prueba de Barlett de presencia de algas y pH del agua
bartlett_test <- bartlett.test(pH_agua ~ Presencia_algas, data = Oceanografia_Dataset)
bartlett_test
##
## Bartlett test of homogeneity of variances
##
## data: pH_agua by Presencia_algas
## Bartlett's K-squared = 1.3555, df = 2, p-value = 0.5078
if (bartlett_test$p.value > 0.05) {
resultado_bartlett <- "Se cumple la hipótesis nula: Las varianzas son iguales."
} else {
resultado_bartlett <- "No se cumple la hipótesis nula: Las varianzas son distintas."
}
resultado_bartlett
## [1] "Se cumple la hipótesis nula: Las varianzas son iguales."
# Correlacion entre profundidad - salinidad
cor_test <- cor.test(Oceanografia_Dataset$Profundidad_del_agua_m, Oceanografia_Dataset$Salinidad_ppm, method = "pearson")
cor_test
##
## Pearson's product-moment correlation
##
## data: Oceanografia_Dataset$Profundidad_del_agua_m and Oceanografia_Dataset$Salinidad_ppm
## t = -0.15225, df = 888, p-value = 0.879
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.07079950 0.06062571
## sample estimates:
## cor
## -0.005108955
if (cor_test$p.value > 0.05) {
resultado_correlacion <- "Se cumple la hipótesis nula: No existe relación entre las dos variables."
} else {
resultado_correlacion <- "No se cumple la hipótesis nula: Existe relación entre las dos variables."
}
resultado_correlacion
## [1] "Se cumple la hipótesis nula: No existe relación entre las dos variables."