Idaluz y Fredys
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
#Prueba de normalidad para las variables numéricas profundidad y salinidad
Oceanografia_Dataset <- read_excel("Oceanografia_Dataset.xlsx")
columnas_a_analizar <- c("Profundidad_del_agua_m", "Salinidad_ppm")
library(dplyr)
data <- read_excel("Oceanografia_Dataset.xlsx")
data <-data%>%select(all_of(columnas_a_analizar))
head(data)
## # A tibble: 6 × 2
## Profundidad_del_agua_m Salinidad_ppm
## <dbl> <dbl>
## 1 2744. 37.7
## 2 3576. 35.4
## 3 3014. 39.8
## 4 2724. 30.7
## 5 2118. 37.7
## 6 3229. 32.7
summary(data)
## Profundidad_del_agua_m Salinidad_ppm
## Min. : 2.73 Min. :30.00
## 1st Qu.:1239.34 1st Qu.:32.71
## Median :2390.04 Median :35.17
## Mean :2478.28 Mean :35.09
## 3rd Qu.:3684.57 3rd Qu.:37.56
## Max. :4996.39 Max. :39.98
shapiro_test <- shapiro.test(data$Profundidad_del_agua_m)
shapiro_test <- shapiro.test(data$Salinidad_ppm)
list(
estadistico = shapiro_test$statistic,
valor_p = shapiro_test$p.value,
conclusion = if (shapiro_test$p.value > 0.05) {
"No se puede rechazar la hipótesis nula (los datos parecen ser normales)"
}
)
## $estadistico
## W
## 0.9579959
##
## $valor_p
## [1] 2.759431e-15
##
## $conclusion
## NULL
#Prueba de chi cuadrado para independencia entre las variables categóricas Tipo de fondo marino y presencia de corales
# Cargar los datos desde el archivo Excel
data <- read_excel("Oceanografia_Dataset.xlsx")
# Crear la tabla de contingencia
tabla_contingencia <- table(data$Tipo_fondo_marino, data$Presencia_corales)
# Mostrar la tabla de contingencia
print("Tabla de contingencia:")
## [1] "Tabla de contingencia:"
print(tabla_contingencia)
##
## no sí
## arena 168 149
## lodo 125 150
## roca 151 147
# Prueba de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(tabla_contingencia)
print("Resultados de la Prueba de Chi-cuadrado:")
## [1] "Resultados de la Prueba de Chi-cuadrado:"
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: tabla_contingencia
## X-squared = 3.4607, df = 2, p-value = 0.1772
#ANOVA para comparar medias de Presencia de algas y Ph_agua
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Cargar paquetes necesarios
library(tidyr)
library(dplyr)
library(broom)
#Prueba de Bartlett para comprobar la homogeneidad de presencia de algas y ph de agua
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Realizar la prueba de Bartlett
# Cargar los paquetes necesarios
library(tidyr)
library(dplyr)
# Cargar los datos desde el archivo Excel
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Eliminar filas con valores faltantes
data <- na.omit(data)
#Correlación para examinar la relación entre dos variables numéricas profundidad y salinidad
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Seleccionar las columnas numéricas de interés
Salinidad_ppm <- data$Salinidad_ppm
Profundidad_del_agua_m <- data$Profundidad_del_agua_m
# Calcular la correlación
correlation <- cor(Profundidad_del_agua_m, Salinidad_ppm)
# Mostrar la correlación
print(paste("Correlación entre Profundidad del agua y Salinidad)", correlation))
## [1] "Correlación entre Profundidad del agua y Salinidad) -0.00510895499725549"
cor.test(data$Profundidad_del_agua_m, data$Salinidad_ppm)
##
## Pearson's product-moment correlation
##
## data: data$Profundidad_del_agua_m and data$Salinidad_ppm
## t = -0.15225, df = 888, p-value = 0.879
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.07079950 0.06062571
## sample estimates:
## cor
## -0.005108955