Taller Bondad

Idaluz y Fredys

library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
#Prueba de normalidad para las variables numéricas profundidad y salinidad
Oceanografia_Dataset <- read_excel("Oceanografia_Dataset.xlsx")
columnas_a_analizar <- c("Profundidad_del_agua_m", "Salinidad_ppm")
library(dplyr)
data <- read_excel("Oceanografia_Dataset.xlsx")
data <-data%>%select(all_of(columnas_a_analizar))
head(data)
## # A tibble: 6 × 2
##   Profundidad_del_agua_m Salinidad_ppm
##                    <dbl>         <dbl>
## 1                  2744.          37.7
## 2                  3576.          35.4
## 3                  3014.          39.8
## 4                  2724.          30.7
## 5                  2118.          37.7
## 6                  3229.          32.7
summary(data)
##  Profundidad_del_agua_m Salinidad_ppm  
##  Min.   :   2.73        Min.   :30.00  
##  1st Qu.:1239.34        1st Qu.:32.71  
##  Median :2390.04        Median :35.17  
##  Mean   :2478.28        Mean   :35.09  
##  3rd Qu.:3684.57        3rd Qu.:37.56  
##  Max.   :4996.39        Max.   :39.98
 shapiro_test <- shapiro.test(data$Profundidad_del_agua_m)
  shapiro_test <- shapiro.test(data$Salinidad_ppm)
     list(
    estadistico = shapiro_test$statistic,
    valor_p = shapiro_test$p.value,
    conclusion = if (shapiro_test$p.value > 0.05) {
      "No se puede rechazar la hipótesis nula (los datos parecen ser normales)"
    }
  )
## $estadistico
##         W 
## 0.9579959 
## 
## $valor_p
## [1] 2.759431e-15
## 
## $conclusion
## NULL
#Prueba de chi cuadrado para independencia entre las variables categóricas Tipo de fondo marino y presencia de corales
# Cargar los datos desde el archivo Excel
data <- read_excel("Oceanografia_Dataset.xlsx")

# Crear la tabla de contingencia
tabla_contingencia <- table(data$Tipo_fondo_marino, data$Presencia_corales)

# Mostrar la tabla de contingencia
print("Tabla de contingencia:")
## [1] "Tabla de contingencia:"
print(tabla_contingencia)
##        
##          no  sí
##   arena 168 149
##   lodo  125 150
##   roca  151 147
# Prueba de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(tabla_contingencia)
print("Resultados de la Prueba de Chi-cuadrado:")
## [1] "Resultados de la Prueba de Chi-cuadrado:"
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_contingencia
## X-squared = 3.4607, df = 2, p-value = 0.1772
#ANOVA para comparar medias de Presencia de algas y Ph_agua
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Cargar paquetes necesarios
library(tidyr)
library(dplyr)
library(broom)
#Prueba de Bartlett para comprobar la homogeneidad de presencia de algas y ph de agua
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Realizar la prueba de Bartlett
# Cargar los paquetes necesarios
library(tidyr)
library(dplyr)

# Cargar los datos desde el archivo Excel
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)

# Eliminar filas con valores faltantes
data <- na.omit(data)
#Correlación para examinar la relación entre dos variables numéricas profundidad y salinidad
Oceanografia_Dataset <- "Oceanografia_Dataset.xlsx"
data <- read_excel(Oceanografia_Dataset)
# Seleccionar las columnas numéricas de interés
Salinidad_ppm <- data$Salinidad_ppm
Profundidad_del_agua_m <- data$Profundidad_del_agua_m

# Calcular la correlación
correlation <- cor(Profundidad_del_agua_m, Salinidad_ppm)

# Mostrar la correlación
print(paste("Correlación entre Profundidad del agua y Salinidad)", correlation))
## [1] "Correlación entre Profundidad del agua y Salinidad) -0.00510895499725549"
cor.test(data$Profundidad_del_agua_m, data$Salinidad_ppm)
## 
##  Pearson's product-moment correlation
## 
## data:  data$Profundidad_del_agua_m and data$Salinidad_ppm
## t = -0.15225, df = 888, p-value = 0.879
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.07079950  0.06062571
## sample estimates:
##          cor 
## -0.005108955