title: “Untitled” author: “Laura Blanco Torres” date: “2025-04-29” output: html_document

Planteamiento del problema.

El equipo de investigación está evaluando si la varianza muestral de la velocidad del flujo en los ríos tropicales es consistente con la varianza histórica hipotética. Según estudios previos, se sabe que la varianza de la velocidad del flujo en estos ríos es σ²₀ = 1.5 (m/s)². Los datos obtenidos del equipo de investigación muestran una varianza muestral de s² = 0.95 (m/s)².

Datos

# Datos
n <- 30
s2_muestra <- 0.95
s2_hipotetica <- 1.5
alpha<-0.05


library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(skimr)

# Cargar datos
datos <- read_csv2("sedimentologia.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 100 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (2): Rio, Tipo_Sedimento
## dbl (4): ID_Muestra, Tamaño_Grano_mm, Velocidad_Flujo_m_s, Carga_Sedimentari...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Variables
numericas <- c("Tamaño_Grano_mm", "Velocidad_Flujo_m_s", "Carga_Sedimentaria_mg_L")
categoricas <- c("Rio", "Tipo_Sedimento")

# Conversión adecuada
datos <- datos %>% mutate(across(all_of(numericas), as.numeric))

# Ver estructura
skim(datos)
Data summary
Name datos
Number of rows 100
Number of columns 6
_______________________
Column type frequency:
character 2
numeric 4
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
Rio 0 1 4 8 0 5 0
Tipo_Sedimento 0 1 5 9 0 4 0

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
ID_Muestra 0 1 50.50 29.01 1.00 25.75 50.50 75.25 100.00 ▇▇▇▇▇
Tamaño_Grano_mm 0 1 4.96 2.76 0.14 2.59 4.86 7.01 9.99 ▆▆▇▇▆
Velocidad_Flujo_m_s 0 1 1.85 1.01 0.15 1.02 1.85 2.68 3.48 ▇▇▆▇▇
Carga_Sedimentaria_mg_L 0 1 242.45 155.22 12.06 100.23 248.88 378.81 497.45 ▇▅▅▅▆

Planteamiento de la Hipótesis

Se desea comprobar si la varianza de la velocidad del flujo en ríos tropicales ha cambiado respecto al valor histórico.

-Hipótesis nula (𝐻₀):𝜎² = 1.5
-Hipótesis alternativa (𝐻₁): 𝜎² ≠ 1.5

Estadistica

# Estadístico Chi-cuadrado
chi2_calculado <- (n - 1) * s2_muestra / s2_hipotetica
chi2_critico_inf <- qchisq(alpha / 2, df = n - 1)
chi2_critico_sup <- qchisq(1 - alpha / 2, df = n - 1)

# Resultados
chi2_calculado
## [1] 18.36667

##Valores criticos

# Valores críticos
chi2_izq <- qchisq(alpha/2, df = n-1)
chi2_der <- qchisq(1 - alpha/2, df = n-1)

P valor

# p-valor
p_valor <- 2 * min(
  pchisq(chi2_calculado, df = n-1),
  1 - pchisq(chi2_calculado, df = n-1)
)

# Mostrar resultados
cat("Estadístico observado (chi^2):", chi2_calculado, "\n")
## Estadístico observado (chi^2): 18.36667
cat("Valor crítico inferior:", chi2_critico_inf, "\n")
## Valor crítico inferior: 16.04707
cat("Valor crítico superior:", chi2_critico_sup, "\n")
## Valor crítico superior: 45.72229
cat("p-valor:", p_valor, "\n")
## p-valor: 0.1270894

Evaluar región critica

# Evaluar región crítica
if (chi2_calculado < chi2_critico_inf || chi2_calculado > chi2_critico_sup) {
  cat("Decisión: Se rechaza la hipótesis nula.\n")
} else {
  cat("Decisión: No se rechaza la hipótesis nula.\n")
}
## Decisión: No se rechaza la hipótesis nula.

##Conclusion

Dado que el valor del estadístico (18.37) está entre los valores críticos (16.05 y 45.72), y el p-valor (0.127) es mayor que el nivel de significancia (0.05), no se rechaza la hipótesis nula. La varianza del flujo en los ríos tropicales no ha cambiado significativamente respecto al valor histórico.