Taller #1 estadistica

14.1.1 Media muestral

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

# Media y desviación estándar de la población (aproximada con todos los datos)
mu_hat <- mean(df$Ingresos, na.rm = TRUE)
s <- sd(df$Ingresos, na.rm = TRUE)

cat("Media poblacional aproximada (mu_hat):", mu_hat, "\n")

## Media poblacional aproximada (mu_hat): 114.2357

cat("Desviación estándar (s):", s, "\n")

## Desviación estándar (s): 27.93578

# Definir tamaños
n <- 30              # tamaño de la muestra (puedes cambiarlo)
N <- nrow(df)        # tamaño de la población

cat("Tamaño muestral (n):", n, "\n")

## Tamaño muestral (n): 30

cat("Tamaño poblacional (N):", N, "\n")

## Tamaño poblacional (N): 100

# Error estándar con corrección por población finita (FPC)
SE <- (s / sqrt(n)) * sqrt((N - n) / (N - 1))
cat("Error estándar con FPC (SE):", SE, "\n")

## Error estándar con FPC (SE): 4.288758

# Distribución muestral:
# X̄ ~ N(mu_hat, SE^2)

# Ejemplo 1: P(X̄ > 150)
c <- 150
p_mayor_c <- 1 - pnorm(c, mean = mu_hat, sd = SE)
cat("Probabilidad P(X̄ >", c, "):", p_mayor_c, "\n")

## Probabilidad P(X̄ > 150 ): 0

# Ejemplo 2: P(120 < X̄ < 160)
a <- 120
b <- 160
p_entre <- pnorm(b, mean = mu_hat, sd = SE) - pnorm(a, mean = mu_hat, sd = SE)
cat("Probabilidad P(", a, "< X̄ <", b, "):", p_entre, "\n")

## Probabilidad P( 120 < X̄ < 160 ): 0.0894663

library(ggplot2)

ggplot(df, aes(x = Ingresos)) +
  geom_histogram(binwidth = 10, fill = "skyblue", color = "black", alpha = 0.7) +
  geom_vline(xintercept = mu_hat, color = "red", linetype = "dashed", size = 1.2) +
  geom_vline(xintercept = mu_hat + s, color = "green", linetype = "dotted", size = 1) +
  geom_vline(xintercept = mu_hat - s, color = "green", linetype = "dotted", size = 1) +
  labs(title = "Distribución de Ingresos",
       subtitle = paste("Media =", round(mu_hat,2), " | Desviación Estándar =", round(s,2)),
       x = "Ingresos",
       y = "Frecuencia") +
  theme_minimal()

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

boxplot(df$Ingresos,
        main = "Boxplot de Ingresos",
        ylab = "Ingresos",
        col = "lightgreen")

set.seed(123)
n <- 30
muestra <- sample(df$Ingresos, n, replace = FALSE)

hist(muestra,
     main = "Histograma de la muestra (n=30)",
     xlab = "Ingresos",
     col = "skyblue",
     border = "white")
abline(v = mean(muestra), col = "red", lwd = 2)      # Media
abline(v = median(muestra), col = "darkgreen", lwd = 2, lty = 2)  # Mediana

par(mfrow = c(1,2)) # dos gráficos en una fila

# Histograma población
hist(df$Ingresos,
     main = "Distribución de Ingresos (Población)",
     xlab = "Ingresos",
     col = "orange",
     border = "white")
abline(v = mean(df$Ingresos), col = "blue", lwd = 2)

# Histograma muestra
hist(muestra,
     main = "Distribución de Ingresos (Muestra n=30)",
     xlab = "Ingresos",
     col = "skyblue",
     border = "white")
abline(v = mean(muestra), col = "red", lwd = 2)

```

Taller #1 estadistica

Samuel Blanco , Samuel Barraza , Samuel Lozano

2025-08-29

14.1.1 Media muestral

14.1.1 Media muestral – Conclusiones