Aula TCL

Author

VPI

Aula sobre Distribuição Normal e Teorema Central do Limite TCL

Modelo Normal

Distribuição para variável aleatória contínua, mais usada na galaxia.

Suponha que o tempo de aplicação de um questionário siga uma distribuição Normal com média 15 minutos e desvio padrão de 3 minutos.

# X ~ N(15, 3)
mu = 15
dp = 3

x = seq(5, 25, by=0.01)

plot(x, dnorm(x, mu, dp), type = 'l', lwd=2,
     ylim=c(0,0.4))

Assumindo que foram testadas 10 questionários, a distribuição da média de duração segue

\[ \bar{X} \sim N \left ( \mu, \sigma/\sqrt(n) \right ). \]

# Média Amostral
n = 10
# Xm = (X_1 + X_2 + ... + X_n)/n
# Xm ~ N(mu, dp/sqrt(n))
plot(x, dnorm(x, mu, dp), type = 'l', lwd=2,
     ylim=c(0,0.4))
par(new=T)
plot(x, dnorm(x, mu, dp/sqrt(n)), type='l', lwd=2, col=2,
     axes=F, ylab='',ylim=c(0,0.4))

Teorema Central do Limite (TCL)

Seja \(X_1, X_2, \ldots, X_n\) uma amostra aleatória com média \(\mu\) e desvio padrão \(\sigma\) então

\[ \bar{X} \overset{aprox}{\sim N} \left ( \mu, \frac{\sigma}{\sqrt{n}} \right ). \]

# 25 municípios com taxas de homicídio por ano que
# seguem distribuições Poisson independentes com
# taxa 3
# X_i ~ Pois(3), i = 1, ... 25

xm = array(NA, 1000)

for(i in 1:1000){
  x = rpois(25, 3)
  xm[i] = mean(x)
}

x_curve <- seq(min(xm), max(xm), length = 100)
y_curve <- dnorm(x_curve, mean = 3, sd = sqrt(3/25))

hist(xm, probability=T)
lines(x_curve, y_curve, col = "red", lwd = 2)