Amostra Aleatória Simples

pop <- c(rep(1,108),rep(0,252))

N <- length(pop)  # tamanho da população

p <- mean(pop) # proporçao amostral

n=360 # tamanho da amostra


B=10000
x_bar_com <- c()
x_bar_sem <- c()
for (i in 1:B)
{
  x_bar_com[i] <- mean(sample(pop,n,replace=TRUE))
  x_bar_sem[i] <- mean(sample(pop,n,replace=FALSE))
}

Com Reposição

mean(x_bar_com)
## [1] 0.3003958
var(x_bar_com)
## [1] 0.0005854536
hist(x_bar_com)

Valores teóricos, usando o valor populacional verdadeiro:

\[E(\bar{X}_n)=p=0.3\]

\[Var(\bar{X}_n)=\frac{p(1-p)}{n}=5.8333333\times 10^{-4}\]

Sem Reposição

Na aula, fizemos exemplos com reposição, para simplificar o conceito. Quando o experimento é feito sem reposição em uma população finita \(N\), a variância da média amostral sofre uma correção e não tem a mesma fórmula do caso com reposição.

mean(x_bar_sem)
## [1] 0.3
var(x_bar_sem)
## [1] 0
hist(x_bar_sem)

Valores teóricos, usando o valor populacional verdadeiro, amostra sem reposição e população finita:

\[E(\bar{X}_n)=p=0.3\]

\[Var(\bar{X}_n)=\left(1-\frac{n-1}{N-1}\right)\frac{p(1-p)}{n}=0\]

Aqui, no caso extremo em que \(n=N\), a amostra é toda a população, temos que: \[Var(\bar{X}_n)=\left(1-\frac{n-1}{N-1}\right)\frac{p(1-p)}{n}=0\]

Na segunda-feira, fizemos os cálculos considerando apenas amostras com reposição, caso em que a constante \(\left(1-\frac{n-1}{N-1}\right)\) não é necessária, ie, \(Var(\bar{X}_n)=\frac{p(1-p)}{n}\).

Exemplo - Amostra Aleatória Simples Sem Reposição

Refazendo o exemplo da aula, mas agora sem reposição.

População com \(N=3\), tendo os seguintes elementos:

  • elemento 1: valor 1 (\(X_1=1\))

  • elemento 2: valor 0 (\(X_2=0\))

  • elemento 3: valor 1 (\(X_3=1\))

Proporção populacional: \(p=\frac{1}{N}\sum_{i=1}^NX_i=2/3\).

Variância populacional: \(\frac{1}{N}\sum_{i=1}^N(X_i-p)^2=\frac{1}{3}\left[ (1-2/3)^2+(0-2/3)^2+(1-2/3)^2 \right]=\frac{1}{3}\left[\frac{1}{9} + \frac{4}{9}+\frac{1}{9} \right]=\frac{1}{3}\frac{6}{9}=\frac{2}{9}=p(1-p)\)

Amostras aleatórias simples sem reposição, \(n=2\):

listando todas as amostras possíveis: 1,2 ; 1,3 ; 2,3 ; 2,1 ; 3,2; 3,1 sendo que cada amostra tem probabilidade 1/6 de ocorrer.

  • 1,2: \(\hat{p}=1/2\)

  • 1,3: \(\hat{p}=1\)

  • 2,3 \(\hat{p}=1/2\)

  • 2,1: \(\hat{p}=1/2\)

  • 3,2 \(\hat{p}=1/2\)

  • 3,1: \(\hat{p}=1\)

Portanto, \(\hat{p}=1\) com probabilidade \(2/6\), \(\hat{p}=1/2\) com probabilidade \(4/6\).

\[E(\hat{p})=1\times \frac{2}{6}+\frac{1}{2}\times \frac{4}{6}=\frac{2}{3}=p\] \[Var(\hat{p})=\left(1-\frac{2}{3}\right)^2\times \frac{2}{6}+\left(\frac{1}{2}-\frac{2}{3}\right)^2\times \frac{4}{6}\]

\[Var(\hat{p})=\frac{1}{9}\times\frac{2}{6} + \frac{1}{36}\times \frac{4}{6}=\frac{1}{18}=\left(1-\frac{n-1}{N-1}\right)\frac{p(1-p)}{n}\]

https://web.ma.utexas.edu/users/parker/sampling/woreplshort.htm