Amostragem Aleatória Simples sem Reposição

Abaixo temos uma região do espaço onde queremos estimar o total de estrelas.
Tal região foi dividida em 100 setores.

here

Onde:

UE(Unidade Elementar ou Unidade Populacional) são os setores \(i = 1,...,N\) onde N = 100(Tamanho da pupulação).

População Finita: P = {1,2,…,N}

Tamanho Amostral n = 10.

Característica de interesse(quantidade des estrelas) \(Y_i\) onde i = 1,…,N

Parâmetro \(\theta\) = {\(Y_1,Y_2,...,Y_N\)}.

Amostra: s \(\subset\) P.

Dados D = {\(Y_i,i\in s\)}

Gerando uma amostra aléatoria com a função “sample”.

pop = c(1:100)
n = 10 
#amostra = sample(pop,n,replace=FALSE)
amostra

##  [1] 16 11 39 66 50 76 80 48 68 54

sort(amostra) #amostra são os elementos da população sorteados organizados

##  [1] 11 16 39 48 50 54 66 68 76 80

# Contando o número de estrelas em cada setor sorteado(amostra) temos que nossos dados são
dados = c(40,7,43,32,30,32,34,18,6,8)

Portanto ficamos com a seguinte tabela.

n.o	Amostra	Dados
1	11	40
2	16	7
3	39	43
4	48	32
5	50	30
6	54	32
7	66	34
8	68	18
9	76	6
10	80	8

.Qual seria a sua estimativa do total de estrelas e da variância populacional baseado na tabela acima?

Temos que o total populacional T=N\(\overline{Y}\) \(\Longrightarrow\) \(\hat{T}\)=N\(\hat{\overline{Y}}\)

Um estimar não viesado para a média é \(\hat{\overline{Y}} = \frac{1}{n} \sum\limits_{i=1}^n Y_i\quad\) (média amostral).

N=100
mediaamostral = sum(dados)/length(dados)
(totalamostral = N*mediaamostral)

## [1] 2500

Um estimador não viciado para a variância populacional \(\sigma^2\) é:

\(\hat{\sigma^2}\) = \(S^2\) = \(\frac{1}{n}\sum\limits_{i=1}^n (Y_i-\hat{\overline{Y}})^2\) = \(\sum\limits_{i=1}^n Y_i^2 - n\hat{\overline{Y}}^2\) (Variância Amostral)

(varamostral = ((t(dados) %*% dados) - (n * mediaamostral^2))/(length(dados) - 1))

##          [,1]
## [1,] 197.3333

Temos que a Variância do total amostral é:

\(Var(\hat{\overline{T}})\) = \(N^2\frac{(1-f)}{n}\sigma^2\) \(\Longrightarrow\) \(\widehat{Var(\hat{\overline{T}})}\) = \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\), onde f = \(\frac{n}{N}\) (Estimador da variância do estimardor \(\hat{\overline{T}}\))…

Muita calma nessa hora. xD

f=n/N
(vartotal = N^2 * ((1-f)/n) * varamostral)

##        [,1]
## [1,] 177600

.Determine o intervalo de confiança para o total populacional baseado na tabela acima.

Para um n grande (que não é o caso xD) temos…

\(\hat{\overline{T}}\) \(\sim\) N(\(\overline{T}\),\(Var(\hat{\overline{T}})\)) \(\Longrightarrow\) \(\frac{\hat{\overline{T}} - \overline{T}}{Var(\hat{\overline{T}})}\) \(\sim\) N(0,1)

No calculo usaremos a estimativa de \(Var(\hat{\overline{T}})\), o que resultaria em uma t-student(n) mas para facilitar vamos usar a distribuição normal mesmo. XD

Sendo o \(\alpha\) = 5% temos que que o IC para o total populacional é

\(\hat{\overline{T}}\) \(\pm Z_{1-\frac{\alpha}{2}} Var(\hat{\overline{T}})\)

Portanto temos que um IC para o total populacional com \(\alpha\)=5% é dado por (liminf;limsup)

(liminf = totalamostral - qnorm(0.975) * sqrt(vartotal))

##         [,1]
## [1,] 1674.02

(limsup = totalamostral + qnorm(0.975) * sqrt(vartotal))

##         [,1]
## [1,] 3325.98

.Porque estimativas individuais seriam mais precisas se 20 quadrados fossem escolhidos em vez de 10? Como mediria esta precisão?

Sendo \(\beta\) a precisão de \(\hat{\overline{T}}\) onde \(\beta\) = \(Z_{\alpha}\) \(\widehat{Var(\hat{\overline{T}})}\) = \(Z_{\alpha}\) \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\).
Se a variância amostral \(\hat{\sigma^2}\) não aumentar então quanto mais aumentamos o n menor será o \(\beta\), ou seja, ficará mais preciso.

Sendo \(n_1\) = 10 e \(n_2\) = 20. Para medir o quando mais preciso as novas estimativas com \(n_2\) ficariam em relação a \(n_1\) fariamos a seguinte razão \(\frac{\widehat{Var_{n_2}(\hat{\overline{T}})}}{\widehat{Var_{n_1}(\hat{\overline{T}})}}\) .

.O que ocorreria com a precisão das estimativas e com o estimador se n = 100?

Se n = 100, ou seja n = N, então \(\beta\) (=\(Z_{\alpha}\) \(\widehat{Var(\hat{\overline{T}})}\) = \(Z_{\alpha}\) \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\)) seria zero. Ou seja, precisão de 100%, e estariamos fazendo um censo. Trabalhando com toda população.

Amostragem Aleatória Simples sem Reposição

ICMC-USP SME0807 - Técnicas de Amostragem

Giovani C Rodrigues 7151669