Abaixo temos uma região do espaço onde queremos estimar o total de estrelas.
Tal região foi dividida em 100 setores.
Onde:
UE(Unidade Elementar ou Unidade Populacional) são os setores \(i = 1,...,N\) onde N = 100(Tamanho da pupulação).
População Finita: P = {1,2,…,N}
Tamanho Amostral n = 10.
Característica de interesse(quantidade des estrelas) \(Y_i\) onde i = 1,…,N
Parâmetro \(\theta\) = {\(Y_1,Y_2,...,Y_N\)}.
Amostra: s \(\subset\) P.
Dados D = {\(Y_i,i\in s\)}
Gerando uma amostra aléatoria com a função “sample”.
pop = c(1:100)
n = 10
#amostra = sample(pop,n,replace=FALSE)
amostra
## [1] 16 11 39 66 50 76 80 48 68 54
sort(amostra) #amostra são os elementos da população sorteados organizados
## [1] 11 16 39 48 50 54 66 68 76 80
# Contando o número de estrelas em cada setor sorteado(amostra) temos que nossos dados são
dados = c(40,7,43,32,30,32,34,18,6,8)
Portanto ficamos com a seguinte tabela.
| n.o | Amostra | Dados |
|---|---|---|
| 1 | 11 | 40 |
| 2 | 16 | 7 |
| 3 | 39 | 43 |
| 4 | 48 | 32 |
| 5 | 50 | 30 |
| 6 | 54 | 32 |
| 7 | 66 | 34 |
| 8 | 68 | 18 |
| 9 | 76 | 6 |
| 10 | 80 | 8 |
.Qual seria a sua estimativa do total de estrelas e da variância populacional baseado na tabela acima?
Temos que o total populacional T=N\(\overline{Y}\) \(\Longrightarrow\) \(\hat{T}\)=N\(\hat{\overline{Y}}\)
Um estimar não viesado para a média é \(\hat{\overline{Y}} = \frac{1}{n} \sum\limits_{i=1}^n Y_i\quad\) (média amostral).
N=100
mediaamostral = sum(dados)/length(dados)
(totalamostral = N*mediaamostral)
## [1] 2500
Um estimador não viciado para a variância populacional \(\sigma^2\) é:
\(\hat{\sigma^2}\) = \(S^2\) = \(\frac{1}{n}\sum\limits_{i=1}^n (Y_i-\hat{\overline{Y}})^2\) = \(\sum\limits_{i=1}^n Y_i^2 - n\hat{\overline{Y}}^2\) (Variância Amostral)
(varamostral = ((t(dados) %*% dados) - (n * mediaamostral^2))/(length(dados) - 1))
## [,1]
## [1,] 197.3333
Temos que a Variância do total amostral é:
\(Var(\hat{\overline{T}})\) = \(N^2\frac{(1-f)}{n}\sigma^2\) \(\Longrightarrow\) \(\widehat{Var(\hat{\overline{T}})}\) = \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\), onde f = \(\frac{n}{N}\) (Estimador da variância do estimardor \(\hat{\overline{T}}\))…
Muita calma nessa hora. xD
f=n/N
(vartotal = N^2 * ((1-f)/n) * varamostral)
## [,1]
## [1,] 177600
.Determine o intervalo de confiança para o total populacional baseado na tabela acima.
Para um n grande (que não é o caso xD) temos…
\(\hat{\overline{T}}\) \(\sim\) N(\(\overline{T}\),\(Var(\hat{\overline{T}})\)) \(\Longrightarrow\) \(\frac{\hat{\overline{T}} - \overline{T}}{Var(\hat{\overline{T}})}\) \(\sim\) N(0,1)
No calculo usaremos a estimativa de \(Var(\hat{\overline{T}})\), o que resultaria em uma t-student(n) mas para facilitar vamos usar a distribuição normal mesmo. XD
Sendo o \(\alpha\) = 5% temos que que o IC para o total populacional é
\(\hat{\overline{T}}\) \(\pm Z_{1-\frac{\alpha}{2}} Var(\hat{\overline{T}})\)
Portanto temos que um IC para o total populacional com \(\alpha\)=5% é dado por (liminf;limsup)
(liminf = totalamostral - qnorm(0.975) * sqrt(vartotal))
## [,1]
## [1,] 1674.02
(limsup = totalamostral + qnorm(0.975) * sqrt(vartotal))
## [,1]
## [1,] 3325.98
.Porque estimativas individuais seriam mais precisas se 20 quadrados fossem escolhidos em vez de 10? Como mediria esta precisão?
Sendo \(\beta\) a precisão de \(\hat{\overline{T}}\) onde \(\beta\) = \(Z_{\alpha}\) \(\widehat{Var(\hat{\overline{T}})}\) = \(Z_{\alpha}\) \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\).
Se a variância amostral \(\hat{\sigma^2}\) não aumentar então quanto mais aumentamos o n menor será o \(\beta\), ou seja, ficará mais preciso.
Sendo \(n_1\) = 10 e \(n_2\) = 20. Para medir o quando mais preciso as novas estimativas com \(n_2\) ficariam em relação a \(n_1\) fariamos a seguinte razão \(\frac{\widehat{Var_{n_2}(\hat{\overline{T}})}}{\widehat{Var_{n_1}(\hat{\overline{T}})}}\) .
.O que ocorreria com a precisão das estimativas e com o estimador se n = 100?
Se n = 100, ou seja n = N, então \(\beta\) (=\(Z_{\alpha}\) \(\widehat{Var(\hat{\overline{T}})}\) = \(Z_{\alpha}\) \(N^2\frac{(1-f)}{n}\hat{\sigma^2}\)) seria zero. Ou seja, precisão de 100%, e estariamos fazendo um censo. Trabalhando com toda população.