Amostragem
UNIRIO
A amostragem é naturalmente usada em nossa vida diária. Exemplo: verificar o tempero de um alimento.
População: conjunto de elementos para os quais desejamos que as conclusões da pesquisa sejam válidas, esses elementos podem ser observados ou mensurados sobre as mesmas condições.
Parâmetro: medida que descreve certa característica dos elementos da população.
Quando é difícil pesquisar toda a população, recomenda-se usar a amostragem.
Amostras obtidas aleatoriamente – probabilidade de cada elemento da população fazer parte da amostra é igual.
Probabilidade de alguns ou de todos os elementos da população pertencer à amostra é desconhecida.
Consideraremos sempre o erro amostral sob 95% de probabilidade. Assim, se fixarmos o erro amostral tolerável em 2%, estaremos afirmando que uma estatística, calculada com base na amostra a ser selecionada, não deve diferir do parâmetro em mais que 2%, com 95% de probabilidade.
Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem se conhecer o tamanho da população, por meio da seguinte expressão:
\[n_0=\frac{1}{E_0^2}\]
\(𝑁\): tamanho (número de elementos) da população;
\(𝑛\): tamanho (número de elementos) da amostra;
\(𝑛_0\): uma primeira aproximação para o tamanho da amostra;
\(𝐸_0\): erro amostral tolerável.
Se a população for muito grande, digamos mais que 20 vezes o valor calculado em \(𝑛_0\), então \(𝑛_0\) já pode ser adotado como o tamanho da amostra \(𝑛=n_0\). Caso contrário é sugerido a seguinte correção:
\[n=\frac{N\times n_0}{N+n_0}\]
Planeja-se um levantamento por amostragem para avaliar diversas características da população das 𝑁 = 200 famílias moradoras de um certo bairro. Qual deve ser o tamanho mínimo de uma amostra aleatória simples para que possamos admitir, com 95% de probabilidade, que os erros amostrais não ultrapassem 4%?
\[n_0=\frac{1}{(0,04)^2}=625\] Como 625 é maior que 200 (famílias), usamos a correção.
\[n=\frac{200\times 625}{200+625}=152\]
E se fossem 20.000 famílias? Esse tamanho é 20 vezes maior que 625, logo poderíamos usar o tamanho amostral de 625 famílias.
Veja que: \[n=\frac{20000\times 625}{20000+625}=623\] que é muito próximo de 625.
Importante
Para garantir um erro amostral não superior a 4%, foi necessário uma amostra abrangendo 76% (152/200) da população quando o N era de 200, e quando o N era de 200.000, foi suficiente apenas uma amostra de 0,3% (623/200000) da população.
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.
DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.
HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.
leticia.raposo@uniriotec.br