Atividade Tópicos de Amostragem probabilística
## This version of Shiny is designed to work with 'htmlwidgets' >= 1.5.
## Please upgrade via install.packages('htmlwidgets').
Teoria da Amostragem
Neste texto iremos discorrer um pouco acerca dos tipos de amostragem probabilística, mas para isso é necessário entender o que é uma População, um Censo e uma Amostra.
População:
Uma população é um conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população.
Censo:
Uma pesquisa que leva em conta todos os indivíduos de uma população é denominada pesquisa/levantamento censitário ou simplesmente Censo.
Amostra:
Um subconjunto (parte) de elementos de uma população, que são representativos para estudar a característica de interesse da população é denominada Amostra. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis.
- Por que fazer amostragem ao invés de um censo? Vantagens da pesquisa por amostragem em relação ao censo:
- é mais barata;
- é mais rápida;
- é mais fácil de ser controlada por envolver operações menores.
- Desvantagens da pesquisa por amostragem em relação ao censo:
- o censo pode ser mais vantajoso quando a população é pequena e/ou as informações são de fácil obtenção.
- os resultados da pesquisa por amostragem carregam erro;
- se a população for muito heterogênea o erro pode ser muito grande (e a precisão muita baixa). Neste caso pode ser necessária uma amostra muito grande;
Tipos de Amostragem Probabilística
Planos de Amostragem:
Para a definição do plano amostral devem-se ter bem definidos:
Unidade amostral: indivíduos ou grupos de indivíduos (conglomerados);
Sistema de referência: lista completa das unidades amostrais. N = tamanho da população, é definido pelo número de indivíduos da população amostral; n = tamanho da amostra, definido pelo número de indivíduos selecionados na amostra.
Note que o tamanho da população sempre será maior que o tamanho da amostra: \[ N>n\]
AAS - Amostragem Aleatória Simples
Na A.A.S., a amostra de tamanho n é selecionada ao acaso dentre os N elementos da população amostral.
- Procedimento de sorteio:
- Um indivíduo é selecionado ao acaso dentre os N possíveis;
- O segundo indivíduo é selecionado ao acaso dentre os (N – 1) restantes…
- . . . e assim por diante, até que todos os n indivíduos sejam sorteados.
Esse procedimento tem a característica de ser “sem reposição”, o que significa que: cada indivíduo aparece uma única vez na amostra.
Procedimentos “com reposição”, quando o indivíduo pode aparecer mais de uma vez na amostra, não serão abordados por serem poucos comuns na prática.
Na AAS a probabilidade de qualquer indivíduo, ou elemento, da população fazer parte da amostra é igual a \[Prob.Indiv= n/N\].
- Como realizar o sorteio?
- geração números aleatórios, pelo computador;
- tabela de números aleatórios;
- globos com bolinhas numeradas;
- qualquer outra forma aleatória de escolha que preserve a propriedade de que cada unidade amostral tenha a mesma chance de ser selecionada.
AAE - Amostragem Estratificada
Quando a população é muito heterogênea, ou seja, quando as características observadas variam muito de um indivíduo para outro, é aconselhável subdividir a população em estratos homogêneos.
A população é dividida em k estratos sendo que, uma A.A.S. é aplicada em cada um dos deles.
Definições:
- Tamanhos dos estratos: \(N_{1}\),\(N_{2}\),\(N_{3}\), … ,\(N_{k}\), de forma que \(N_{1}+N_{2}+N_{3}+ ... +N_{k} =N\)
- Tamanhos das amostras nos estrados: \(n_{1}\),\(n_{2}\),\(n_{3}\), … ,\(n_{k}\), de forma que \(n_{1}+n_{2}+n_{3}+ ... +n_{k} =n\)
Obs: A AAE produz resultados mais precisos do que a A.A.S. com o mesmo tamanho de amostra. É mais cara, por segmentar a população.
Pergunta: Sabendo que o tamanho da amostra é n, como alocar, ou, determinar o número de indivíduos a serem selecionados em cada um dos estratos?
- Alocação por igual: se se desconfia de que os estratos são todos de tamanhos parecidos, ou seja,\(N_{1}\approx N_{2}\approx N_{3}\approx ... \approx N_{k}\)
Então pode-se fazer: \(n_{1}=n_{2}=n_{3}= ... =n_{k}\)
- Exemplo: Se o tamanho de uma amostra for \(n=56\) e, o número de estratos é \(k=4\), então, \(n_{1}=n_{2}=n_{3}=n_{4}=14\)
- Alocação proporcional ao tamanho do estrato: na alocação proporcional ao tamanho, os tamanhos das amostras devem seguir a mesma relação de proporcionalidade dos tamanhos dos estratos, ou seja,\[\frac{n_{1}}{n}=\frac{N_{1}}{N}, \ \frac{n_{2}}{n}=\frac{N_{2}}{N}, \ ...\ , \frac{n_{k}}{n}=\frac{N_{k}}{N} \ ,ou seja;\] \[n_{1} = \frac{nN_{1}}{N}, \ n_{2}=\frac{nN_{2}}{N}, \ ...\ , n_{k}=\frac{nN_{k}}{N}\]
AAC - Amostragem Aleatória por Conglomerados
Na amostragem por conglomerados os elementos da população são agrupados em conglomerados ou clusters (grupos), que serão as unidades amostrais a serem selecionadas.
A divisão deve ser feita de forma que os conglomerados tenham as mesmas características da população.
- Na AAC uma AAS é aplicada para a seleção aleatória de k conglomerados.
Um* a vez selecionados os conglomerados, todos os seus elementos devem ser observados.
O procedimento descrito acima é uma AAC em um estágio, quando se realiza uma única seleção de conglomerados.A AAC pode, ainda, ser aplicada em dois ou mais estágios onde, após a escolha dos conglomerados, aplica-se um segundo sorteio aleatório dentre os seus elementos.
- Exemplos: Estudo sobre a percepção social dos problemas de quantidade, qualidade e custo dos recursos hídricos em São Carlos.
Definindo-se os quarteirões como sendo os conglomerados:
- AAC em 1 estágio:
- Uma A.A.S. é aplicada para a seleção de uma amostra aleatória de quarteirões, e o questionário é aplicado a todos os domicílios dos quarteirões selecionados.
- AAC em 2 estágios:
No 1°. estágio: aplica-se uma A.A.S. para se selecionar uma amostra de quarteirões;
No 2°. estágio: dentre os quarteirões selecionados no 1o. estágio, sorteia-se uma amostra aleatória de domicílios que efetivamente participarão da amostra.
O A AAC produz resultados menos precisos do que a AAS com o mesmo tamanho de amostra e, por consequência, do que a AAE
É mais barata por agrupar os elementos da população.
Na AAC o tamanho da amostra n será determinado a posteriori, pelo número total de elementos observados nos conglomerados (no estágio final de amostragem).
A.Sist - Amostragem Sistemática
É aplicada de forma sistemática, tendo em mão um sistema de referência de fácil acesso.
Na amostragem sistemática além da facilidade de acesso ao sistema de referência, a informação a ser coletada também é de fácil acesso.
Fichas de cadastro de assinantes (revistas, provedores de acesso à internet, serviço telefônico, etc…); cadastro de funcionários; peças numa linha de produção; mudas num canteiro; etc…
Procedimento: com o sistema de referência em mãos:
determina-se o intervalo de seleção, que é dado por \(R=N/n\);
sorteia-se um indivíduo, ou item, dentre os \(R\) primeiros da relação;
a partir daí, seleciona-se os indivíduos sistematicamente a cada intervalo de tamanho \(R\).
- Exemplo: se a população tem tamanho \(N=84\) e deve-se selecionar uma amostra de tamanho\(n=6\), então, tendo-se em mão uma relação com os \(84\) indivíduos da população:
Divide-se população em 6 seções de tamanho \(84\div6= 14\);
Seleciona-se aleatoriamente o primeiro indivíduo da amostra dentre os \(14\) primeiros (por exemplo, o de número \(5\));
O segundo indivíduo a ser selecionado é o \(5 + 14 = 19\), ou seja, o 19°. da relação;
O terceiro é o 19+14=33, ouseja, o 330. da relação, e assim por diante.
Resumindo:
Vale Recordar:
Toda amostragem como não considera a população como um todo está sujeita a erros, mas nunca confunda:
Um Erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias.
Ocorre um Erro não amostral quando os dados amostrais são coletados , registrados ou analisados incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não-aleatória e tendenciosa , a utilização de um instrumento de mensuração defeituoso , uma questão formulada de modo tendencioso , um grande número de recusas de reposta ou a cópia incorreta dos dados amostrais.
==Atividade==
Um professor de estatística afim de ensinar seus 32 alunos propos o sorteio de 3 caixas de bombons para seus alunos. O aluno(a) a ser sorteado ganharia uma e somente uma das caixas. :
- Calcule a probabilidade que cada aluno possui referente ao número de caixas a ser sorteada
*Primeiramente devemos notar que para haver justiça neste sorteio devemos garantir que a probabilidade de que cada aluno seja sorteado seja igual entre eles, assim utilizaremos a Amostragem aleatória Simples: Antes de realizar o sorteio cada aluno tem iguais chances de ser sorteado assim como são 3 caixas e 32 alunos a chance de cada um nessa situação será de:
[1] 0.09375
ou seja, 9.37% Após o primeiro sorteio restarão 2 caixas e 31 alunos (lembrando que o aluno sorteado não continua no sorteio) a chance de cada um nessa situação será de:’
[1] 6.451613
ou seja, 6.45% E por fim restará somente uma caixa a ser sorteada para os 30 restante, assim cada aluno restante terá:
[1] 3.333333
3,33% de chance de ser sorteado.
- Com o problema solucionado ajude o professor a sortear aleatoriamente três alunos que ganharão o prêmio.
*Como foi comentado no item anterior para garantir que todos os alunos tenham a mesma chance de ser sorteados iremos utilizar a Amostragem Aleatória Simples. Para esse sorteio iremos primeiramente atribuir um número a cada aluno (usando a lista de frequencia por exemplo)
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
[24] 24 25 26 27 28 29 30 31 32
[1] 14 30 16