Atividade Tópicos de Amostragem probabilística

## This version of Shiny is designed to work with 'htmlwidgets' >= 1.5.
##     Please upgrade via install.packages('htmlwidgets').

Teoria da Amostragem

Neste texto iremos discorrer um pouco acerca dos tipos de amostragem probabilística, mas para isso é necessário entender o que é uma População, um Censo e uma Amostra.

População:

Uma população é um conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população.

Censo:

Uma pesquisa que leva em conta todos os indivíduos de uma população é denominada pesquisa/levantamento censitário ou simplesmente Censo.

Amostra:

Um subconjunto (parte) de elementos de uma população, que são representativos para estudar a característica de interesse da população é denominada Amostra. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis.

  • Por que fazer amostragem ao invés de um censo? Vantagens da pesquisa por amostragem em relação ao censo:
  1. é mais barata;
  2. é mais rápida;
  3. é mais fácil de ser controlada por envolver operações menores.
  • Desvantagens da pesquisa por amostragem em relação ao censo:
  1. o censo pode ser mais vantajoso quando a população é pequena e/ou as informações são de fácil obtenção.
  2. os resultados da pesquisa por amostragem carregam erro;
  3. se a população for muito heterogênea o erro pode ser muito grande (e a precisão muita baixa). Neste caso pode ser necessária uma amostra muito grande;

Tipos de Amostragem Probabilística

Planos de Amostragem:

Para a definição do plano amostral devem-se ter bem definidos:

  • Unidade amostral: indivíduos ou grupos de indivíduos (conglomerados);

  • Sistema de referência: lista completa das unidades amostrais. N = tamanho da população, é definido pelo número de indivíduos da população amostral; n = tamanho da amostra, definido pelo número de indivíduos selecionados na amostra.

Note que o tamanho da população sempre será maior que o tamanho da amostra: \[ N>n\]

AAS - Amostragem Aleatória Simples

Na A.A.S., a amostra de tamanho n é selecionada ao acaso dentre os N elementos da população amostral.

  • Procedimento de sorteio:
  1. Um indivíduo é selecionado ao acaso dentre os N possíveis;
  2. O segundo indivíduo é selecionado ao acaso dentre os (N – 1) restantes…
  3. . . . e assim por diante, até que todos os n indivíduos sejam sorteados.

Esse procedimento tem a característica de ser “sem reposição”, o que significa que: cada indivíduo aparece uma única vez na amostra.

Procedimentos “com reposição”, quando o indivíduo pode aparecer mais de uma vez na amostra, não serão abordados por serem poucos comuns na prática.

Na AAS a probabilidade de qualquer indivíduo, ou elemento, da população fazer parte da amostra é igual a \[Prob.Indiv= n/N\].

  • Como realizar o sorteio?
  1. geração números aleatórios, pelo computador;
  2. tabela de números aleatórios;
  3. globos com bolinhas numeradas;
  4. qualquer outra forma aleatória de escolha que preserve a propriedade de que cada unidade amostral tenha a mesma chance de ser selecionada.

AAE - Amostragem Estratificada

Quando a população é muito heterogênea, ou seja, quando as características observadas variam muito de um indivíduo para outro, é aconselhável subdividir a população em estratos homogêneos.

A população é dividida em k estratos sendo que, uma A.A.S. é aplicada em cada um dos deles.

Definições:

  1. Tamanhos dos estratos: \(N_{1}\),\(N_{2}\),\(N_{3}\), … ,\(N_{k}\), de forma que \(N_{1}+N_{2}+N_{3}+ ... +N_{k} =N\)
  2. Tamanhos das amostras nos estrados: \(n_{1}\),\(n_{2}\),\(n_{3}\), … ,\(n_{k}\), de forma que \(n_{1}+n_{2}+n_{3}+ ... +n_{k} =n\)
  • Obs: A AAE produz resultados mais precisos do que a A.A.S. com o mesmo tamanho de amostra. É mais cara, por segmentar a população.

  • Pergunta: Sabendo que o tamanho da amostra é n, como alocar, ou, determinar o número de indivíduos a serem selecionados em cada um dos estratos?

  1. Alocação por igual: se se desconfia de que os estratos são todos de tamanhos parecidos, ou seja,\(N_{1}\approx N_{2}\approx N_{3}\approx ... \approx N_{k}\)

Então pode-se fazer: \(n_{1}=n_{2}=n_{3}= ... =n_{k}\)

  • Exemplo: Se o tamanho de uma amostra for \(n=56\) e, o número de estratos é \(k=4\), então, \(n_{1}=n_{2}=n_{3}=n_{4}=14\)
  1. Alocação proporcional ao tamanho do estrato: na alocação proporcional ao tamanho, os tamanhos das amostras devem seguir a mesma relação de proporcionalidade dos tamanhos dos estratos, ou seja,\[\frac{n_{1}}{n}=\frac{N_{1}}{N}, \ \frac{n_{2}}{n}=\frac{N_{2}}{N}, \ ...\ , \frac{n_{k}}{n}=\frac{N_{k}}{N} \ ,ou seja;\] \[n_{1} = \frac{nN_{1}}{N}, \ n_{2}=\frac{nN_{2}}{N}, \ ...\ , n_{k}=\frac{nN_{k}}{N}\]

AAC - Amostragem Aleatória por Conglomerados

Na amostragem por conglomerados os elementos da população são agrupados em conglomerados ou clusters (grupos), que serão as unidades amostrais a serem selecionadas.

A divisão deve ser feita de forma que os conglomerados tenham as mesmas características da população.

  • Na AAC uma AAS é aplicada para a seleção aleatória de k conglomerados.

Um* a vez selecionados os conglomerados, todos os seus elementos devem ser observados.

O procedimento descrito acima é uma AAC em um estágio, quando se realiza uma única seleção de conglomerados.A AAC pode, ainda, ser aplicada em dois ou mais estágios onde, após a escolha dos conglomerados, aplica-se um segundo sorteio aleatório dentre os seus elementos.

  • Exemplos: Estudo sobre a percepção social dos problemas de quantidade, qualidade e custo dos recursos hídricos em São Carlos.

Definindo-se os quarteirões como sendo os conglomerados:

  • AAC em 1 estágio:
  1. Uma A.A.S. é aplicada para a seleção de uma amostra aleatória de quarteirões, e o questionário é aplicado a todos os domicílios dos quarteirões selecionados.
  • AAC em 2 estágios:
  1. No 1°. estágio: aplica-se uma A.A.S. para se selecionar uma amostra de quarteirões;

  2. No 2°. estágio: dentre os quarteirões selecionados no 1o. estágio, sorteia-se uma amostra aleatória de domicílios que efetivamente participarão da amostra.

  • O A AAC produz resultados menos precisos do que a AAS com o mesmo tamanho de amostra e, por consequência, do que a AAE

  • É mais barata por agrupar os elementos da população.

  • Na AAC o tamanho da amostra n será determinado a posteriori, pelo número total de elementos observados nos conglomerados (no estágio final de amostragem).

A.Sist - Amostragem Sistemática

É aplicada de forma sistemática, tendo em mão um sistema de referência de fácil acesso.

Na amostragem sistemática além da facilidade de acesso ao sistema de referência, a informação a ser coletada também é de fácil acesso.

  • Fichas de cadastro de assinantes (revistas, provedores de acesso à internet, serviço telefônico, etc…); cadastro de funcionários; peças numa linha de produção; mudas num canteiro; etc…

  • Procedimento: com o sistema de referência em mãos:

  1. determina-se o intervalo de seleção, que é dado por \(R=N/n\);

  2. sorteia-se um indivíduo, ou item, dentre os \(R\) primeiros da relação;

  3. a partir daí, seleciona-se os indivíduos sistematicamente a cada intervalo de tamanho \(R\).

  • Exemplo: se a população tem tamanho \(N=84\) e deve-se selecionar uma amostra de tamanho\(n=6\), então, tendo-se em mão uma relação com os \(84\) indivíduos da população:
  1. Divide-se população em 6 seções de tamanho \(84\div6= 14\);

  2. Seleciona-se aleatoriamente o primeiro indivíduo da amostra dentre os \(14\) primeiros (por exemplo, o de número \(5\));

  3. O segundo indivíduo a ser selecionado é o \(5 + 14 = 19\), ou seja, o 19°. da relação;

  4. O terceiro é o 19+14=33, ouseja, o 330. da relação, e assim por diante.

Resumindo:

Vale Recordar:

Toda amostragem como não considera a população como um todo está sujeita a erros, mas nunca confunda:

  1. Um Erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias.

  2. Ocorre um Erro não amostral quando os dados amostrais são coletados , registrados ou analisados incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não-aleatória e tendenciosa , a utilização de um instrumento de mensuração defeituoso , uma questão formulada de modo tendencioso , um grande número de recusas de reposta ou a cópia incorreta dos dados amostrais.

==Atividade==

Um professor de estatística afim de ensinar seus 32 alunos propos o sorteio de 3 caixas de bombons para seus alunos. O aluno(a) a ser sorteado ganharia uma e somente uma das caixas. :

  1. Calcule a probabilidade que cada aluno possui referente ao número de caixas a ser sorteada

*Primeiramente devemos notar que para haver justiça neste sorteio devemos garantir que a probabilidade de que cada aluno seja sorteado seja igual entre eles, assim utilizaremos a Amostragem aleatória Simples: Antes de realizar o sorteio cada aluno tem iguais chances de ser sorteado assim como são 3 caixas e 32 alunos a chance de cada um nessa situação será de:

[1] 0.09375

ou seja, 9.37% Após o primeiro sorteio restarão 2 caixas e 31 alunos (lembrando que o aluno sorteado não continua no sorteio) a chance de cada um nessa situação será de:’

[1] 6.451613

ou seja, 6.45% E por fim restará somente uma caixa a ser sorteada para os 30 restante, assim cada aluno restante terá:

[1] 3.333333

3,33% de chance de ser sorteado.

  1. Com o problema solucionado ajude o professor a sortear aleatoriamente três alunos que ganharão o prêmio.

*Como foi comentado no item anterior para garantir que todos os alunos tenham a mesma chance de ser sorteados iremos utilizar a Amostragem Aleatória Simples. Para esse sorteio iremos primeiramente atribuir um número a cada aluno (usando a lista de frequencia por exemplo)

 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
[24] 24 25 26 27 28 29 30 31 32
[1] 14 30 16

Matheus Couto de Oliveira Oliva - 8°Período

13/04/2020