library (dplyr)
library(readxl)

Planejamento amostral

Só se pode fazer extrapolação de dados com amostras aleatórias, pois há necessidade de envolver probabilidade.

Métodos de seleção de amostra

Amostra estratificada

Divisão da população em zonas/regiões e aletoriedade dentro das zonas. Na amostra estratificada há a informação adicional de localização das pessoas que responderam a pesquisa.

Amostra por conglomerado

Divisão em grupos de pessoas que são escolhidos aleatoriamente e respondem como uma só.

Amostra sistemática

Divisão em pedaços espaçados de forma constante. O primeiro pedaço tem que ser escolhido de forma aleatória.

Criando amostras

População total:

Populacao <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\AMOSTRAS ALEATORIAS.xlsx", 
    sheet = "AAEporsexo para R")

Criando amostra aleatória:

Populacao %>% sample_n(10) 
## # A tibble: 10 × 3
##      num Nome          Sexo     
##    <dbl> <chr>         <chr>    
##  1    66 Luan          Masculino
##  2    71 Stefany       Feminino 
##  3    25 Sarah         Feminino 
##  4    28 Lívia         Feminino 
##  5    46 Fernanda      Feminino 
##  6    20 Daniel        Masculino
##  7    39 Eduarda       Feminino 
##  8    21 Henrique      Masculino
##  9    80 Juliana       Feminino 
## 10    94 Maria Cecília Feminino

Criando uma amostra estratificada por sexo:

Amostra_sexo = Populacao %>% group_by(Sexo) %>% sample_n(5)
Amostra_sexo
## # A tibble: 10 × 3
## # Groups:   Sexo [2]
##      num Nome          Sexo     
##    <dbl> <chr>         <chr>    
##  1    77 Joana         Feminino 
##  2    83 Ana Sophia    Feminino 
##  3    32 Clara         Feminino 
##  4     8 Laura         Feminino 
##  5    45 Lavínia       Feminino 
##  6    65 Danilo        Masculino
##  7    25 Pietro        Masculino
##  8    50 Joaquim       Masculino
##  9    63 Nathan        Masculino
## 10    87 Luiz Fernando Masculino

Verificando se hé registro duplo

Populacao %>% distinct()
## # A tibble: 200 × 3
##      num Nome      Sexo     
##    <dbl> <chr>     <chr>    
##  1     1 Miguel    Masculino
##  2     2 Davi      Masculino
##  3     3 Gabriel   Masculino
##  4     4 Arthur    Masculino
##  5     5 Lucas     Masculino
##  6     6 Matheus   Masculino
##  7     7 Pedro     Masculino
##  8     8 Guilherme Masculino
##  9     9 Gustavo   Masculino
## 10    10 Rafael    Masculino
## # ℹ 190 more rows

Taxa de não resposta

O esperado é que a taxa de não resposta fique entre 10 e 15 porcento.

Tamanho da amostra

O tamanho da população não afeta o tamanho da amostra, o tamanha da amostra é definido pela dispersão (desvio-padrão) das respostas possíveis, quanto maior o desvio-padrão maior deve ser a amostra. Em sumo tamanho da amostra = Desvio-padrão^2*1,962/Erro-aceitado2 (geralmente 2).

———————————————————————————————————–

Distribuição amostral

Exemplo

xbarra = 0.43
n = 2500
Desvio_padrao = 0.15
EP = Desvio_padrao/sqrt(n)
Z = 1.96

xbarra = 0.43 n = 2500 Desvio_padrao = 0.15 EP = Desvio_padra/√n

Qual o intervalo de confiança?

IC_inferior = xbarra - ME IC_superior = xbarra + ME

ME = EP*Z^2

IC_inferior = xbarra - EPZ^2 IC_superior = xbarra + EPZ^2

IC_inferior = xbarra - EP*Z*Z
IC_superior = xbarra + EP*Z*Z
IC_inferior
## [1] 0.4184752
IC_superior
## [1] 0.4415248

Com confiança de 95% a média da população está entre aproximadamente 0.42 e 0.44.