library (dplyr)
library(readxl)
Só se pode fazer extrapolação de dados com amostras aleatórias, pois há necessidade de envolver probabilidade.
Divisão da população em zonas/regiões e aletoriedade dentro das zonas. Na amostra estratificada há a informação adicional de localização das pessoas que responderam a pesquisa.
Divisão em grupos de pessoas que são escolhidos aleatoriamente e respondem como uma só.
Divisão em pedaços espaçados de forma constante. O primeiro pedaço tem que ser escolhido de forma aleatória.
Populacao <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\AMOSTRAS ALEATORIAS.xlsx",
sheet = "AAEporsexo para R")
Populacao %>% sample_n(10)
## # A tibble: 10 × 3
## num Nome Sexo
## <dbl> <chr> <chr>
## 1 66 Luan Masculino
## 2 71 Stefany Feminino
## 3 25 Sarah Feminino
## 4 28 Lívia Feminino
## 5 46 Fernanda Feminino
## 6 20 Daniel Masculino
## 7 39 Eduarda Feminino
## 8 21 Henrique Masculino
## 9 80 Juliana Feminino
## 10 94 Maria Cecília Feminino
Amostra_sexo = Populacao %>% group_by(Sexo) %>% sample_n(5)
Amostra_sexo
## # A tibble: 10 × 3
## # Groups: Sexo [2]
## num Nome Sexo
## <dbl> <chr> <chr>
## 1 77 Joana Feminino
## 2 83 Ana Sophia Feminino
## 3 32 Clara Feminino
## 4 8 Laura Feminino
## 5 45 Lavínia Feminino
## 6 65 Danilo Masculino
## 7 25 Pietro Masculino
## 8 50 Joaquim Masculino
## 9 63 Nathan Masculino
## 10 87 Luiz Fernando Masculino
Populacao %>% distinct()
## # A tibble: 200 × 3
## num Nome Sexo
## <dbl> <chr> <chr>
## 1 1 Miguel Masculino
## 2 2 Davi Masculino
## 3 3 Gabriel Masculino
## 4 4 Arthur Masculino
## 5 5 Lucas Masculino
## 6 6 Matheus Masculino
## 7 7 Pedro Masculino
## 8 8 Guilherme Masculino
## 9 9 Gustavo Masculino
## 10 10 Rafael Masculino
## # ℹ 190 more rows
O esperado é que a taxa de não resposta fique entre 10 e 15 porcento.
O tamanho da população não afeta o tamanho da amostra, o tamanha da amostra é definido pela dispersão (desvio-padrão) das respostas possíveis, quanto maior o desvio-padrão maior deve ser a amostra. Em sumo tamanho da amostra = Desvio-padrão^2*1,962/Erro-aceitado2 (geralmente 2).
xbarra = 0.43
n = 2500
Desvio_padrao = 0.15
EP = Desvio_padrao/sqrt(n)
Z = 1.96
xbarra = 0.43 n = 2500 Desvio_padrao = 0.15 EP = Desvio_padra/√n
Qual o intervalo de confiança?
IC_inferior = xbarra - ME IC_superior = xbarra + ME
ME = EP*Z^2
IC_inferior = xbarra - EPZ^2 IC_superior = xbarra + EPZ^2
IC_inferior = xbarra - EP*Z*Z
IC_superior = xbarra + EP*Z*Z
IC_inferior
## [1] 0.4184752
IC_superior
## [1] 0.4415248
Com confiança de 95% a média da população está entre aproximadamente 0.42 e 0.44.