Introdução

No uso de dados coletados em pesquisas com amostras complexas, um dos pontos que deve ser observado ao fazer uso dessas informações é a análise apropriada desses dados. Esses dados não podem ser considerados como uma amostragem aleatória simples, ou seja, com observações independentes e uniformemente distribuídas. Durante a análise, alguns aspectos devem ser levados em consideração, como as probabilidades distintas de seleção das unidades, o efeito de conglomeração das unidades, a estratificação, a calibração para ajuste de não resposta e outros ajustes para totais conhecidos da população (Pessoa; Silva, 1998).

Posteriormente, aplicaram-se as técnicas de amostragem: aleatória simples, aleatória estratificada e por conglomerados. Na amostragem aleatória simples, selecionaram-se 50 municípios de forma aleatória. Já na amostragem aleatória estratificada, com o objetivo de garantir a representatividade das diferentes faixas populacionais, os municípios foram estratificados com base nas três categorias de população, sendo escolhido um número igual de municípios de cada estrato. Além disso, utilizou-se a amostragem por conglomerado, na qual os municípios são agrupados por população. Nesse método, seleciona-se aleatoriamente um conglomerado com base nas proporções de população e, em seguida, filtra-se os municípios pertencentes a esse conglomerado.

Metodologia

O presente relatório utiliza um banco de dados disponível no site do IBGE, contendo informações sobre os municípios da Paraíba. Nesse contexto, foi criada uma nova coluna para classificar cada município com base em sua população. Os municípios foram então categorizados em três faixas populacionais: até 9.999 habitantes, de 10.000 a 19.999 habitantes e igual ou superior a 20.000 habitantes.

Posteriormente, aplicaram-se as técnicas de amostragem: aleatória simples, aleatória estratificada e por conglomerados. Na amostragem aleatória simples, selecionaram-se 50 municípios de forma aleatória. Já na amostragem aleatória estratificada, com o objetivo de garantir a representatividade das diferentes faixas populacionais, os municípios foram estratificados com base nas três categorias de população, sendo escolhido um número igual de municípios de cada estrato.

Resultados e discussão

Amostragem Aleatória Simples
Município
Taperoá
Catingueira
Fagundes
Monteiro
Serra Grande
Barra de São Miguel
Catolé do Rocha
Igaracy
Araruna
Santa Teresinha
Logradouro
Santa Helena
Gurjão
Poço Dantas
Brejo dos Santos
Olivedos
Alagoa Nova
São Sebastião do Umbuzeiro
Conceição
São Mamede
Pedras de Fogo
Pitimbu
Livramento
São José de Princesa
Queimadas
Guarabira
Barra de Santana
Mulungu
Curral de Cima
Cuité de Mamanguape
Ouro Velho
Salgado de São Félix
Boa Ventura
Puxinanã
Araçagi
Curral Velho
Ingá
Poço de José de Moura
Arara
Mato Grosso
Areial
São José do Brejo do Cruz
Brejo do Cruz
Santo André
Coremas
Desterro
Prata
Sossêgo
Boa Vista
Dona Inês




Amostragem Aleatória Estratificada
Município População
16 Areia de Baraúnas até 9.999 habitantes
20 Baía da Traição até 9.999 habitantes
31 Boa Vista até 9.999 habitantes
55 Carrapateira até 9.999 habitantes
70 Cuité de Mamanguape até 9.999 habitantes
70.1 Cuité de Mamanguape até 9.999 habitantes
72 Curral Velho até 9.999 habitantes
73 Damião até 9.999 habitantes
78 Duas Estradas até 9.999 habitantes
105 Lastro até 9.999 habitantes
125 Mulungu até 9.999 habitantes
134 Parari até 9.999 habitantes
144 Pilões até 9.999 habitantes
152 Prata até 9.999 habitantes
156 Quixaba até 9.999 habitantes
160 Riachão do Bacamarte até 9.999 habitantes
161 Riachão do Poço até 9.999 habitantes
180 São Domingos do Cariri até 9.999 habitantes
180.1 São Domingos do Cariri até 9.999 habitantes
210 Sossêgo até 9.999 habitantes
3 Alagoa Grande maior ou igual a 20.000 habitantes
26 Bayeux maior ou igual a 20.000 habitantes
40 Caaporã maior ou igual a 20.000 habitantes
42 Cabedelo maior ou igual a 20.000 habitantes
42.1 Cabedelo maior ou igual a 20.000 habitantes
48 Cajazeiras maior ou igual a 20.000 habitantes
52 Campina Grande maior ou igual a 20.000 habitantes
52.1 Campina Grande maior ou igual a 20.000 habitantes
58 Catolé do Rocha maior ou igual a 20.000 habitantes
80 Esperança maior ou igual a 20.000 habitantes
80.1 Esperança maior ou igual a 20.000 habitantes
84 Guarabira maior ou igual a 20.000 habitantes
104 Lagoa Seca maior ou igual a 20.000 habitantes
111 Mamanguape maior ou igual a 20.000 habitantes
136 Patos maior ou igual a 20.000 habitantes
140 Pedras de Fogo maior ou igual a 20.000 habitantes
140.1 Pedras de Fogo maior ou igual a 20.000 habitantes
151 Pombal maior ou igual a 20.000 habitantes
153 Princesa Isabel maior ou igual a 20.000 habitantes
211 Sousa maior ou igual a 20.000 habitantes
5 Alagoinha de 10.000 a 19.999 habitantes
5.1 Alagoinha de 10.000 a 19.999 habitantes
9 São João do Rio do Peixe de 10.000 a 19.999 habitantes
27 Belém de 10.000 a 19.999 habitantes
27.1 Belém de 10.000 a 19.999 habitantes
34 Bonito de Santa Fé de 10.000 a 19.999 habitantes
77 Dona Inês de 10.000 a 19.999 habitantes
89 Ingá de 10.000 a 19.999 habitantes
93 Itatuba de 10.000 a 19.999 habitantes
94 Jacaraú de 10.000 a 19.999 habitantes
98 Juazeirinho de 10.000 a 19.999 habitantes
121 Mogeiro de 10.000 a 19.999 habitantes
137 Paulista de 10.000 a 19.999 habitantes
143 Pilar de 10.000 a 19.999 habitantes
147 Pitimbu de 10.000 a 19.999 habitantes
148 Pocinhos de 10.000 a 19.999 habitantes
166 Salgado de São Félix de 10.000 a 19.999 habitantes
209 Soledade de 10.000 a 19.999 habitantes
215 Tavares de 10.000 a 19.999 habitantes
215.1 Tavares de 10.000 a 19.999 habitantes




Amostragem de Conglomerados
Município População
Alagoinha de 10.000 a 19.999 habitantes
São João do Rio do Peixe de 10.000 a 19.999 habitantes
Araçagi de 10.000 a 19.999 habitantes
Arara de 10.000 a 19.999 habitantes
Araruna de 10.000 a 19.999 habitantes
Aroeiras de 10.000 a 19.999 habitantes
Barra de Santa Rosa de 10.000 a 19.999 habitantes
Belém de 10.000 a 19.999 habitantes
Bonito de Santa Fé de 10.000 a 19.999 habitantes
Boqueirão de 10.000 a 19.999 habitantes
Brejo do Cruz de 10.000 a 19.999 habitantes
Cacimba de Dentro de 10.000 a 19.999 habitantes
Conceição de 10.000 a 19.999 habitantes
Coremas de 10.000 a 19.999 habitantes
Cruz do Espírito Santo de 10.000 a 19.999 habitantes
Cuité de 10.000 a 19.999 habitantes
Dona Inês de 10.000 a 19.999 habitantes
Fagundes de 10.000 a 19.999 habitantes
Gurinhém de 10.000 a 19.999 habitantes
Imaculada de 10.000 a 19.999 habitantes
Ingá de 10.000 a 19.999 habitantes
Itapororoca de 10.000 a 19.999 habitantes
Itatuba de 10.000 a 19.999 habitantes
Jacaraú de 10.000 a 19.999 habitantes
Juazeirinho de 10.000 a 19.999 habitantes
Juripiranga de 10.000 a 19.999 habitantes
Lucena de 10.000 a 19.999 habitantes
Manaíra de 10.000 a 19.999 habitantes
Massaranduba de 10.000 a 19.999 habitantes
Mogeiro de 10.000 a 19.999 habitantes
Paulista de 10.000 a 19.999 habitantes
Piancó de 10.000 a 19.999 habitantes
Picuí de 10.000 a 19.999 habitantes
Pilar de 10.000 a 19.999 habitantes
Pitimbu de 10.000 a 19.999 habitantes
Pocinhos de 10.000 a 19.999 habitantes
Puxinanã de 10.000 a 19.999 habitantes
Remígio de 10.000 a 19.999 habitantes
Salgado de São Félix de 10.000 a 19.999 habitantes
Santa Luzia de 10.000 a 19.999 habitantes
São José de Piranhas de 10.000 a 19.999 habitantes
São Sebastião de Lagoa de Roça de 10.000 a 19.999 habitantes
São Vicente do Seridó de 10.000 a 19.999 habitantes
Serra Branca de 10.000 a 19.999 habitantes
Soledade de 10.000 a 19.999 habitantes
Sumé de 10.000 a 19.999 habitantes
Taperoá de 10.000 a 19.999 habitantes
Tavares de 10.000 a 19.999 habitantes
Teixeira de 10.000 a 19.999 habitantes
Uiraúna de 10.000 a 19.999 habitantes





Conclusão

As técnicas de amostragem, quando aplicadas corretamente, possibilitam uma melhor interpretação de dados de pesquisas de nível populacional, como na execução de sua coleta. Tanto ela pode ser trabalhada quando esses bancos de dados se encontram disponíveis, direcionando e filtrando as variáveis para uma melhor análise, como no planejamento de coleta de dados para redução de custos com a pesquisa.

Referências

PESSOA, D. G. C.; SILVA, P. L. N. Análise de dados amostrais complexos. São Paulo: Associação Brasileira de Estatística, v. 112, 1998.

Anexo

# Configuração inicial e carregamento de pacotes
library(readxl)
library(dplyr)
library(sampling)
library(knitr)
library(kableExtra)
library(ggplot2)
library(plotly)

# Carregamento dos dados
municipios_PB <- read_excel("dadosMunicipioPB.xlsx", sheet = 1, col_names = TRUE)

# Criando uma nova coluna de classificação de população
municipios_PB <- municipios_PB %>%
  mutate(População = case_when(
    populacao_Residente <= 9999 ~ "até 9.999 habitantes",
    populacao_Residente >= 10000 & populacao_Residente < 20000 ~ "de 10.000 a 19.999 habitantes",
    populacao_Residente >= 20000 ~ "maior ou igual a 20.000 habitantes",
    TRUE ~ NA_character_
  ))

# Verificando valores ausentes
sapply(municipios_PB, function(x) sum(is.na(x)))
sapply(municipios_PB, function(x) sum(is.nan(x)))

# Removendo coluna com valores ausentes
municipios_PB$mortalidade_Infantil <- NULL

# Realizando amostragem aleatória simples
amostra_simples <- sample_n(municipios_PB, size = 50, replace = FALSE)

# Exibindo a tabela da amostra
amostra_simples %>%
  select(municipio) %>%
  kable(
    caption = "Amostragem Aleatória Simples",
    col.names = c("Município"),
    align = "c"
  ) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))

# Realizando amostragem aleatória estratificada
tamanho_amostra <- c(20, 20, 20)
estratos <- strata(municipios_PB, stratanames = "População", size = tamanho_amostra, method = "srswr")
amostra_estratificada <- getdata(municipios_PB, estratos)

# Exibindo a tabela da amostra estratificada
amostra_estratificada %>%
  select(municipio, População) %>%
  kable(
    caption = "Amostragem Aleatória Estratificada",
    col.names = c("Município", "População"),
    align = "c"
  ) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))

# Amostragem por conglomerados
selec_habitantes <- municipios_PB %>% group_by(População) %>% summarise(n = n()) %>% mutate(prop = n/sum(n))
Classificacao <- sample_n(selec_habitantes, size = 1)
amostragem_conglomerados <- municipios_PB %>% filter(População == Classificacao$População)

# Exibindo a tabela da amostra por conglomerados
amostragem_conglomerados %>%
  select(municipio, População) %>%
  kable(
    caption = "Amostragem de Conglomerados",
    col.names = c("Município", "População"),
    align = "c"
  ) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))

# Criando gráfico interativo sem os nomes das barras
p <- ggplot(municipios_PB, aes(x = População, fill = População)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Distribuição da População nos Municípios da Paraíba",
       x = "Faixa de População",
       y = "Número de Municípios") +
  theme(axis.text.x = element_blank(),  # Remover rótulos do eixo x
        axis.ticks.x = element_blank())  # Remover ticks do eixo x
ggplotly(p)