No uso de dados coletados em pesquisas com amostras complexas, um dos pontos que deve ser observado ao fazer uso dessas informações é a análise apropriada desses dados. Esses dados não podem ser considerados como uma amostragem aleatória simples, ou seja, com observações independentes e uniformemente distribuídas. Durante a análise, alguns aspectos devem ser levados em consideração, como as probabilidades distintas de seleção das unidades, o efeito de conglomeração das unidades, a estratificação, a calibração para ajuste de não resposta e outros ajustes para totais conhecidos da população (Pessoa; Silva, 1998).
Posteriormente, aplicaram-se as técnicas de amostragem: aleatória simples, aleatória estratificada e por conglomerados. Na amostragem aleatória simples, selecionaram-se 50 municípios de forma aleatória. Já na amostragem aleatória estratificada, com o objetivo de garantir a representatividade das diferentes faixas populacionais, os municípios foram estratificados com base nas três categorias de população, sendo escolhido um número igual de municípios de cada estrato. Além disso, utilizou-se a amostragem por conglomerado, na qual os municípios são agrupados por população. Nesse método, seleciona-se aleatoriamente um conglomerado com base nas proporções de população e, em seguida, filtra-se os municípios pertencentes a esse conglomerado.
O presente relatório utiliza um banco de dados disponível no site do IBGE, contendo informações sobre os municípios da Paraíba. Nesse contexto, foi criada uma nova coluna para classificar cada município com base em sua população. Os municípios foram então categorizados em três faixas populacionais: até 9.999 habitantes, de 10.000 a 19.999 habitantes e igual ou superior a 20.000 habitantes.
Posteriormente, aplicaram-se as técnicas de amostragem: aleatória simples, aleatória estratificada e por conglomerados. Na amostragem aleatória simples, selecionaram-se 50 municípios de forma aleatória. Já na amostragem aleatória estratificada, com o objetivo de garantir a representatividade das diferentes faixas populacionais, os municípios foram estratificados com base nas três categorias de população, sendo escolhido um número igual de municípios de cada estrato.
| Município |
|---|
| Taperoá |
| Catingueira |
| Fagundes |
| Monteiro |
| Serra Grande |
| Barra de São Miguel |
| Catolé do Rocha |
| Igaracy |
| Araruna |
| Santa Teresinha |
| Logradouro |
| Santa Helena |
| Gurjão |
| Poço Dantas |
| Brejo dos Santos |
| Olivedos |
| Alagoa Nova |
| São Sebastião do Umbuzeiro |
| Conceição |
| São Mamede |
| Pedras de Fogo |
| Pitimbu |
| Livramento |
| São José de Princesa |
| Queimadas |
| Guarabira |
| Barra de Santana |
| Mulungu |
| Curral de Cima |
| Cuité de Mamanguape |
| Ouro Velho |
| Salgado de São Félix |
| Boa Ventura |
| Puxinanã |
| Araçagi |
| Curral Velho |
| Ingá |
| Poço de José de Moura |
| Arara |
| Mato Grosso |
| Areial |
| São José do Brejo do Cruz |
| Brejo do Cruz |
| Santo André |
| Coremas |
| Desterro |
| Prata |
| Sossêgo |
| Boa Vista |
| Dona Inês |
| Município | População | |
|---|---|---|
| 16 | Areia de Baraúnas | até 9.999 habitantes |
| 20 | Baía da Traição | até 9.999 habitantes |
| 31 | Boa Vista | até 9.999 habitantes |
| 55 | Carrapateira | até 9.999 habitantes |
| 70 | Cuité de Mamanguape | até 9.999 habitantes |
| 70.1 | Cuité de Mamanguape | até 9.999 habitantes |
| 72 | Curral Velho | até 9.999 habitantes |
| 73 | Damião | até 9.999 habitantes |
| 78 | Duas Estradas | até 9.999 habitantes |
| 105 | Lastro | até 9.999 habitantes |
| 125 | Mulungu | até 9.999 habitantes |
| 134 | Parari | até 9.999 habitantes |
| 144 | Pilões | até 9.999 habitantes |
| 152 | Prata | até 9.999 habitantes |
| 156 | Quixaba | até 9.999 habitantes |
| 160 | Riachão do Bacamarte | até 9.999 habitantes |
| 161 | Riachão do Poço | até 9.999 habitantes |
| 180 | São Domingos do Cariri | até 9.999 habitantes |
| 180.1 | São Domingos do Cariri | até 9.999 habitantes |
| 210 | Sossêgo | até 9.999 habitantes |
| 3 | Alagoa Grande | maior ou igual a 20.000 habitantes |
| 26 | Bayeux | maior ou igual a 20.000 habitantes |
| 40 | Caaporã | maior ou igual a 20.000 habitantes |
| 42 | Cabedelo | maior ou igual a 20.000 habitantes |
| 42.1 | Cabedelo | maior ou igual a 20.000 habitantes |
| 48 | Cajazeiras | maior ou igual a 20.000 habitantes |
| 52 | Campina Grande | maior ou igual a 20.000 habitantes |
| 52.1 | Campina Grande | maior ou igual a 20.000 habitantes |
| 58 | Catolé do Rocha | maior ou igual a 20.000 habitantes |
| 80 | Esperança | maior ou igual a 20.000 habitantes |
| 80.1 | Esperança | maior ou igual a 20.000 habitantes |
| 84 | Guarabira | maior ou igual a 20.000 habitantes |
| 104 | Lagoa Seca | maior ou igual a 20.000 habitantes |
| 111 | Mamanguape | maior ou igual a 20.000 habitantes |
| 136 | Patos | maior ou igual a 20.000 habitantes |
| 140 | Pedras de Fogo | maior ou igual a 20.000 habitantes |
| 140.1 | Pedras de Fogo | maior ou igual a 20.000 habitantes |
| 151 | Pombal | maior ou igual a 20.000 habitantes |
| 153 | Princesa Isabel | maior ou igual a 20.000 habitantes |
| 211 | Sousa | maior ou igual a 20.000 habitantes |
| 5 | Alagoinha | de 10.000 a 19.999 habitantes |
| 5.1 | Alagoinha | de 10.000 a 19.999 habitantes |
| 9 | São João do Rio do Peixe | de 10.000 a 19.999 habitantes |
| 27 | Belém | de 10.000 a 19.999 habitantes |
| 27.1 | Belém | de 10.000 a 19.999 habitantes |
| 34 | Bonito de Santa Fé | de 10.000 a 19.999 habitantes |
| 77 | Dona Inês | de 10.000 a 19.999 habitantes |
| 89 | Ingá | de 10.000 a 19.999 habitantes |
| 93 | Itatuba | de 10.000 a 19.999 habitantes |
| 94 | Jacaraú | de 10.000 a 19.999 habitantes |
| 98 | Juazeirinho | de 10.000 a 19.999 habitantes |
| 121 | Mogeiro | de 10.000 a 19.999 habitantes |
| 137 | Paulista | de 10.000 a 19.999 habitantes |
| 143 | Pilar | de 10.000 a 19.999 habitantes |
| 147 | Pitimbu | de 10.000 a 19.999 habitantes |
| 148 | Pocinhos | de 10.000 a 19.999 habitantes |
| 166 | Salgado de São Félix | de 10.000 a 19.999 habitantes |
| 209 | Soledade | de 10.000 a 19.999 habitantes |
| 215 | Tavares | de 10.000 a 19.999 habitantes |
| 215.1 | Tavares | de 10.000 a 19.999 habitantes |
| Município | População |
|---|---|
| Alagoinha | de 10.000 a 19.999 habitantes |
| São João do Rio do Peixe | de 10.000 a 19.999 habitantes |
| Araçagi | de 10.000 a 19.999 habitantes |
| Arara | de 10.000 a 19.999 habitantes |
| Araruna | de 10.000 a 19.999 habitantes |
| Aroeiras | de 10.000 a 19.999 habitantes |
| Barra de Santa Rosa | de 10.000 a 19.999 habitantes |
| Belém | de 10.000 a 19.999 habitantes |
| Bonito de Santa Fé | de 10.000 a 19.999 habitantes |
| Boqueirão | de 10.000 a 19.999 habitantes |
| Brejo do Cruz | de 10.000 a 19.999 habitantes |
| Cacimba de Dentro | de 10.000 a 19.999 habitantes |
| Conceição | de 10.000 a 19.999 habitantes |
| Coremas | de 10.000 a 19.999 habitantes |
| Cruz do Espírito Santo | de 10.000 a 19.999 habitantes |
| Cuité | de 10.000 a 19.999 habitantes |
| Dona Inês | de 10.000 a 19.999 habitantes |
| Fagundes | de 10.000 a 19.999 habitantes |
| Gurinhém | de 10.000 a 19.999 habitantes |
| Imaculada | de 10.000 a 19.999 habitantes |
| Ingá | de 10.000 a 19.999 habitantes |
| Itapororoca | de 10.000 a 19.999 habitantes |
| Itatuba | de 10.000 a 19.999 habitantes |
| Jacaraú | de 10.000 a 19.999 habitantes |
| Juazeirinho | de 10.000 a 19.999 habitantes |
| Juripiranga | de 10.000 a 19.999 habitantes |
| Lucena | de 10.000 a 19.999 habitantes |
| Manaíra | de 10.000 a 19.999 habitantes |
| Massaranduba | de 10.000 a 19.999 habitantes |
| Mogeiro | de 10.000 a 19.999 habitantes |
| Paulista | de 10.000 a 19.999 habitantes |
| Piancó | de 10.000 a 19.999 habitantes |
| Picuí | de 10.000 a 19.999 habitantes |
| Pilar | de 10.000 a 19.999 habitantes |
| Pitimbu | de 10.000 a 19.999 habitantes |
| Pocinhos | de 10.000 a 19.999 habitantes |
| Puxinanã | de 10.000 a 19.999 habitantes |
| Remígio | de 10.000 a 19.999 habitantes |
| Salgado de São Félix | de 10.000 a 19.999 habitantes |
| Santa Luzia | de 10.000 a 19.999 habitantes |
| São José de Piranhas | de 10.000 a 19.999 habitantes |
| São Sebastião de Lagoa de Roça | de 10.000 a 19.999 habitantes |
| São Vicente do Seridó | de 10.000 a 19.999 habitantes |
| Serra Branca | de 10.000 a 19.999 habitantes |
| Soledade | de 10.000 a 19.999 habitantes |
| Sumé | de 10.000 a 19.999 habitantes |
| Taperoá | de 10.000 a 19.999 habitantes |
| Tavares | de 10.000 a 19.999 habitantes |
| Teixeira | de 10.000 a 19.999 habitantes |
| Uiraúna | de 10.000 a 19.999 habitantes |
As técnicas de amostragem, quando aplicadas corretamente, possibilitam uma melhor interpretação de dados de pesquisas de nível populacional, como na execução de sua coleta. Tanto ela pode ser trabalhada quando esses bancos de dados se encontram disponíveis, direcionando e filtrando as variáveis para uma melhor análise, como no planejamento de coleta de dados para redução de custos com a pesquisa.
PESSOA, D. G. C.; SILVA, P. L. N. Análise de dados amostrais complexos. São Paulo: Associação Brasileira de Estatística, v. 112, 1998.
# Configuração inicial e carregamento de pacotes
library(readxl)
library(dplyr)
library(sampling)
library(knitr)
library(kableExtra)
library(ggplot2)
library(plotly)
# Carregamento dos dados
municipios_PB <- read_excel("dadosMunicipioPB.xlsx", sheet = 1, col_names = TRUE)
# Criando uma nova coluna de classificação de população
municipios_PB <- municipios_PB %>%
mutate(População = case_when(
populacao_Residente <= 9999 ~ "até 9.999 habitantes",
populacao_Residente >= 10000 & populacao_Residente < 20000 ~ "de 10.000 a 19.999 habitantes",
populacao_Residente >= 20000 ~ "maior ou igual a 20.000 habitantes",
TRUE ~ NA_character_
))
# Verificando valores ausentes
sapply(municipios_PB, function(x) sum(is.na(x)))
sapply(municipios_PB, function(x) sum(is.nan(x)))
# Removendo coluna com valores ausentes
municipios_PB$mortalidade_Infantil <- NULL
# Realizando amostragem aleatória simples
amostra_simples <- sample_n(municipios_PB, size = 50, replace = FALSE)
# Exibindo a tabela da amostra
amostra_simples %>%
select(municipio) %>%
kable(
caption = "Amostragem Aleatória Simples",
col.names = c("Município"),
align = "c"
) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))
# Realizando amostragem aleatória estratificada
tamanho_amostra <- c(20, 20, 20)
estratos <- strata(municipios_PB, stratanames = "População", size = tamanho_amostra, method = "srswr")
amostra_estratificada <- getdata(municipios_PB, estratos)
# Exibindo a tabela da amostra estratificada
amostra_estratificada %>%
select(municipio, População) %>%
kable(
caption = "Amostragem Aleatória Estratificada",
col.names = c("Município", "População"),
align = "c"
) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))
# Amostragem por conglomerados
selec_habitantes <- municipios_PB %>% group_by(População) %>% summarise(n = n()) %>% mutate(prop = n/sum(n))
Classificacao <- sample_n(selec_habitantes, size = 1)
amostragem_conglomerados <- municipios_PB %>% filter(População == Classificacao$População)
# Exibindo a tabela da amostra por conglomerados
amostragem_conglomerados %>%
select(municipio, População) %>%
kable(
caption = "Amostragem de Conglomerados",
col.names = c("Município", "População"),
align = "c"
) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))
# Criando gráfico interativo sem os nomes das barras
p <- ggplot(municipios_PB, aes(x = População, fill = População)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribuição da População nos Municípios da Paraíba",
x = "Faixa de População",
y = "Número de Municípios") +
theme(axis.text.x = element_blank(), # Remover rótulos do eixo x
axis.ticks.x = element_blank()) # Remover ticks do eixo x
ggplotly(p)