O presente documento tem como finalidade aplicar técnicas de amostragem nos dados do Estado do Piauí, disponibilizados pelo Instituto Brasileiro de Geografia e Estatística - IBGE
Na área da estatística, a escolha da técnica de amostragem adequada é fundamental para garantir a representatividade dos dados e a validade dos resultados obtidos. Este relatório apresenta um estudo sobre a aplicação de três técnicas de amostragem, amostragem aleatória simples, amostragem aleatória estratificada e amostragem aleatória por conglomerado. Cada técnica tem suas próprias características e aplicações específicas, que serão discutidas detalhadamente no decorrer desse documento. A análise será conduzida utilizando dados de fonte oficial, explorando as variáveis demográficas município e população residente do Estado do Piauí de 2021, proporcionando uma visão abrangente sobre como cada técnica funciona. O objetivo foi selecionar uma amostra representativa de municípios com base na variável de interesse, População Residente (PR), para análise estatística.
Para verificar a eficácia das diferentes técnicas de amostragem, foi utilizado os dados oficiais do Estado do Piauí de 2021. Segue a descrição de como foi aplicada as três técnicas de amostragem:
A importação dos dados foi realizada a partir de um arquivo Excel
chamado “piaui.xlsx” usando a biblioteca readxl.
1.library(readxl): Esta linha carrega a biblioteca
readxl, que é necessária para ler arquivos Excel no R.
2.meuxlsx <- "piaui.xlsx": O nome do arquivo Excel é
atribuído à variável meuxlsx.
3.Dados <- read_excel(path = meuxlsx, sheet = 1):
Esta linha lê os dados do arquivo Excel. A função
read_excel() é usada para isso. O
path = meuxlsx especifica o caminho do arquivo Excel a ser
lido. sheet = 1 especifica que a leitura deve ser feita na
primeira planilha do arquivo Excel, vale lembrar que planilhas são
numeradas começando de 1.
4.dados <- as.data.frame(Dados): Esta linha converte
o objeto retornado por read_excel(), que é um tibble, em um
data.frame R clássico. Isso é útil porque
data.frame é um tipo de estrutura de dados mais amplamente
utilizado em R, compatível com muitas outras funções e pacotes.
Os dados utilizados foram obtidos do Instituto Brasileiro de Geografia e Estatística(IBGE) e abrangem 224 observações de municípios do Estado do Piauí de 2021, com 11 variáveis no total.
Variáveis do banco de dados:
Variáveis de interesse: Municipio e População residente(PR)
Categórica nominal: Municipio
Variável numérica contínua: População residente(PR)
Nesta técnica, selecionaremos aleatoriamente uma amostra simples de municípios sem considerar estratificação. Isso nos permitirá estimar parâmetros gerais da população com base na variável População Residente(PR), ou seja, cada unidade da população tem a mesma probabilidade de ser selecionada.
Tamanho da amostra:
Para determinar o tamanho adequado da amostra aleatória simples neste estudo, temos a fórmula para populações finitas. A fórmula considera o tamanho da população total (\(N\)), o valor crítico da distribuição normal (\(Z\)), a proporção estimada (\(p\)) e a margem de erro desejada (\(E\)).
\[ n = \frac{N \cdot Z^2 \cdot p \cdot (1 - p)}{E^2 \cdot (N - 1) + Z^2 \cdot p \cdot (1 - p)} \]
Para o Estado do Piauí, com uma população total de 224 municípios:
Aplicando os valores na fórmula, obtemos:
\[ n = \frac{224 \cdot 1.96^2 \cdot 0.5 \cdot (1 - 0.5)}{0.05^2 \cdot (224 - 1) + 1.96^2 \cdot 0.5 \cdot (1 - 0.5)} \] \[ n = 142 \]
Portanto, uma amostra de 142 municípios é calculada para garantir representatividade estatística adequada e precisão nas estimativas realizadas neste estudo.
## Tamanho da amostra: 142
Foi selecionado 142 munícipios aleatoriamente de forma que cada município tinha a mesma probabilidade de ser escolhido.
| Número | Municipio | PR |
|---|---|---|
| 1 | Nova Santa Rita | 4076 |
| 2 | Sebastião Barros | 3202 |
| 3 | Santana do Piauí | 4125 |
| 4 | Aroeiras do Itaim | 2690 |
| 5 | São João do Piauí | 21421 |
| 6 | Regeneração | 17133 |
| 7 | Capitão de Campos | 11100 |
| 8 | Landri Sales | 5213 |
| 9 | Campinas do Piauí | 4937 |
| 10 | Várzea Grande | 4417 |
| 11 | União | 46119 |
| 12 | Patos do Piauí | 5425 |
| 13 | Gilbués | 10892 |
| 14 | Guadalupe | 10270 |
| 15 | São José do Peixe | 3297 |
| 16 | Simplício Mendes | 13881 |
| 17 | São Félix do Piauí | 2842 |
| 18 | Guaribas | 4276 |
| 19 | Nazária | 10262 |
| 20 | Itaueira | 10323 |
| 21 | Demerval Lobão | 15853 |
| 22 | Beneditinos | 9873 |
| 23 | Altos | 47416 |
| 24 | Valença do Piauí | 22281 |
| 25 | São Raimundo Nonato | 38934 |
| 26 | Piripiri | 65450 |
| 27 | Eliseu Martins | 4377 |
| 28 | Flores do Piauí | 4414 |
| 29 | Teresina | 866300 |
| 30 | Jatobá do Piauí | 4494 |
| 31 | Lagoa do Sítio | 4520 |
| 32 | Dom Inocêncio | 9159 |
| 33 | Olho D’Água do Piauí | 2637 |
| 34 | Bom Princípio do Piauí | 5636 |
| 35 | Juazeiro do Piauí | 5214 |
| 36 | São Miguel da Baixa Grande | 2269 |
| 37 | São Lourenço do Piauí | 4410 |
| 38 | Redenção do Gurguéia | 8394 |
| 39 | Dom Expedito Lopes | 6320 |
| 40 | Batalha | 26300 |
| 41 | Paulistana | 21055 |
| 42 | Caraúbas do Piauí | 5630 |
| 43 | Murici dos Portelas | 9004 |
| 44 | Santo Inácio do Piauí | 3646 |
| 45 | São Braz do Piauí | 4358 |
| 46 | Porto Alegre do Piauí | 2364 |
| 47 | Boqueirão do Piauí | 6545 |
| 48 | Currais | 4844 |
| 49 | São Miguel do Tapuio | 17554 |
| 50 | São João da Varjota | 4383 |
| 51 | Conceição do Canindé | 4932 |
| 52 | Novo Santo Antônio | 2827 |
| 53 | Isaías Coelho | 7774 |
| 54 | Sigefredo Pacheco | 9460 |
| 55 | Sussuapara | 6220 |
| 56 | Buriti dos Montes | 7434 |
| 57 | Barreiras do Piauí | 3264 |
| 58 | Cajueiro da Praia | 7957 |
| 59 | Socorro do Piauí | 4141 |
| 60 | Coivaras | 4043 |
| 61 | Assunção do Piauí | 7452 |
| 62 | Lagoa do Piauí | 4810 |
| 63 | Ilha Grande | 9274 |
| 64 | Alto Longá | 13479 |
| 65 | Francisco Macedo | 2929 |
| 66 | Picos | 83090 |
| 67 | Cabeceiras do Piauí | 10212 |
| 68 | Tamboril do Piauí | 2949 |
| 69 | Uruçuí | 25203 |
| 70 | Santa Luz | 5336 |
| 71 | Alagoinha do Piauí | 6819 |
| 72 | Aroazes | 5369 |
| 73 | Santa Filomena | 6087 |
| 74 | Miguel Alves | 32150 |
| 75 | Caracol | 10318 |
| 76 | Barro Duro | 6640 |
| 77 | Geminiano | 5445 |
| 78 | Belém do Piauí | 3423 |
| 79 | Brasileira | 8436 |
| 80 | Lagoinha do Piauí | 2939 |
| 81 | Bocaina | 4078 |
| 82 | Novo Oriente do Piauí | 6097 |
| 83 | Madeiro | 8032 |
| 84 | Júlio Borges | 5388 |
| 85 | Coronel José Dias | 4250 |
| 86 | Cristino Castro | 10503 |
| 87 | Manoel Emídio | 5209 |
| 88 | Esperantina | 40970 |
| 89 | Francisco Ayres | 4412 |
| 90 | Capitão Gervásio Oliveira | 3974 |
| 91 | São Francisco de Assis do Piauí | 5577 |
| 92 | Joaquim Pires | 13886 |
| 93 | Itainópolis | 10790 |
| 94 | Morro do Chapéu do Piauí | 6425 |
| 95 | Parnaíba | 162159 |
| 96 | Avelino Lopes | 10866 |
| 97 | Colônia do Piauí | 6991 |
| 98 | Campo Largo do Piauí | 7419 |
| 99 | Caridade do Piauí | 5033 |
| 100 | Pajeú do Piauí | 3000 |
| 101 | Jerumenha | 4497 |
| 102 | Ribeiro Gonçalves | 6164 |
| 103 | Lagoa de São Francisco | 6331 |
| 104 | Pio IX | 17613 |
| 105 | São Gonçalo do Gurguéia | 2947 |
| 106 | Bela Vista do Piauí | 4091 |
| 107 | Lagoa Alegre | 8256 |
| 108 | Francisco Santos | 8237 |
| 109 | Joca Marques | 5394 |
| 110 | São Gonçalo do Piauí | 4837 |
| 111 | Hugo Napoleão | 3518 |
| 112 | Luzilândia | 25375 |
| 113 | Sebastião Leal | 4446 |
| 114 | São Miguel do Fidalgo | 2829 |
| 115 | Jardim do Mulato | 4180 |
| 116 | São João da Fronteira | 5522 |
| 117 | Nossa Senhora de Nazaré | 5228 |
| 118 | Bertolínia | 5562 |
| 119 | Caldeirão Grande do Piauí | 5503 |
| 120 | Alegrete do Piauí | 4634 |
| 121 | Curralinhos | 4413 |
| 122 | São Julião | 6025 |
| 123 | Luís Correia | 30641 |
| 124 | São João da Canabrava | 4242 |
| 125 | Queimada Nova | 8738 |
| 126 | Castelo do Piauí | 19288 |
| 127 | Domingos Mourão | 4075 |
| 128 | Brejo do Piauí | 3904 |
| 129 | Floriano | 62036 |
| 130 | Palmeirais | 13263 |
| 131 | Pedro Laurentino | 2458 |
| 132 | Matias Olímpio | 10641 |
| 133 | Vera Mendes | 3185 |
| 134 | Amarante | 17235 |
| 135 | Curral Novo do Piauí | 5073 |
| 136 | Canavieira | 3414 |
| 137 | Elesbão Veloso | 13607 |
| 138 | Ipiranga do Piauí | 9420 |
| 139 | Caxingó | 5496 |
| 140 | Oeiras | 38161 |
| 141 | Curimatá | 11270 |
| 142 | Acauã | 6420 |
Os municípios foram divididos em estratos com base na População Residente (PR). Em seguida, houve a seleção de uma amostra proporcional de cada estrato para garantir representatividade.
Primeiro Quartil (Q1): É o valor abaixo do qual estão 25% dos dados ordenados.
Segundo Quartil (Q2): É a mediana, onde estão 50% dos dados abaixo e 50% acima desse valor.
Terceiro Quartil (Q3): É o valor abaixo do qual estão 75% dos dados ordenados.
Categorias (baixa, média, alta, muito alta) com base nos quartis, temos:
Baixa: Inclui as observações com PR abaixo do valor do primeiro quartil (Q1).
Média: Inclui as observações com PR entre o primeiro quartil (Q1) e a mediana (Q2).
Alta: Inclui as observações com PR entre a mediana (Q2) e o terceiro quartil (Q3).
Muito Alta: Inclui as observações com PR acima do terceiro quartil (Q3).
| Número | Municipio | PR | PR_faixa |
|---|---|---|---|
| 1 | Pau D’Arco do Piauí | 3880 | Baixa |
| 2 | Eliseu Martins | 4377 | Baixa |
| 3 | Sebastião Barros | 3202 | Baixa |
| 4 | Domingos Mourão | 4075 | Baixa |
| 5 | Barra D’Alcântara | 3995 | Baixa |
| 6 | Santo Inácio do Piauí | 3646 | Baixa |
| 7 | São Miguel do Fidalgo | 2829 | Baixa |
| 8 | São Braz do Piauí | 4358 | Baixa |
| 9 | Riacho Frio | 4165 | Baixa |
| 10 | Tanque do Piauí | 2316 | Baixa |
| 11 | Novo Santo Antônio | 2827 | Baixa |
| 12 | Olho D’Água do Piauí | 2637 | Baixa |
| 13 | Paes Landim | 4088 | Baixa |
| 14 | Bela Vista do Piauí | 4091 | Baixa |
| 15 | São Gonçalo do Gurguéia | 2947 | Baixa |
| 16 | Pajeú do Piauí | 3000 | Baixa |
| 17 | Cajazeiras do Piauí | 3108 | Baixa |
| 18 | Paquetá | 3813 | Baixa |
| 19 | Porto Alegre do Piauí | 2364 | Baixa |
| 20 | Brejo do Piauí | 3904 | Baixa |
| 21 | São João da Canabrava | 4242 | Baixa |
| 22 | Bocaina | 4078 | Baixa |
| 23 | Santo Antônio dos Milagres | 2138 | Baixa |
| 24 | Hugo Napoleão | 3518 | Baixa |
| 25 | São Luis do Piauí | 2309 | Baixa |
| 26 | Francisco Macedo | 2929 | Baixa |
| 27 | Capitão Gervásio Oliveira | 3974 | Baixa |
| 28 | Prata do Piauí | 3042 | Baixa |
| 29 | João Costa | 2970 | Baixa |
| 30 | Coivaras | 4043 | Baixa |
| 31 | Vila Nova do Piauí | 2935 | Baixa |
| 32 | Canavieira | 3414 | Baixa |
| 33 | Coronel José Dias | 4250 | Baixa |
| 34 | Passagem Franca do Piauí | 4135 | Baixa |
| 35 | Santa Cruz dos Milagres | 3435 | Baixa |
| 36 | Rio Grande do Piauí | 5801 | Média |
| 37 | Campo Alegre do Fidalgo | 4616 | Média |
| 38 | Geminiano | 5445 | Média |
| 39 | Joca Marques | 5394 | Média |
| 40 | Bom Princípio do Piauí | 5636 | Média |
| 41 | São Lourenço do Piauí | 4410 | Média |
| 42 | Lagoa do Piauí | 4810 | Média |
| 43 | Nossa Senhora de Nazaré | 5228 | Média |
| 44 | Jatobá do Piauí | 4494 | Média |
| 45 | Landri Sales | 5213 | Média |
| 46 | Júlio Borges | 5388 | Média |
| 47 | Arraial | 4520 | Média |
| 48 | Caldeirão Grande do Piauí | 5503 | Média |
| 49 | Caridade do Piauí | 5033 | Média |
| 50 | Caxingó | 5496 | Média |
| 51 | Curral Novo do Piauí | 5073 | Média |
| 52 | Lagoa do Sítio | 4520 | Média |
| 53 | São João da Varjota | 4383 | Média |
| 54 | São Francisco do Piauí | 5392 | Média |
| 55 | Francinópolis | 4505 | Média |
| 56 | Conceição do Canindé | 4932 | Média |
| 57 | Jerumenha | 4497 | Média |
| 58 | Lagoa do Barro do Piauí | 4995 | Média |
| 59 | Currais | 4844 | Média |
| 60 | Flores do Piauí | 4414 | Média |
| 61 | Jurema | 4425 | Média |
| 62 | Bertolínia | 5562 | Média |
| 63 | Caraúbas do Piauí | 5630 | Média |
| 64 | Santa Luz | 5336 | Média |
| 65 | Francisco Ayres | 4412 | Média |
| 66 | São Francisco de Assis do Piauí | 5577 | Média |
| 67 | São José do Divino | 4841 | Média |
| 68 | São João da Fronteira | 5522 | Média |
| 69 | Curralinhos | 4413 | Média |
| 70 | Patos do Piauí | 5425 | Média |
| 71 | Ribeiro Gonçalves | 6164 | Alta |
| 72 | Madeiro | 8032 | Alta |
| 73 | Anísio de Abreu | 9407 | Alta |
| 74 | Buriti dos Montes | 7434 | Alta |
| 75 | Assunção do Piauí | 7452 | Alta |
| 76 | São João da Serra | 6114 | Alta |
| 77 | Dom Inocêncio | 9159 | Alta |
| 78 | Cristalândia do Piauí | 7283 | Alta |
| 79 | Santa Filomena | 6087 | Alta |
| 80 | Lagoa Alegre | 8256 | Alta |
| 81 | Parnaguá | 10103 | Alta |
| 82 | Redenção do Gurguéia | 8394 | Alta |
| 83 | Dirceu Arcoverde | 7054 | Alta |
| 84 | Marcolândia | 8533 | Alta |
| 85 | Murici dos Portelas | 9004 | Alta |
| 86 | Ipiranga do Piauí | 9420 | Alta |
| 87 | Brasileira | 8436 | Alta |
| 88 | Isaías Coelho | 7774 | Alta |
| 89 | Nazaré do Piauí | 6665 | Alta |
| 90 | Nossa Senhora dos Remédios | 8525 | Alta |
| 91 | Cabeceiras do Piauí | 10212 | Alta |
| 92 | Ilha Grande | 9274 | Alta |
| 93 | Queimada Nova | 8738 | Alta |
| 94 | Beneditinos | 9873 | Alta |
| 95 | Angical do Piauí | 6827 | Alta |
| 96 | Novo Oriente do Piauí | 6097 | Alta |
| 97 | Sussuapara | 6220 | Alta |
| 98 | Francisco Santos | 8237 | Alta |
| 99 | Cajueiro da Praia | 7957 | Alta |
| 100 | Colônia do Piauí | 6991 | Alta |
| 101 | São João do Arraial | 8186 | Alta |
| 102 | Betânia do Piauí | 6220 | Alta |
| 103 | Cocal dos Alves | 6386 | Alta |
| 104 | Bonfim do Piauí | 5913 | Alta |
| 105 | Caracol | 10318 | Alta |
| 106 | Morro do Chapéu do Piauí | 6425 | Alta |
| 107 | Piripiri | 65450 | Muito Alta |
| 108 | Monte Alegre do Piauí | 10660 | Muito Alta |
| 109 | Buriti dos Lopes | 19654 | Muito Alta |
| 110 | Floriano | 62036 | Muito Alta |
| 111 | Canto do Buriti | 19365 | Muito Alta |
| 112 | Elesbão Veloso | 13607 | Muito Alta |
| 113 | Regeneração | 17133 | Muito Alta |
| 114 | Cristino Castro | 10503 | Muito Alta |
| 115 | São Raimundo Nonato | 38934 | Muito Alta |
| 116 | Oeiras | 38161 | Muito Alta |
| 117 | Picos | 83090 | Muito Alta |
| 118 | Luís Correia | 30641 | Muito Alta |
| 119 | Cocal | 28212 | Muito Alta |
| 120 | Inhuma | 14958 | Muito Alta |
| 121 | Gilbués | 10892 | Muito Alta |
| 122 | Barras | 47938 | Muito Alta |
| 123 | José de Freitas | 42559 | Muito Alta |
| 124 | Valença do Piauí | 22281 | Muito Alta |
| 125 | Pio IX | 17613 | Muito Alta |
| 126 | Itaueira | 10323 | Muito Alta |
| 127 | Matias Olímpio | 10641 | Muito Alta |
| 128 | Pimenteiras | 11341 | Muito Alta |
| 129 | Jaicós | 17527 | Muito Alta |
| 130 | Avelino Lopes | 10866 | Muito Alta |
| 131 | Baixa Grande do Ribeiro | 13272 | Muito Alta |
| 132 | Corrente | 27285 | Muito Alta |
| 133 | Piracuruca | 28453 | Muito Alta |
| 134 | Esperantina | 40970 | Muito Alta |
| 135 | Paulistana | 21055 | Muito Alta |
| 136 | Campo Maior | 45793 | Muito Alta |
| 137 | Amarante | 17235 | Muito Alta |
| 138 | Simplício Mendes | 13881 | Muito Alta |
| 139 | Castelo do Piauí | 19288 | Muito Alta |
| 140 | Demerval Lobão | 15853 | Muito Alta |
| 141 | São João do Piauí | 21421 | Muito Alta |
| 142 | Bom Jesus | 28799 | Muito Alta |
Para decidir o número de conglomerados foram considerados diversos fatores, como a representatividade dos municípios escolhidos, na viabilidade logística e no tamanho da amostra, dessa forma, foi escolhido um número de 50 conglomerados para a amostragem, levando em conta o tamanho da amostra de 142 observações calculada supra. Garantindo ao mesmo tempo que o tamanho da amostra não ultrapasse o número total de observações disponíveis(224).
Para determinar o tamanho médio de conglomerado desejado, foi dividido o tamanho da amostra total pelo número de conglomerados:
\[ \text{Tamanho médio de conglomerado} = \frac{\text{Tamanho da amostra total}}{\text{Número de conglomerados}} \]
Substituindo os valores, temos:
\[ \text{Tamanho médio de conglomerado} = \frac{142}{50} = 2.84 \]
Isso significa que cada um dos 50 conglomerados selecionados deve ter em média aproximadamente 2.84 observações. Arredondando para 3 observações por conglomerado para facilitar a implementação.
Nesta técnica, os municípios são primeiramente agrupados em conglomerados. Um conglomerado pode ser definido como um grupo de unidades, neste caso, municípios, que compartilham alguma característica comum, como proximidade geográfica, similaridade econômica, ou qualquer outra característica relevante para o estudo. Após o agrupamento, uma amostra de conglomerados é selecionada de forma aleatória.
| Número | Municipio | PR | PR_faixa |
|---|---|---|---|
| 1 | Altos | 47416 | Muito Alta |
| 2 | Altos | 47416 | Muito Alta |
| 3 | Altos | 47416 | Muito Alta |
| 4 | Aroeiras do Itaim | 2690 | Baixa |
| 5 | Aroeiras do Itaim | 2690 | Baixa |
| 6 | Aroeiras do Itaim | 2690 | Baixa |
| 7 | Batalha | 26300 | Muito Alta |
| 8 | Batalha | 26300 | Muito Alta |
| 9 | Batalha | 26300 | Muito Alta |
| 10 | Beneditinos | 9873 | Alta |
| 11 | Beneditinos | 9873 | Alta |
| 12 | Beneditinos | 9873 | Alta |
| 13 | Bom Princípio do Piauí | 5636 | Média |
| 14 | Bom Princípio do Piauí | 5636 | Média |
| 15 | Bom Princípio do Piauí | 5636 | Média |
| 16 | Boqueirão do Piauí | 6545 | Alta |
| 17 | Boqueirão do Piauí | 6545 | Alta |
| 18 | Campinas do Piauí | 4937 | Média |
| 19 | Campinas do Piauí | 4937 | Média |
| 20 | Campinas do Piauí | 4937 | Média |
| 21 | Capitão de Campos | 11100 | Muito Alta |
| 22 | Capitão de Campos | 11100 | Muito Alta |
| 23 | Capitão de Campos | 11100 | Muito Alta |
| 24 | Caraúbas do Piauí | 5630 | Média |
| 25 | Caraúbas do Piauí | 5630 | Média |
| 26 | Caraúbas do Piauí | 5630 | Média |
| 27 | Currais | 4844 | Média |
| 28 | Currais | 4844 | Média |
| 29 | Demerval Lobão | 15853 | Muito Alta |
| 30 | Demerval Lobão | 15853 | Muito Alta |
| 31 | Demerval Lobão | 15853 | Muito Alta |
| 32 | Dom Expedito Lopes | 6320 | Alta |
| 33 | Dom Expedito Lopes | 6320 | Alta |
| 34 | Dom Expedito Lopes | 6320 | Alta |
| 35 | Dom Inocêncio | 9159 | Alta |
| 36 | Dom Inocêncio | 9159 | Alta |
| 37 | Dom Inocêncio | 9159 | Alta |
| 38 | Eliseu Martins | 4377 | Baixa |
| 39 | Eliseu Martins | 4377 | Baixa |
| 40 | Eliseu Martins | 4377 | Baixa |
| 41 | Flores do Piauí | 4414 | Média |
| 42 | Flores do Piauí | 4414 | Média |
| 43 | Flores do Piauí | 4414 | Média |
| 44 | Gilbués | 10892 | Muito Alta |
| 45 | Gilbués | 10892 | Muito Alta |
| 46 | Gilbués | 10892 | Muito Alta |
| 47 | Guadalupe | 10270 | Alta |
| 48 | Guadalupe | 10270 | Alta |
| 49 | Guadalupe | 10270 | Alta |
| 50 | Guaribas | 4276 | Baixa |
| 51 | Guaribas | 4276 | Baixa |
| 52 | Guaribas | 4276 | Baixa |
| 53 | Itaueira | 10323 | Muito Alta |
| 54 | Itaueira | 10323 | Muito Alta |
| 55 | Itaueira | 10323 | Muito Alta |
| 56 | Jatobá do Piauí | 4494 | Média |
| 57 | Jatobá do Piauí | 4494 | Média |
| 58 | Jatobá do Piauí | 4494 | Média |
| 59 | Juazeiro do Piauí | 5214 | Média |
| 60 | Juazeiro do Piauí | 5214 | Média |
| 61 | Juazeiro do Piauí | 5214 | Média |
| 62 | Lagoa do Sítio | 4520 | Média |
| 63 | Lagoa do Sítio | 4520 | Média |
| 64 | Lagoa do Sítio | 4520 | Média |
| 65 | Landri Sales | 5213 | Média |
| 66 | Landri Sales | 5213 | Média |
| 67 | Landri Sales | 5213 | Média |
| 68 | Murici dos Portelas | 9004 | Alta |
| 69 | Murici dos Portelas | 9004 | Alta |
| 70 | Nazária | 10262 | Alta |
| 71 | Nazária | 10262 | Alta |
| 72 | Nazária | 10262 | Alta |
| 73 | Nova Santa Rita | 4076 | Baixa |
| 74 | Nova Santa Rita | 4076 | Baixa |
| 75 | Nova Santa Rita | 4076 | Baixa |
| 76 | Olho D’Água do Piauí | 2637 | Baixa |
| 77 | Olho D’Água do Piauí | 2637 | Baixa |
| 78 | Olho D’Água do Piauí | 2637 | Baixa |
| 79 | Patos do Piauí | 5425 | Média |
| 80 | Patos do Piauí | 5425 | Média |
| 81 | Patos do Piauí | 5425 | Média |
| 82 | Paulistana | 21055 | Muito Alta |
| 83 | Paulistana | 21055 | Muito Alta |
| 84 | Paulistana | 21055 | Muito Alta |
| 85 | Piripiri | 65450 | Muito Alta |
| 86 | Piripiri | 65450 | Muito Alta |
| 87 | Piripiri | 65450 | Muito Alta |
| 88 | Porto Alegre do Piauí | 2364 | Baixa |
| 89 | Porto Alegre do Piauí | 2364 | Baixa |
| 90 | Redenção do Gurguéia | 8394 | Alta |
| 91 | Redenção do Gurguéia | 8394 | Alta |
| 92 | Redenção do Gurguéia | 8394 | Alta |
| 93 | Regeneração | 17133 | Muito Alta |
| 94 | Regeneração | 17133 | Muito Alta |
| 95 | Regeneração | 17133 | Muito Alta |
| 96 | Santana do Piauí | 4125 | Baixa |
| 97 | Santana do Piauí | 4125 | Baixa |
| 98 | Santana do Piauí | 4125 | Baixa |
| 99 | Santo Inácio do Piauí | 3646 | Baixa |
| 100 | Santo Inácio do Piauí | 3646 | Baixa |
| 101 | Sebastião Barros | 3202 | Baixa |
| 102 | Sebastião Barros | 3202 | Baixa |
| 103 | Sebastião Barros | 3202 | Baixa |
| 104 | Simplício Mendes | 13881 | Muito Alta |
| 105 | Simplício Mendes | 13881 | Muito Alta |
| 106 | Simplício Mendes | 13881 | Muito Alta |
| 107 | São Braz do Piauí | 4358 | Baixa |
| 108 | São Braz do Piauí | 4358 | Baixa |
| 109 | São Félix do Piauí | 2842 | Baixa |
| 110 | São Félix do Piauí | 2842 | Baixa |
| 111 | São Félix do Piauí | 2842 | Baixa |
| 112 | São José do Peixe | 3297 | Baixa |
| 113 | São José do Peixe | 3297 | Baixa |
| 114 | São José do Peixe | 3297 | Baixa |
| 115 | São João da Varjota | 4383 | Média |
| 116 | São João da Varjota | 4383 | Média |
| 117 | São João do Piauí | 21421 | Muito Alta |
| 118 | São João do Piauí | 21421 | Muito Alta |
| 119 | São João do Piauí | 21421 | Muito Alta |
| 120 | São Lourenço do Piauí | 4410 | Média |
| 121 | São Lourenço do Piauí | 4410 | Média |
| 122 | São Lourenço do Piauí | 4410 | Média |
| 123 | São Miguel da Baixa Grande | 2269 | Baixa |
| 124 | São Miguel da Baixa Grande | 2269 | Baixa |
| 125 | São Miguel da Baixa Grande | 2269 | Baixa |
| 126 | São Miguel do Tapuio | 17554 | Muito Alta |
| 127 | São Miguel do Tapuio | 17554 | Muito Alta |
| 128 | São Raimundo Nonato | 38934 | Muito Alta |
| 129 | São Raimundo Nonato | 38934 | Muito Alta |
| 130 | São Raimundo Nonato | 38934 | Muito Alta |
| 131 | Teresina | 866300 | Muito Alta |
| 132 | Teresina | 866300 | Muito Alta |
| 133 | Teresina | 866300 | Muito Alta |
| 134 | União | 46119 | Muito Alta |
| 135 | União | 46119 | Muito Alta |
| 136 | União | 46119 | Muito Alta |
| 137 | Valença do Piauí | 22281 | Muito Alta |
| 138 | Valença do Piauí | 22281 | Muito Alta |
| 139 | Valença do Piauí | 22281 | Muito Alta |
| 140 | Várzea Grande | 4417 | Média |
| 141 | Várzea Grande | 4417 | Média |
| 142 | Várzea Grande | 4417 | Média |
Para garantir a precisão e a validade dos dados amostrais utilizados neste estudo, realizamos uma verificação das amostras obtidas através dos diferentes métodos de amostragem, como amostragem simples, amostragem estratificada e amostragem por conglomerados. A verificação confirma a existência das amostras e o tamanho de cada uma delas.
Tabela 4.Tamanho da amostra das três técnicas
## Tamanho da Amostra Simples: 142
## Tamanho da Amostra Estratificada: 142
## Tamanho da Amostra por Conglomerados: 142
o teste de Kolmogorov-Smirnov verifica a similaridade entre a distribuição das amostras e a população original
Tabela 5.Resultados dos testes de KS para cada amostra
## Resultados dos Testes de Kolmogorov-Smirnov
## ============================
##
## Teste KS para Amostra Simples
## ----------------------------
## Estatística D: 0.02899
## Valor p: 1.00000
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
##
## Teste KS para Amostra Estratificada
## ----------------------------
## Estatística D: 0.03672
## Valor p: 0.99980
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
##
## Teste KS para Amostra por Conglomerados
## ----------------------------
## Estatística D: 0.11708
## Valor p: 0.18449
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
## ============================
Interpretação das saídas:
1.Amostra simples
D: 0.02899 é a estatística do teste KS, que mede a maior diferença entre as funções de distribuição cumulativa (CDF) dos dois conjuntos de dados.
p-value: 1, um valor p alto indica que não há evidência suficiente para rejeitar a hipótese nula.
Como o valor p é 1, isso significa que não há diferença significativa entre a distribuição dos dados da população e a amostra simples. As distribuições são muito semelhantes.
2.Amostra estratificada
D: 0.03672, uma estatística de teste um pouco maior, mas ainda baixa.
p-value: 0.99980, um valor p muito alto, próximo de 1.
Semelhante à amostra simples, o valor p alto indica que não há diferença significativa entre a distribuição dos dados da população e a amostra estratificada. As distribuições são muito semelhantes.
3.Amostra por conglomerados
D: 0.11708, uma estatística de teste significativamente maior.
p-value: 0.18449, Um valor p alto (próximo de 1) sugere que não há evidências suficientes para rejeitar a hipótese nula de que as distribuições são semelhantes.
As distribuições da variável de interesse na amostra por conglomerados são estatisticamente semelhantes às da população total, dessa forma, a amostra por conglomerados parece ser representativa em relação à variável estudada.
| Mínimo | 1º Quartil.25% | Mediana | Média | 3º Quartil.75% | Máximo | Desvio Padrão | |
|---|---|---|---|---|---|---|---|
| População Original | 1318 | 4377.00 | 5876.0 | 14594.64 | 10319.25 | 866300 | 59183.08 |
| Amostra Simples | 2269 | 4378.50 | 5830.5 | 17487.15 | 10458.00 | 866300 | 73897.08 |
| Amostra Estratificada | 2138 | 4389.75 | 6000.0 | 10757.60 | 10321.75 | 83090 | 12707.95 |
| Amostra por Conglomerados | 2269 | 4378.50 | 5636.0 | 29830.33 | 13881.00 | 866300 | 124023.15 |
A apresentação das estatísticas descritivas das amostragens é fundamental para uma análise robusta e uma interpretação confiável dos dados coletados. Auxiliando para que a garantia das conclusões do estudo sejam baseadas em amostras representativas e bem caracterizadas das populações estudadas.
Este relatório explora três técnicas de amostragem — simples, estratificada e por conglomerados — aplicadas a um conjunto oficial de dados do Estado do Piauí, Brasil, de 2021. O objetivo foi selecionar uma amostra representativa da população para análise estatística. Inicialmente, calculamos o tamanho da amostra para cada técnica com base nas características da população e nos critérios de representatividade desejados, concluindo que uma amostra de 142 observações seria adequada para a aplicação das técnicas mencionadas.
Ao aplicar o teste de Kolmogorov-Smirnov (KS), confirmamos que todas as amostras foram estatisticamente semelhantes à população original em relação à variável de interesse (‘População Residente’). Isso reforça a validade das técnicas de amostragem empregadas, demonstrando que cada abordagem foi capaz de capturar de maneira representativa as características da população estudada. A análise estatística, incluindo o teste de Kolmogorov-Smirnov, evidenciou que as distribuições das variáveis de interesse nas amostras foram semelhantes às da população original.
Esses resultados fornecem uma base sólida para a confiabilidade dos dados amostrais e para as conclusões derivadas deste estudo.Certamente, é pertinente destacar que a amostragem por conglomerado se apresentou como o aspecto mais desafiador deste estudo. Embora as demais técnicas tenham sido bem desenvolvidas, foi necessário realizar múltiplos testes para determinar o número adequado de conglomerados que atendesse ao objetivo proposto neste documento.
ANJOS, Adilson: Estatística básica no R. 2014. Acesso em: 25 de junho de 2024
PERES, Fernanda.Canal YouTube: Estatística Aplicada à vida real. Acesso em: 24 de junho de 2024
R, Curso.RPubs: O pacote ggplot2. Acesso em: 24 de junho de 2024
SILVA, Ricardo Allan: Técnicas de amostragem. 2018. Acesso em: 25 de junho de 2024
UNIVERSIDADE FEDERAL DO PARANÁ. Análise exploratória de dados. Acesso em: 24 de junho 2024
ZEVIANI, Walmes. Visualização de Dados com ggplot2. Acesso em: 24 de junho de 2024
#Foi utilizado para desativar as mensagens, avisos e eco do código
#{r message=FALSE, warning=FALSE, echo=FALSE}
# Parâmetros
N <- 224 # Tamanho da população
Z <- 1.96 # Valor crítico para 95% de confiança
p <- 0.5 # Proporção esperada (máxima variabilidade)
e <- 0.05 # Margem de erro
# Fórmula do tamanho da amostra
n <- (N * Z^2 * p * (1 - p)) / (e^2 * (N - 1) + Z^2 * p * (1 - p))
n <- ceiling(n) # Arredondar para cima
# Saída: (Tamanho da amostra)
cat("Tamanho da amostra: ", n)
## Tamanho da amostra: 142
Tabela 1.Aplicação da amostragem aleatória simples
# Carregar pacotes necessários
library(dplyr)
library(readxl)
library(knitr)
library(kableExtra)
# Definir o caminho e ler o arquivo Excel
meuxlsx <- "piaui.xlsx"
Dados <- read_excel(path = meuxlsx, sheet = 1)
dados <- as.data.frame(Dados)
# Selecionar apenas as colunas de interesse: Municípios e População Residente
dados_selecionados <- dados %>%
select(Municipio, PR)
# Aplicando a Amostragem Aleatória Simples
set.seed(123)
amostra_simples <- dados_selecionados %>%
sample_n(142) %>% # Seleciona 142 municípios aleatoriamente
mutate(Número = row_number()) %>% # Adiciona a numeração das linhas
select(Número, everything()) # Reorganiza as colunas para ter a numeração no início
# Mostrar a saída formatada com kable e kableExtra, com tabela paginada
kable(amostra_simples, format = "html", table.attr = "style='width:100%;'") %>%
kable_styling(full_width = FALSE, position = "center") %>%
scroll_box(height = "400px", width = "100%") # Define a altura da caixa de rolagem e largura total da tabela
| Número | Municipio | PR |
|---|---|---|
| 1 | Nova Santa Rita | 4076 |
| 2 | Sebastião Barros | 3202 |
| 3 | Santana do Piauí | 4125 |
| 4 | Aroeiras do Itaim | 2690 |
| 5 | São João do Piauí | 21421 |
| 6 | Regeneração | 17133 |
| 7 | Capitão de Campos | 11100 |
| 8 | Landri Sales | 5213 |
| 9 | Campinas do Piauí | 4937 |
| 10 | Várzea Grande | 4417 |
| 11 | União | 46119 |
| 12 | Patos do Piauí | 5425 |
| 13 | Gilbués | 10892 |
| 14 | Guadalupe | 10270 |
| 15 | São José do Peixe | 3297 |
| 16 | Simplício Mendes | 13881 |
| 17 | São Félix do Piauí | 2842 |
| 18 | Guaribas | 4276 |
| 19 | Nazária | 10262 |
| 20 | Itaueira | 10323 |
| 21 | Demerval Lobão | 15853 |
| 22 | Beneditinos | 9873 |
| 23 | Altos | 47416 |
| 24 | Valença do Piauí | 22281 |
| 25 | São Raimundo Nonato | 38934 |
| 26 | Piripiri | 65450 |
| 27 | Eliseu Martins | 4377 |
| 28 | Flores do Piauí | 4414 |
| 29 | Teresina | 866300 |
| 30 | Jatobá do Piauí | 4494 |
| 31 | Lagoa do Sítio | 4520 |
| 32 | Dom Inocêncio | 9159 |
| 33 | Olho D’Água do Piauí | 2637 |
| 34 | Bom Princípio do Piauí | 5636 |
| 35 | Juazeiro do Piauí | 5214 |
| 36 | São Miguel da Baixa Grande | 2269 |
| 37 | São Lourenço do Piauí | 4410 |
| 38 | Redenção do Gurguéia | 8394 |
| 39 | Dom Expedito Lopes | 6320 |
| 40 | Batalha | 26300 |
| 41 | Paulistana | 21055 |
| 42 | Caraúbas do Piauí | 5630 |
| 43 | Murici dos Portelas | 9004 |
| 44 | Santo Inácio do Piauí | 3646 |
| 45 | São Braz do Piauí | 4358 |
| 46 | Porto Alegre do Piauí | 2364 |
| 47 | Boqueirão do Piauí | 6545 |
| 48 | Currais | 4844 |
| 49 | São Miguel do Tapuio | 17554 |
| 50 | São João da Varjota | 4383 |
| 51 | Conceição do Canindé | 4932 |
| 52 | Novo Santo Antônio | 2827 |
| 53 | Isaías Coelho | 7774 |
| 54 | Sigefredo Pacheco | 9460 |
| 55 | Sussuapara | 6220 |
| 56 | Buriti dos Montes | 7434 |
| 57 | Barreiras do Piauí | 3264 |
| 58 | Cajueiro da Praia | 7957 |
| 59 | Socorro do Piauí | 4141 |
| 60 | Coivaras | 4043 |
| 61 | Assunção do Piauí | 7452 |
| 62 | Lagoa do Piauí | 4810 |
| 63 | Ilha Grande | 9274 |
| 64 | Alto Longá | 13479 |
| 65 | Francisco Macedo | 2929 |
| 66 | Picos | 83090 |
| 67 | Cabeceiras do Piauí | 10212 |
| 68 | Tamboril do Piauí | 2949 |
| 69 | Uruçuí | 25203 |
| 70 | Santa Luz | 5336 |
| 71 | Alagoinha do Piauí | 6819 |
| 72 | Aroazes | 5369 |
| 73 | Santa Filomena | 6087 |
| 74 | Miguel Alves | 32150 |
| 75 | Caracol | 10318 |
| 76 | Barro Duro | 6640 |
| 77 | Geminiano | 5445 |
| 78 | Belém do Piauí | 3423 |
| 79 | Brasileira | 8436 |
| 80 | Lagoinha do Piauí | 2939 |
| 81 | Bocaina | 4078 |
| 82 | Novo Oriente do Piauí | 6097 |
| 83 | Madeiro | 8032 |
| 84 | Júlio Borges | 5388 |
| 85 | Coronel José Dias | 4250 |
| 86 | Cristino Castro | 10503 |
| 87 | Manoel Emídio | 5209 |
| 88 | Esperantina | 40970 |
| 89 | Francisco Ayres | 4412 |
| 90 | Capitão Gervásio Oliveira | 3974 |
| 91 | São Francisco de Assis do Piauí | 5577 |
| 92 | Joaquim Pires | 13886 |
| 93 | Itainópolis | 10790 |
| 94 | Morro do Chapéu do Piauí | 6425 |
| 95 | Parnaíba | 162159 |
| 96 | Avelino Lopes | 10866 |
| 97 | Colônia do Piauí | 6991 |
| 98 | Campo Largo do Piauí | 7419 |
| 99 | Caridade do Piauí | 5033 |
| 100 | Pajeú do Piauí | 3000 |
| 101 | Jerumenha | 4497 |
| 102 | Ribeiro Gonçalves | 6164 |
| 103 | Lagoa de São Francisco | 6331 |
| 104 | Pio IX | 17613 |
| 105 | São Gonçalo do Gurguéia | 2947 |
| 106 | Bela Vista do Piauí | 4091 |
| 107 | Lagoa Alegre | 8256 |
| 108 | Francisco Santos | 8237 |
| 109 | Joca Marques | 5394 |
| 110 | São Gonçalo do Piauí | 4837 |
| 111 | Hugo Napoleão | 3518 |
| 112 | Luzilândia | 25375 |
| 113 | Sebastião Leal | 4446 |
| 114 | São Miguel do Fidalgo | 2829 |
| 115 | Jardim do Mulato | 4180 |
| 116 | São João da Fronteira | 5522 |
| 117 | Nossa Senhora de Nazaré | 5228 |
| 118 | Bertolínia | 5562 |
| 119 | Caldeirão Grande do Piauí | 5503 |
| 120 | Alegrete do Piauí | 4634 |
| 121 | Curralinhos | 4413 |
| 122 | São Julião | 6025 |
| 123 | Luís Correia | 30641 |
| 124 | São João da Canabrava | 4242 |
| 125 | Queimada Nova | 8738 |
| 126 | Castelo do Piauí | 19288 |
| 127 | Domingos Mourão | 4075 |
| 128 | Brejo do Piauí | 3904 |
| 129 | Floriano | 62036 |
| 130 | Palmeirais | 13263 |
| 131 | Pedro Laurentino | 2458 |
| 132 | Matias Olímpio | 10641 |
| 133 | Vera Mendes | 3185 |
| 134 | Amarante | 17235 |
| 135 | Curral Novo do Piauí | 5073 |
| 136 | Canavieira | 3414 |
| 137 | Elesbão Veloso | 13607 |
| 138 | Ipiranga do Piauí | 9420 |
| 139 | Caxingó | 5496 |
| 140 | Oeiras | 38161 |
| 141 | Curimatá | 11270 |
| 142 | Acauã | 6420 |
Tabela 2.Aplicação da amostragem aleatória estratificada
# Calcular o tamanho da amostra para cada estrato proporcionalmente
dados_selecionados <- dados_selecionados %>%
mutate(PR_faixa = cut(PR,
breaks = quantile(PR, probs = seq(0, 1, 0.25), na.rm = TRUE),
labels = c("Baixa", "Média", "Alta", "Muito Alta"),
include.lowest = TRUE))
tamanho_estratos <- dados_selecionados %>%
group_by(PR_faixa) %>%
summarise(tamanho = n()) %>%
mutate(amostra_tamanho = round(tamanho * 142 / sum(tamanho)))
# Ajustar o tamanho para garantir que a soma seja exatamente 142
diferenca <- 142 - sum(tamanho_estratos$amostra_tamanho)
if (diferenca != 0) {
tamanho_estratos$amostra_tamanho[1] <- tamanho_estratos$amostra_tamanho[1] + diferenca
}
amostra_estratificada <- data.frame()
set.seed(123)
for (i in 1:nrow(tamanho_estratos)) {
estrato_atual <- dados_selecionados %>%
filter(PR_faixa == tamanho_estratos$PR_faixa[i]) %>%
sample_n(tamanho_estratos$amostra_tamanho[i], replace = FALSE)
amostra_estratificada <- rbind(amostra_estratificada, estrato_atual)
}
amostra_estratificada <- amostra_estratificada %>%
mutate(Número = row_number()) %>%
select(Número, everything())
# Adicionar o número de linha como uma coluna
amostra_estratificada <- amostra_estratificada %>%
mutate(Número = row_number()) %>%
select(Número, everything())
# Mostrar a saída formatada com kable e kableExtra
kable(amostra_estratificada, format = "html", table.attr = "style='width:50%;'") %>%
kable_styling(full_width = FALSE, position = "center") %>%
scroll_box(height = "300px")
| Número | Municipio | PR | PR_faixa |
|---|---|---|---|
| 1 | Pau D’Arco do Piauí | 3880 | Baixa |
| 2 | Eliseu Martins | 4377 | Baixa |
| 3 | Sebastião Barros | 3202 | Baixa |
| 4 | Domingos Mourão | 4075 | Baixa |
| 5 | Barra D’Alcântara | 3995 | Baixa |
| 6 | Santo Inácio do Piauí | 3646 | Baixa |
| 7 | São Miguel do Fidalgo | 2829 | Baixa |
| 8 | São Braz do Piauí | 4358 | Baixa |
| 9 | Riacho Frio | 4165 | Baixa |
| 10 | Tanque do Piauí | 2316 | Baixa |
| 11 | Novo Santo Antônio | 2827 | Baixa |
| 12 | Olho D’Água do Piauí | 2637 | Baixa |
| 13 | Paes Landim | 4088 | Baixa |
| 14 | Bela Vista do Piauí | 4091 | Baixa |
| 15 | São Gonçalo do Gurguéia | 2947 | Baixa |
| 16 | Pajeú do Piauí | 3000 | Baixa |
| 17 | Cajazeiras do Piauí | 3108 | Baixa |
| 18 | Paquetá | 3813 | Baixa |
| 19 | Porto Alegre do Piauí | 2364 | Baixa |
| 20 | Brejo do Piauí | 3904 | Baixa |
| 21 | São João da Canabrava | 4242 | Baixa |
| 22 | Bocaina | 4078 | Baixa |
| 23 | Santo Antônio dos Milagres | 2138 | Baixa |
| 24 | Hugo Napoleão | 3518 | Baixa |
| 25 | São Luis do Piauí | 2309 | Baixa |
| 26 | Francisco Macedo | 2929 | Baixa |
| 27 | Capitão Gervásio Oliveira | 3974 | Baixa |
| 28 | Prata do Piauí | 3042 | Baixa |
| 29 | João Costa | 2970 | Baixa |
| 30 | Coivaras | 4043 | Baixa |
| 31 | Vila Nova do Piauí | 2935 | Baixa |
| 32 | Canavieira | 3414 | Baixa |
| 33 | Coronel José Dias | 4250 | Baixa |
| 34 | Passagem Franca do Piauí | 4135 | Baixa |
| 35 | Santa Cruz dos Milagres | 3435 | Baixa |
| 36 | Rio Grande do Piauí | 5801 | Média |
| 37 | Campo Alegre do Fidalgo | 4616 | Média |
| 38 | Geminiano | 5445 | Média |
| 39 | Joca Marques | 5394 | Média |
| 40 | Bom Princípio do Piauí | 5636 | Média |
| 41 | São Lourenço do Piauí | 4410 | Média |
| 42 | Lagoa do Piauí | 4810 | Média |
| 43 | Nossa Senhora de Nazaré | 5228 | Média |
| 44 | Jatobá do Piauí | 4494 | Média |
| 45 | Landri Sales | 5213 | Média |
| 46 | Júlio Borges | 5388 | Média |
| 47 | Arraial | 4520 | Média |
| 48 | Caldeirão Grande do Piauí | 5503 | Média |
| 49 | Caridade do Piauí | 5033 | Média |
| 50 | Caxingó | 5496 | Média |
| 51 | Curral Novo do Piauí | 5073 | Média |
| 52 | Lagoa do Sítio | 4520 | Média |
| 53 | São João da Varjota | 4383 | Média |
| 54 | São Francisco do Piauí | 5392 | Média |
| 55 | Francinópolis | 4505 | Média |
| 56 | Conceição do Canindé | 4932 | Média |
| 57 | Jerumenha | 4497 | Média |
| 58 | Lagoa do Barro do Piauí | 4995 | Média |
| 59 | Currais | 4844 | Média |
| 60 | Flores do Piauí | 4414 | Média |
| 61 | Jurema | 4425 | Média |
| 62 | Bertolínia | 5562 | Média |
| 63 | Caraúbas do Piauí | 5630 | Média |
| 64 | Santa Luz | 5336 | Média |
| 65 | Francisco Ayres | 4412 | Média |
| 66 | São Francisco de Assis do Piauí | 5577 | Média |
| 67 | São José do Divino | 4841 | Média |
| 68 | São João da Fronteira | 5522 | Média |
| 69 | Curralinhos | 4413 | Média |
| 70 | Patos do Piauí | 5425 | Média |
| 71 | Ribeiro Gonçalves | 6164 | Alta |
| 72 | Madeiro | 8032 | Alta |
| 73 | Anísio de Abreu | 9407 | Alta |
| 74 | Buriti dos Montes | 7434 | Alta |
| 75 | Assunção do Piauí | 7452 | Alta |
| 76 | São João da Serra | 6114 | Alta |
| 77 | Dom Inocêncio | 9159 | Alta |
| 78 | Cristalândia do Piauí | 7283 | Alta |
| 79 | Santa Filomena | 6087 | Alta |
| 80 | Lagoa Alegre | 8256 | Alta |
| 81 | Parnaguá | 10103 | Alta |
| 82 | Redenção do Gurguéia | 8394 | Alta |
| 83 | Dirceu Arcoverde | 7054 | Alta |
| 84 | Marcolândia | 8533 | Alta |
| 85 | Murici dos Portelas | 9004 | Alta |
| 86 | Ipiranga do Piauí | 9420 | Alta |
| 87 | Brasileira | 8436 | Alta |
| 88 | Isaías Coelho | 7774 | Alta |
| 89 | Nazaré do Piauí | 6665 | Alta |
| 90 | Nossa Senhora dos Remédios | 8525 | Alta |
| 91 | Cabeceiras do Piauí | 10212 | Alta |
| 92 | Ilha Grande | 9274 | Alta |
| 93 | Queimada Nova | 8738 | Alta |
| 94 | Beneditinos | 9873 | Alta |
| 95 | Angical do Piauí | 6827 | Alta |
| 96 | Novo Oriente do Piauí | 6097 | Alta |
| 97 | Sussuapara | 6220 | Alta |
| 98 | Francisco Santos | 8237 | Alta |
| 99 | Cajueiro da Praia | 7957 | Alta |
| 100 | Colônia do Piauí | 6991 | Alta |
| 101 | São João do Arraial | 8186 | Alta |
| 102 | Betânia do Piauí | 6220 | Alta |
| 103 | Cocal dos Alves | 6386 | Alta |
| 104 | Bonfim do Piauí | 5913 | Alta |
| 105 | Caracol | 10318 | Alta |
| 106 | Morro do Chapéu do Piauí | 6425 | Alta |
| 107 | Piripiri | 65450 | Muito Alta |
| 108 | Monte Alegre do Piauí | 10660 | Muito Alta |
| 109 | Buriti dos Lopes | 19654 | Muito Alta |
| 110 | Floriano | 62036 | Muito Alta |
| 111 | Canto do Buriti | 19365 | Muito Alta |
| 112 | Elesbão Veloso | 13607 | Muito Alta |
| 113 | Regeneração | 17133 | Muito Alta |
| 114 | Cristino Castro | 10503 | Muito Alta |
| 115 | São Raimundo Nonato | 38934 | Muito Alta |
| 116 | Oeiras | 38161 | Muito Alta |
| 117 | Picos | 83090 | Muito Alta |
| 118 | Luís Correia | 30641 | Muito Alta |
| 119 | Cocal | 28212 | Muito Alta |
| 120 | Inhuma | 14958 | Muito Alta |
| 121 | Gilbués | 10892 | Muito Alta |
| 122 | Barras | 47938 | Muito Alta |
| 123 | José de Freitas | 42559 | Muito Alta |
| 124 | Valença do Piauí | 22281 | Muito Alta |
| 125 | Pio IX | 17613 | Muito Alta |
| 126 | Itaueira | 10323 | Muito Alta |
| 127 | Matias Olímpio | 10641 | Muito Alta |
| 128 | Pimenteiras | 11341 | Muito Alta |
| 129 | Jaicós | 17527 | Muito Alta |
| 130 | Avelino Lopes | 10866 | Muito Alta |
| 131 | Baixa Grande do Ribeiro | 13272 | Muito Alta |
| 132 | Corrente | 27285 | Muito Alta |
| 133 | Piracuruca | 28453 | Muito Alta |
| 134 | Esperantina | 40970 | Muito Alta |
| 135 | Paulistana | 21055 | Muito Alta |
| 136 | Campo Maior | 45793 | Muito Alta |
| 137 | Amarante | 17235 | Muito Alta |
| 138 | Simplício Mendes | 13881 | Muito Alta |
| 139 | Castelo do Piauí | 19288 | Muito Alta |
| 140 | Demerval Lobão | 15853 | Muito Alta |
| 141 | São João do Piauí | 21421 | Muito Alta |
| 142 | Bom Jesus | 28799 | Muito Alta |
Tabela 3.Aplicação da amostragem por conglomerado
# Carregando os pacotes necessários
library(dplyr)
library(knitr)
library(kableExtra)
# Definindo o número de conglomerados e o tamanho da amostra desejada
num_conglomerados <- 50
tamanho_amostra <- 142
# Selecionando aleatoriamente os conglomerados
set.seed(123)
conglomerados_selecionados <- sample(unique(dados_selecionados$Municipio), num_conglomerados)
# Função para calcular o tamanho de amostra por conglomerado
calcular_tamanho_conglomerado <- function(tamanho_restante, num_conglomerados) {
tamanho_medio <- tamanho_restante %/% num_conglomerados
tamanho <- rep(tamanho_medio, num_conglomerados)
tamanho <- tamanho + (seq_len(num_conglomerados) <= tamanho_restante %% num_conglomerados)
return(tamanho)
}
# Calculando o tamanho de amostra necessário por conglomerado
tamanhos_conglomerados <- calcular_tamanho_conglomerado(tamanho_amostra, num_conglomerados)
# Amostrar aleatoriamente dentro de cada conglomerado selecionado
amostra_conglomerado <- dados_selecionados %>%
filter(Municipio %in% conglomerados_selecionados) %>%
group_by(Municipio) %>%
sample_n(size = tamanhos_conglomerados[match(Municipio, conglomerados_selecionados)], replace = TRUE) %>%
ungroup()
# Verificar o tamanho da amostra atual
tamanho_amostra_atual <- nrow(amostra_conglomerado)
# Ajustar para garantir que a amostra final tenha exatamente 142 observações
if (tamanho_amostra_atual > tamanho_amostra) {
set.seed(123)
amostra_conglomerado <- amostra_conglomerado %>%
sample_n(tamanho_amostra, replace = FALSE)
}
# Adicionar o número de linha como uma coluna
amostra_conglomerado <- amostra_conglomerado %>%
mutate(Número = row_number()) %>%
select(Número, everything())
# Mostrar a saída formatada com kable e kableExtra
kable(amostra_conglomerado, format = "html", table.attr = "style='width:50%;'") %>%
kable_styling(full_width = FALSE, position = "center") %>%
scroll_box(height = "300px")
| Número | Municipio | PR | PR_faixa |
|---|---|---|---|
| 1 | Altos | 47416 | Muito Alta |
| 2 | Altos | 47416 | Muito Alta |
| 3 | Altos | 47416 | Muito Alta |
| 4 | Aroeiras do Itaim | 2690 | Baixa |
| 5 | Aroeiras do Itaim | 2690 | Baixa |
| 6 | Aroeiras do Itaim | 2690 | Baixa |
| 7 | Batalha | 26300 | Muito Alta |
| 8 | Batalha | 26300 | Muito Alta |
| 9 | Batalha | 26300 | Muito Alta |
| 10 | Beneditinos | 9873 | Alta |
| 11 | Beneditinos | 9873 | Alta |
| 12 | Beneditinos | 9873 | Alta |
| 13 | Bom Princípio do Piauí | 5636 | Média |
| 14 | Bom Princípio do Piauí | 5636 | Média |
| 15 | Bom Princípio do Piauí | 5636 | Média |
| 16 | Boqueirão do Piauí | 6545 | Alta |
| 17 | Boqueirão do Piauí | 6545 | Alta |
| 18 | Campinas do Piauí | 4937 | Média |
| 19 | Campinas do Piauí | 4937 | Média |
| 20 | Campinas do Piauí | 4937 | Média |
| 21 | Capitão de Campos | 11100 | Muito Alta |
| 22 | Capitão de Campos | 11100 | Muito Alta |
| 23 | Capitão de Campos | 11100 | Muito Alta |
| 24 | Caraúbas do Piauí | 5630 | Média |
| 25 | Caraúbas do Piauí | 5630 | Média |
| 26 | Caraúbas do Piauí | 5630 | Média |
| 27 | Currais | 4844 | Média |
| 28 | Currais | 4844 | Média |
| 29 | Demerval Lobão | 15853 | Muito Alta |
| 30 | Demerval Lobão | 15853 | Muito Alta |
| 31 | Demerval Lobão | 15853 | Muito Alta |
| 32 | Dom Expedito Lopes | 6320 | Alta |
| 33 | Dom Expedito Lopes | 6320 | Alta |
| 34 | Dom Expedito Lopes | 6320 | Alta |
| 35 | Dom Inocêncio | 9159 | Alta |
| 36 | Dom Inocêncio | 9159 | Alta |
| 37 | Dom Inocêncio | 9159 | Alta |
| 38 | Eliseu Martins | 4377 | Baixa |
| 39 | Eliseu Martins | 4377 | Baixa |
| 40 | Eliseu Martins | 4377 | Baixa |
| 41 | Flores do Piauí | 4414 | Média |
| 42 | Flores do Piauí | 4414 | Média |
| 43 | Flores do Piauí | 4414 | Média |
| 44 | Gilbués | 10892 | Muito Alta |
| 45 | Gilbués | 10892 | Muito Alta |
| 46 | Gilbués | 10892 | Muito Alta |
| 47 | Guadalupe | 10270 | Alta |
| 48 | Guadalupe | 10270 | Alta |
| 49 | Guadalupe | 10270 | Alta |
| 50 | Guaribas | 4276 | Baixa |
| 51 | Guaribas | 4276 | Baixa |
| 52 | Guaribas | 4276 | Baixa |
| 53 | Itaueira | 10323 | Muito Alta |
| 54 | Itaueira | 10323 | Muito Alta |
| 55 | Itaueira | 10323 | Muito Alta |
| 56 | Jatobá do Piauí | 4494 | Média |
| 57 | Jatobá do Piauí | 4494 | Média |
| 58 | Jatobá do Piauí | 4494 | Média |
| 59 | Juazeiro do Piauí | 5214 | Média |
| 60 | Juazeiro do Piauí | 5214 | Média |
| 61 | Juazeiro do Piauí | 5214 | Média |
| 62 | Lagoa do Sítio | 4520 | Média |
| 63 | Lagoa do Sítio | 4520 | Média |
| 64 | Lagoa do Sítio | 4520 | Média |
| 65 | Landri Sales | 5213 | Média |
| 66 | Landri Sales | 5213 | Média |
| 67 | Landri Sales | 5213 | Média |
| 68 | Murici dos Portelas | 9004 | Alta |
| 69 | Murici dos Portelas | 9004 | Alta |
| 70 | Nazária | 10262 | Alta |
| 71 | Nazária | 10262 | Alta |
| 72 | Nazária | 10262 | Alta |
| 73 | Nova Santa Rita | 4076 | Baixa |
| 74 | Nova Santa Rita | 4076 | Baixa |
| 75 | Nova Santa Rita | 4076 | Baixa |
| 76 | Olho D’Água do Piauí | 2637 | Baixa |
| 77 | Olho D’Água do Piauí | 2637 | Baixa |
| 78 | Olho D’Água do Piauí | 2637 | Baixa |
| 79 | Patos do Piauí | 5425 | Média |
| 80 | Patos do Piauí | 5425 | Média |
| 81 | Patos do Piauí | 5425 | Média |
| 82 | Paulistana | 21055 | Muito Alta |
| 83 | Paulistana | 21055 | Muito Alta |
| 84 | Paulistana | 21055 | Muito Alta |
| 85 | Piripiri | 65450 | Muito Alta |
| 86 | Piripiri | 65450 | Muito Alta |
| 87 | Piripiri | 65450 | Muito Alta |
| 88 | Porto Alegre do Piauí | 2364 | Baixa |
| 89 | Porto Alegre do Piauí | 2364 | Baixa |
| 90 | Redenção do Gurguéia | 8394 | Alta |
| 91 | Redenção do Gurguéia | 8394 | Alta |
| 92 | Redenção do Gurguéia | 8394 | Alta |
| 93 | Regeneração | 17133 | Muito Alta |
| 94 | Regeneração | 17133 | Muito Alta |
| 95 | Regeneração | 17133 | Muito Alta |
| 96 | Santana do Piauí | 4125 | Baixa |
| 97 | Santana do Piauí | 4125 | Baixa |
| 98 | Santana do Piauí | 4125 | Baixa |
| 99 | Santo Inácio do Piauí | 3646 | Baixa |
| 100 | Santo Inácio do Piauí | 3646 | Baixa |
| 101 | Sebastião Barros | 3202 | Baixa |
| 102 | Sebastião Barros | 3202 | Baixa |
| 103 | Sebastião Barros | 3202 | Baixa |
| 104 | Simplício Mendes | 13881 | Muito Alta |
| 105 | Simplício Mendes | 13881 | Muito Alta |
| 106 | Simplício Mendes | 13881 | Muito Alta |
| 107 | São Braz do Piauí | 4358 | Baixa |
| 108 | São Braz do Piauí | 4358 | Baixa |
| 109 | São Félix do Piauí | 2842 | Baixa |
| 110 | São Félix do Piauí | 2842 | Baixa |
| 111 | São Félix do Piauí | 2842 | Baixa |
| 112 | São José do Peixe | 3297 | Baixa |
| 113 | São José do Peixe | 3297 | Baixa |
| 114 | São José do Peixe | 3297 | Baixa |
| 115 | São João da Varjota | 4383 | Média |
| 116 | São João da Varjota | 4383 | Média |
| 117 | São João do Piauí | 21421 | Muito Alta |
| 118 | São João do Piauí | 21421 | Muito Alta |
| 119 | São João do Piauí | 21421 | Muito Alta |
| 120 | São Lourenço do Piauí | 4410 | Média |
| 121 | São Lourenço do Piauí | 4410 | Média |
| 122 | São Lourenço do Piauí | 4410 | Média |
| 123 | São Miguel da Baixa Grande | 2269 | Baixa |
| 124 | São Miguel da Baixa Grande | 2269 | Baixa |
| 125 | São Miguel da Baixa Grande | 2269 | Baixa |
| 126 | São Miguel do Tapuio | 17554 | Muito Alta |
| 127 | São Miguel do Tapuio | 17554 | Muito Alta |
| 128 | São Raimundo Nonato | 38934 | Muito Alta |
| 129 | São Raimundo Nonato | 38934 | Muito Alta |
| 130 | São Raimundo Nonato | 38934 | Muito Alta |
| 131 | Teresina | 866300 | Muito Alta |
| 132 | Teresina | 866300 | Muito Alta |
| 133 | Teresina | 866300 | Muito Alta |
| 134 | União | 46119 | Muito Alta |
| 135 | União | 46119 | Muito Alta |
| 136 | União | 46119 | Muito Alta |
| 137 | Valença do Piauí | 22281 | Muito Alta |
| 138 | Valença do Piauí | 22281 | Muito Alta |
| 139 | Valença do Piauí | 22281 | Muito Alta |
| 140 | Várzea Grande | 4417 | Média |
| 141 | Várzea Grande | 4417 | Média |
| 142 | Várzea Grande | 4417 | Média |
Tabela 4.Tamanho da amostra das três técnicas
cat("Tamanho da Amostra Simples: ", nrow(amostra_simples), "\n")
## Tamanho da Amostra Simples: 142
cat("Tamanho da Amostra Estratificada: ", nrow(amostra_estratificada), "\n")
## Tamanho da Amostra Estratificada: 142
cat("Tamanho da Amostra por Conglomerados: ", nrow(amostra_conglomerado), "\n")
## Tamanho da Amostra por Conglomerados: 142
Tabela 5.Resultados dos testes de KS para cada amostra
# Função para realizar o teste KS e formatar a saída
realizar_teste_ks <- function(dados_populacao, dados_amostra, nome_amostra) {
resultado <- ks.test(dados_populacao, dados_amostra)
cat(sprintf("\nTeste KS para %s\n", nome_amostra))
cat("----------------------------\n")
cat(sprintf("Estatística D: %.5f\n", resultado$statistic))
cat(sprintf("Valor p: %.5f\n", resultado$p.value))
if (resultado$p.value < 0.05) {
cat("Resultado: Rejeitamos a hipótese nula (distribuições são diferentes)\n")
} else {
cat("Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)\n")
}
cat("----------------------------\n")
}
# Realização dos testes KS e formatação da saída
cat("Resultados dos Testes de Kolmogorov-Smirnov\n")
## Resultados dos Testes de Kolmogorov-Smirnov
cat("============================\n")
## ============================
realizar_teste_ks(dados_selecionados$PR, amostra_simples$PR, "Amostra Simples")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
##
## Teste KS para Amostra Simples
## ----------------------------
## Estatística D: 0.02899
## Valor p: 1.00000
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
realizar_teste_ks(dados_selecionados$PR, amostra_estratificada$PR, "Amostra Estratificada")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
##
## Teste KS para Amostra Estratificada
## ----------------------------
## Estatística D: 0.03672
## Valor p: 0.99980
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
realizar_teste_ks(dados_selecionados$PR, amostra_conglomerado$PR, "Amostra por Conglomerados")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
##
## Teste KS para Amostra por Conglomerados
## ----------------------------
## Estatística D: 0.11708
## Valor p: 0.18449
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
cat("============================\n")
## ============================
Tabela 6. Apresentação das estatísticas descritivas das amostragens para fornecer uma visão resumida e quantitativa das características das variáveis de interesse em cada amostra.
# Pacote necessário para formatação de tabelas
library(knitr)
# Função para calcular as estatísticas descritivas
desc_stats <- function(x) {
stats <- c(
"Mínimo" = min(x, na.rm = TRUE),
"1º Quartil" = quantile(x, 0.25, na.rm = TRUE),
"Mediana" = median(x, na.rm = TRUE),
"Média" = mean(x, na.rm = TRUE),
"3º Quartil" = quantile(x, 0.75, na.rm = TRUE),
"Máximo" = max(x, na.rm = TRUE),
"Desvio Padrão" = sd(x, na.rm = TRUE)
)
return(stats)
}
# Criar uma tabela com estatísticas descritivas
desc_table <- rbind(
"População Original" = desc_stats(dados_selecionados$PR),
"Amostra Simples" = desc_stats(amostra_simples$PR),
"Amostra Estratificada" = desc_stats(amostra_estratificada$PR),
"Amostra por Conglomerados" = desc_stats(amostra_conglomerado$PR)
)
# Formatar a tabela usando knitr
kable(desc_table, caption = "Estatísticas Descritivas para as Amostras", align = "c", format = "html") %>%
kable_styling(full_width = FALSE)
| Mínimo | 1º Quartil.25% | Mediana | Média | 3º Quartil.75% | Máximo | Desvio Padrão | |
|---|---|---|---|---|---|---|---|
| População Original | 1318 | 4377.00 | 5876.0 | 14594.64 | 10319.25 | 866300 | 59183.08 |
| Amostra Simples | 2269 | 4378.50 | 5830.5 | 17487.15 | 10458.00 | 866300 | 73897.08 |
| Amostra Estratificada | 2138 | 4389.75 | 6000.0 | 10757.60 | 10321.75 | 83090 | 12707.95 |
| Amostra por Conglomerados | 2269 | 4378.50 | 5636.0 | 29830.33 | 13881.00 | 866300 | 124023.15 |