O presente documento tem como finalidade aplicar técnicas de amostragem nos dados do Estado do Piauí, disponibilizados pelo Instituto Brasileiro de Geografia e Estatística - IBGE


Introdução



Na área da estatística, a escolha da técnica de amostragem adequada é fundamental para garantir a representatividade dos dados e a validade dos resultados obtidos. Este relatório apresenta um estudo sobre a aplicação de três técnicas de amostragem, amostragem aleatória simples, amostragem aleatória estratificada e amostragem aleatória por conglomerado. Cada técnica tem suas próprias características e aplicações específicas, que serão discutidas detalhadamente no decorrer desse documento. A análise será conduzida utilizando dados de fonte oficial, explorando as variáveis demográficas município e população residente do Estado do Piauí de 2021, proporcionando uma visão abrangente sobre como cada técnica funciona. O objetivo foi selecionar uma amostra representativa de municípios com base na variável de interesse, População Residente (PR), para análise estatística.


Metodologia


Para verificar a eficácia das diferentes técnicas de amostragem, foi utilizado os dados oficiais do Estado do Piauí de 2021. Segue a descrição de como foi aplicada as três técnicas de amostragem:

A importação dos dados foi realizada a partir de um arquivo Excel chamado “piaui.xlsx” usando a biblioteca readxl.

1.library(readxl): Esta linha carrega a biblioteca readxl, que é necessária para ler arquivos Excel no R.

2.meuxlsx <- "piaui.xlsx": O nome do arquivo Excel é atribuído à variável meuxlsx.

3.Dados <- read_excel(path = meuxlsx, sheet = 1): Esta linha lê os dados do arquivo Excel. A função read_excel() é usada para isso. O path = meuxlsx especifica o caminho do arquivo Excel a ser lido. sheet = 1 especifica que a leitura deve ser feita na primeira planilha do arquivo Excel, vale lembrar que planilhas são numeradas começando de 1.

4.dados <- as.data.frame(Dados): Esta linha converte o objeto retornado por read_excel(), que é um tibble, em um data.frame R clássico. Isso é útil porque data.frame é um tipo de estrutura de dados mais amplamente utilizado em R, compatível com muitas outras funções e pacotes.


Os dados utilizados foram obtidos do Instituto Brasileiro de Geografia e Estatística(IBGE) e abrangem 224 observações de municípios do Estado do Piauí de 2021, com 11 variáveis no total.

Variáveis do banco de dados:

Variáveis de interesse: Municipio e População residente(PR)

Categórica nominal: Municipio

Variável numérica contínua: População residente(PR)


Amostragem aleatória simples


Nesta técnica, selecionaremos aleatoriamente uma amostra simples de municípios sem considerar estratificação. Isso nos permitirá estimar parâmetros gerais da população com base na variável População Residente(PR), ou seja, cada unidade da população tem a mesma probabilidade de ser selecionada.


Tamanho da amostra:

Para determinar o tamanho adequado da amostra aleatória simples neste estudo, temos a fórmula para populações finitas. A fórmula considera o tamanho da população total (\(N\)), o valor crítico da distribuição normal (\(Z\)), a proporção estimada (\(p\)) e a margem de erro desejada (\(E\)).


\[ n = \frac{N \cdot Z^2 \cdot p \cdot (1 - p)}{E^2 \cdot (N - 1) + Z^2 \cdot p \cdot (1 - p)} \]


  • Cálculo do tamanho da amostra


Para o Estado do Piauí, com uma população total de 224 municípios:


  • \(N = 224\)
  • \(Z = 1.96\) (para um nível de confiança de 95%)
  • \(p = 0.5\) (assumindo máxima variabilidade se desconhecido)
  • \(E = 0.05\) (margem de erro desejada de 5%)


Aplicando os valores na fórmula, obtemos:

\[ n = \frac{224 \cdot 1.96^2 \cdot 0.5 \cdot (1 - 0.5)}{0.05^2 \cdot (224 - 1) + 1.96^2 \cdot 0.5 \cdot (1 - 0.5)} \] \[ n = 142 \]


Portanto, uma amostra de 142 municípios é calculada para garantir representatividade estatística adequada e precisão nas estimativas realizadas neste estudo.

## Tamanho da amostra:  142


Foi selecionado 142 munícipios aleatoriamente de forma que cada município tinha a mesma probabilidade de ser escolhido.


  • PR–> População Residente
Tabela 1.Aplicação da amostragem aleatória simples
Número Municipio PR
1 Nova Santa Rita 4076
2 Sebastião Barros 3202
3 Santana do Piauí 4125
4 Aroeiras do Itaim 2690
5 São João do Piauí 21421
6 Regeneração 17133
7 Capitão de Campos 11100
8 Landri Sales 5213
9 Campinas do Piauí 4937
10 Várzea Grande 4417
11 União 46119
12 Patos do Piauí 5425
13 Gilbués 10892
14 Guadalupe 10270
15 São José do Peixe 3297
16 Simplício Mendes 13881
17 São Félix do Piauí 2842
18 Guaribas 4276
19 Nazária 10262
20 Itaueira 10323
21 Demerval Lobão 15853
22 Beneditinos 9873
23 Altos 47416
24 Valença do Piauí 22281
25 São Raimundo Nonato 38934
26 Piripiri 65450
27 Eliseu Martins 4377
28 Flores do Piauí 4414
29 Teresina 866300
30 Jatobá do Piauí 4494
31 Lagoa do Sítio 4520
32 Dom Inocêncio 9159
33 Olho D’Água do Piauí 2637
34 Bom Princípio do Piauí 5636
35 Juazeiro do Piauí 5214
36 São Miguel da Baixa Grande 2269
37 São Lourenço do Piauí 4410
38 Redenção do Gurguéia 8394
39 Dom Expedito Lopes 6320
40 Batalha 26300
41 Paulistana 21055
42 Caraúbas do Piauí 5630
43 Murici dos Portelas 9004
44 Santo Inácio do Piauí 3646
45 São Braz do Piauí 4358
46 Porto Alegre do Piauí 2364
47 Boqueirão do Piauí 6545
48 Currais 4844
49 São Miguel do Tapuio 17554
50 São João da Varjota 4383
51 Conceição do Canindé 4932
52 Novo Santo Antônio 2827
53 Isaías Coelho 7774
54 Sigefredo Pacheco 9460
55 Sussuapara 6220
56 Buriti dos Montes 7434
57 Barreiras do Piauí 3264
58 Cajueiro da Praia 7957
59 Socorro do Piauí 4141
60 Coivaras 4043
61 Assunção do Piauí 7452
62 Lagoa do Piauí 4810
63 Ilha Grande 9274
64 Alto Longá 13479
65 Francisco Macedo 2929
66 Picos 83090
67 Cabeceiras do Piauí 10212
68 Tamboril do Piauí 2949
69 Uruçuí 25203
70 Santa Luz 5336
71 Alagoinha do Piauí 6819
72 Aroazes 5369
73 Santa Filomena 6087
74 Miguel Alves 32150
75 Caracol 10318
76 Barro Duro 6640
77 Geminiano 5445
78 Belém do Piauí 3423
79 Brasileira 8436
80 Lagoinha do Piauí 2939
81 Bocaina 4078
82 Novo Oriente do Piauí 6097
83 Madeiro 8032
84 Júlio Borges 5388
85 Coronel José Dias 4250
86 Cristino Castro 10503
87 Manoel Emídio 5209
88 Esperantina 40970
89 Francisco Ayres 4412
90 Capitão Gervásio Oliveira 3974
91 São Francisco de Assis do Piauí 5577
92 Joaquim Pires 13886
93 Itainópolis 10790
94 Morro do Chapéu do Piauí 6425
95 Parnaíba 162159
96 Avelino Lopes 10866
97 Colônia do Piauí 6991
98 Campo Largo do Piauí 7419
99 Caridade do Piauí 5033
100 Pajeú do Piauí 3000
101 Jerumenha 4497
102 Ribeiro Gonçalves 6164
103 Lagoa de São Francisco 6331
104 Pio IX 17613
105 São Gonçalo do Gurguéia 2947
106 Bela Vista do Piauí 4091
107 Lagoa Alegre 8256
108 Francisco Santos 8237
109 Joca Marques 5394
110 São Gonçalo do Piauí 4837
111 Hugo Napoleão 3518
112 Luzilândia 25375
113 Sebastião Leal 4446
114 São Miguel do Fidalgo 2829
115 Jardim do Mulato 4180
116 São João da Fronteira 5522
117 Nossa Senhora de Nazaré 5228
118 Bertolínia 5562
119 Caldeirão Grande do Piauí 5503
120 Alegrete do Piauí 4634
121 Curralinhos 4413
122 São Julião 6025
123 Luís Correia 30641
124 São João da Canabrava 4242
125 Queimada Nova 8738
126 Castelo do Piauí 19288
127 Domingos Mourão 4075
128 Brejo do Piauí 3904
129 Floriano 62036
130 Palmeirais 13263
131 Pedro Laurentino 2458
132 Matias Olímpio 10641
133 Vera Mendes 3185
134 Amarante 17235
135 Curral Novo do Piauí 5073
136 Canavieira 3414
137 Elesbão Veloso 13607
138 Ipiranga do Piauí 9420
139 Caxingó 5496
140 Oeiras 38161
141 Curimatá 11270
142 Acauã 6420



Amostragem aleatória estratificada


Os municípios foram divididos em estratos com base na População Residente (PR). Em seguida, houve a seleção de uma amostra proporcional de cada estrato para garantir representatividade.

  • Quartis


Primeiro Quartil (Q1): É o valor abaixo do qual estão 25% dos dados ordenados.

Segundo Quartil (Q2): É a mediana, onde estão 50% dos dados abaixo e 50% acima desse valor.

Terceiro Quartil (Q3): É o valor abaixo do qual estão 75% dos dados ordenados.


Categorias (baixa, média, alta, muito alta) com base nos quartis, temos:

Baixa: Inclui as observações com PR abaixo do valor do primeiro quartil (Q1).

Média: Inclui as observações com PR entre o primeiro quartil (Q1) e a mediana (Q2).

Alta: Inclui as observações com PR entre a mediana (Q2) e o terceiro quartil (Q3).

Muito Alta: Inclui as observações com PR acima do terceiro quartil (Q3).


  • PR–> População Residente
Tabela 2.Aplicação da amostragem aleatória estratificada
Número Municipio PR PR_faixa
1 Pau D’Arco do Piauí 3880 Baixa
2 Eliseu Martins 4377 Baixa
3 Sebastião Barros 3202 Baixa
4 Domingos Mourão 4075 Baixa
5 Barra D’Alcântara 3995 Baixa
6 Santo Inácio do Piauí 3646 Baixa
7 São Miguel do Fidalgo 2829 Baixa
8 São Braz do Piauí 4358 Baixa
9 Riacho Frio 4165 Baixa
10 Tanque do Piauí 2316 Baixa
11 Novo Santo Antônio 2827 Baixa
12 Olho D’Água do Piauí 2637 Baixa
13 Paes Landim 4088 Baixa
14 Bela Vista do Piauí 4091 Baixa
15 São Gonçalo do Gurguéia 2947 Baixa
16 Pajeú do Piauí 3000 Baixa
17 Cajazeiras do Piauí 3108 Baixa
18 Paquetá 3813 Baixa
19 Porto Alegre do Piauí 2364 Baixa
20 Brejo do Piauí 3904 Baixa
21 São João da Canabrava 4242 Baixa
22 Bocaina 4078 Baixa
23 Santo Antônio dos Milagres 2138 Baixa
24 Hugo Napoleão 3518 Baixa
25 São Luis do Piauí 2309 Baixa
26 Francisco Macedo 2929 Baixa
27 Capitão Gervásio Oliveira 3974 Baixa
28 Prata do Piauí 3042 Baixa
29 João Costa 2970 Baixa
30 Coivaras 4043 Baixa
31 Vila Nova do Piauí 2935 Baixa
32 Canavieira 3414 Baixa
33 Coronel José Dias 4250 Baixa
34 Passagem Franca do Piauí 4135 Baixa
35 Santa Cruz dos Milagres 3435 Baixa
36 Rio Grande do Piauí 5801 Média
37 Campo Alegre do Fidalgo 4616 Média
38 Geminiano 5445 Média
39 Joca Marques 5394 Média
40 Bom Princípio do Piauí 5636 Média
41 São Lourenço do Piauí 4410 Média
42 Lagoa do Piauí 4810 Média
43 Nossa Senhora de Nazaré 5228 Média
44 Jatobá do Piauí 4494 Média
45 Landri Sales 5213 Média
46 Júlio Borges 5388 Média
47 Arraial 4520 Média
48 Caldeirão Grande do Piauí 5503 Média
49 Caridade do Piauí 5033 Média
50 Caxingó 5496 Média
51 Curral Novo do Piauí 5073 Média
52 Lagoa do Sítio 4520 Média
53 São João da Varjota 4383 Média
54 São Francisco do Piauí 5392 Média
55 Francinópolis 4505 Média
56 Conceição do Canindé 4932 Média
57 Jerumenha 4497 Média
58 Lagoa do Barro do Piauí 4995 Média
59 Currais 4844 Média
60 Flores do Piauí 4414 Média
61 Jurema 4425 Média
62 Bertolínia 5562 Média
63 Caraúbas do Piauí 5630 Média
64 Santa Luz 5336 Média
65 Francisco Ayres 4412 Média
66 São Francisco de Assis do Piauí 5577 Média
67 São José do Divino 4841 Média
68 São João da Fronteira 5522 Média
69 Curralinhos 4413 Média
70 Patos do Piauí 5425 Média
71 Ribeiro Gonçalves 6164 Alta
72 Madeiro 8032 Alta
73 Anísio de Abreu 9407 Alta
74 Buriti dos Montes 7434 Alta
75 Assunção do Piauí 7452 Alta
76 São João da Serra 6114 Alta
77 Dom Inocêncio 9159 Alta
78 Cristalândia do Piauí 7283 Alta
79 Santa Filomena 6087 Alta
80 Lagoa Alegre 8256 Alta
81 Parnaguá 10103 Alta
82 Redenção do Gurguéia 8394 Alta
83 Dirceu Arcoverde 7054 Alta
84 Marcolândia 8533 Alta
85 Murici dos Portelas 9004 Alta
86 Ipiranga do Piauí 9420 Alta
87 Brasileira 8436 Alta
88 Isaías Coelho 7774 Alta
89 Nazaré do Piauí 6665 Alta
90 Nossa Senhora dos Remédios 8525 Alta
91 Cabeceiras do Piauí 10212 Alta
92 Ilha Grande 9274 Alta
93 Queimada Nova 8738 Alta
94 Beneditinos 9873 Alta
95 Angical do Piauí 6827 Alta
96 Novo Oriente do Piauí 6097 Alta
97 Sussuapara 6220 Alta
98 Francisco Santos 8237 Alta
99 Cajueiro da Praia 7957 Alta
100 Colônia do Piauí 6991 Alta
101 São João do Arraial 8186 Alta
102 Betânia do Piauí 6220 Alta
103 Cocal dos Alves 6386 Alta
104 Bonfim do Piauí 5913 Alta
105 Caracol 10318 Alta
106 Morro do Chapéu do Piauí 6425 Alta
107 Piripiri 65450 Muito Alta
108 Monte Alegre do Piauí 10660 Muito Alta
109 Buriti dos Lopes 19654 Muito Alta
110 Floriano 62036 Muito Alta
111 Canto do Buriti 19365 Muito Alta
112 Elesbão Veloso 13607 Muito Alta
113 Regeneração 17133 Muito Alta
114 Cristino Castro 10503 Muito Alta
115 São Raimundo Nonato 38934 Muito Alta
116 Oeiras 38161 Muito Alta
117 Picos 83090 Muito Alta
118 Luís Correia 30641 Muito Alta
119 Cocal 28212 Muito Alta
120 Inhuma 14958 Muito Alta
121 Gilbués 10892 Muito Alta
122 Barras 47938 Muito Alta
123 José de Freitas 42559 Muito Alta
124 Valença do Piauí 22281 Muito Alta
125 Pio IX 17613 Muito Alta
126 Itaueira 10323 Muito Alta
127 Matias Olímpio 10641 Muito Alta
128 Pimenteiras 11341 Muito Alta
129 Jaicós 17527 Muito Alta
130 Avelino Lopes 10866 Muito Alta
131 Baixa Grande do Ribeiro 13272 Muito Alta
132 Corrente 27285 Muito Alta
133 Piracuruca 28453 Muito Alta
134 Esperantina 40970 Muito Alta
135 Paulistana 21055 Muito Alta
136 Campo Maior 45793 Muito Alta
137 Amarante 17235 Muito Alta
138 Simplício Mendes 13881 Muito Alta
139 Castelo do Piauí 19288 Muito Alta
140 Demerval Lobão 15853 Muito Alta
141 São João do Piauí 21421 Muito Alta
142 Bom Jesus 28799 Muito Alta


Amostragem aleatória por conglomerado

  • Número de conglomerados

Para decidir o número de conglomerados foram considerados diversos fatores, como a representatividade dos municípios escolhidos, na viabilidade logística e no tamanho da amostra, dessa forma, foi escolhido um número de 50 conglomerados para a amostragem, levando em conta o tamanho da amostra de 142 observações calculada supra. Garantindo ao mesmo tempo que o tamanho da amostra não ultrapasse o número total de observações disponíveis(224).


Para determinar o tamanho médio de conglomerado desejado, foi dividido o tamanho da amostra total pelo número de conglomerados:


\[ \text{Tamanho médio de conglomerado} = \frac{\text{Tamanho da amostra total}}{\text{Número de conglomerados}} \]


Substituindo os valores, temos:


\[ \text{Tamanho médio de conglomerado} = \frac{142}{50} = 2.84 \]


Isso significa que cada um dos 50 conglomerados selecionados deve ter em média aproximadamente 2.84 observações. Arredondando para 3 observações por conglomerado para facilitar a implementação.


Nesta técnica, os municípios são primeiramente agrupados em conglomerados. Um conglomerado pode ser definido como um grupo de unidades, neste caso, municípios, que compartilham alguma característica comum, como proximidade geográfica, similaridade econômica, ou qualquer outra característica relevante para o estudo. Após o agrupamento, uma amostra de conglomerados é selecionada de forma aleatória.


  • PR–> População Residente
Tabela 3.Aplicação da amostragem por conglomerado
Número Municipio PR PR_faixa
1 Altos 47416 Muito Alta
2 Altos 47416 Muito Alta
3 Altos 47416 Muito Alta
4 Aroeiras do Itaim 2690 Baixa
5 Aroeiras do Itaim 2690 Baixa
6 Aroeiras do Itaim 2690 Baixa
7 Batalha 26300 Muito Alta
8 Batalha 26300 Muito Alta
9 Batalha 26300 Muito Alta
10 Beneditinos 9873 Alta
11 Beneditinos 9873 Alta
12 Beneditinos 9873 Alta
13 Bom Princípio do Piauí 5636 Média
14 Bom Princípio do Piauí 5636 Média
15 Bom Princípio do Piauí 5636 Média
16 Boqueirão do Piauí 6545 Alta
17 Boqueirão do Piauí 6545 Alta
18 Campinas do Piauí 4937 Média
19 Campinas do Piauí 4937 Média
20 Campinas do Piauí 4937 Média
21 Capitão de Campos 11100 Muito Alta
22 Capitão de Campos 11100 Muito Alta
23 Capitão de Campos 11100 Muito Alta
24 Caraúbas do Piauí 5630 Média
25 Caraúbas do Piauí 5630 Média
26 Caraúbas do Piauí 5630 Média
27 Currais 4844 Média
28 Currais 4844 Média
29 Demerval Lobão 15853 Muito Alta
30 Demerval Lobão 15853 Muito Alta
31 Demerval Lobão 15853 Muito Alta
32 Dom Expedito Lopes 6320 Alta
33 Dom Expedito Lopes 6320 Alta
34 Dom Expedito Lopes 6320 Alta
35 Dom Inocêncio 9159 Alta
36 Dom Inocêncio 9159 Alta
37 Dom Inocêncio 9159 Alta
38 Eliseu Martins 4377 Baixa
39 Eliseu Martins 4377 Baixa
40 Eliseu Martins 4377 Baixa
41 Flores do Piauí 4414 Média
42 Flores do Piauí 4414 Média
43 Flores do Piauí 4414 Média
44 Gilbués 10892 Muito Alta
45 Gilbués 10892 Muito Alta
46 Gilbués 10892 Muito Alta
47 Guadalupe 10270 Alta
48 Guadalupe 10270 Alta
49 Guadalupe 10270 Alta
50 Guaribas 4276 Baixa
51 Guaribas 4276 Baixa
52 Guaribas 4276 Baixa
53 Itaueira 10323 Muito Alta
54 Itaueira 10323 Muito Alta
55 Itaueira 10323 Muito Alta
56 Jatobá do Piauí 4494 Média
57 Jatobá do Piauí 4494 Média
58 Jatobá do Piauí 4494 Média
59 Juazeiro do Piauí 5214 Média
60 Juazeiro do Piauí 5214 Média
61 Juazeiro do Piauí 5214 Média
62 Lagoa do Sítio 4520 Média
63 Lagoa do Sítio 4520 Média
64 Lagoa do Sítio 4520 Média
65 Landri Sales 5213 Média
66 Landri Sales 5213 Média
67 Landri Sales 5213 Média
68 Murici dos Portelas 9004 Alta
69 Murici dos Portelas 9004 Alta
70 Nazária 10262 Alta
71 Nazária 10262 Alta
72 Nazária 10262 Alta
73 Nova Santa Rita 4076 Baixa
74 Nova Santa Rita 4076 Baixa
75 Nova Santa Rita 4076 Baixa
76 Olho D’Água do Piauí 2637 Baixa
77 Olho D’Água do Piauí 2637 Baixa
78 Olho D’Água do Piauí 2637 Baixa
79 Patos do Piauí 5425 Média
80 Patos do Piauí 5425 Média
81 Patos do Piauí 5425 Média
82 Paulistana 21055 Muito Alta
83 Paulistana 21055 Muito Alta
84 Paulistana 21055 Muito Alta
85 Piripiri 65450 Muito Alta
86 Piripiri 65450 Muito Alta
87 Piripiri 65450 Muito Alta
88 Porto Alegre do Piauí 2364 Baixa
89 Porto Alegre do Piauí 2364 Baixa
90 Redenção do Gurguéia 8394 Alta
91 Redenção do Gurguéia 8394 Alta
92 Redenção do Gurguéia 8394 Alta
93 Regeneração 17133 Muito Alta
94 Regeneração 17133 Muito Alta
95 Regeneração 17133 Muito Alta
96 Santana do Piauí 4125 Baixa
97 Santana do Piauí 4125 Baixa
98 Santana do Piauí 4125 Baixa
99 Santo Inácio do Piauí 3646 Baixa
100 Santo Inácio do Piauí 3646 Baixa
101 Sebastião Barros 3202 Baixa
102 Sebastião Barros 3202 Baixa
103 Sebastião Barros 3202 Baixa
104 Simplício Mendes 13881 Muito Alta
105 Simplício Mendes 13881 Muito Alta
106 Simplício Mendes 13881 Muito Alta
107 São Braz do Piauí 4358 Baixa
108 São Braz do Piauí 4358 Baixa
109 São Félix do Piauí 2842 Baixa
110 São Félix do Piauí 2842 Baixa
111 São Félix do Piauí 2842 Baixa
112 São José do Peixe 3297 Baixa
113 São José do Peixe 3297 Baixa
114 São José do Peixe 3297 Baixa
115 São João da Varjota 4383 Média
116 São João da Varjota 4383 Média
117 São João do Piauí 21421 Muito Alta
118 São João do Piauí 21421 Muito Alta
119 São João do Piauí 21421 Muito Alta
120 São Lourenço do Piauí 4410 Média
121 São Lourenço do Piauí 4410 Média
122 São Lourenço do Piauí 4410 Média
123 São Miguel da Baixa Grande 2269 Baixa
124 São Miguel da Baixa Grande 2269 Baixa
125 São Miguel da Baixa Grande 2269 Baixa
126 São Miguel do Tapuio 17554 Muito Alta
127 São Miguel do Tapuio 17554 Muito Alta
128 São Raimundo Nonato 38934 Muito Alta
129 São Raimundo Nonato 38934 Muito Alta
130 São Raimundo Nonato 38934 Muito Alta
131 Teresina 866300 Muito Alta
132 Teresina 866300 Muito Alta
133 Teresina 866300 Muito Alta
134 União 46119 Muito Alta
135 União 46119 Muito Alta
136 União 46119 Muito Alta
137 Valença do Piauí 22281 Muito Alta
138 Valença do Piauí 22281 Muito Alta
139 Valença do Piauí 22281 Muito Alta
140 Várzea Grande 4417 Média
141 Várzea Grande 4417 Média
142 Várzea Grande 4417 Média


Resultados e discussão


Para garantir a precisão e a validade dos dados amostrais utilizados neste estudo, realizamos uma verificação das amostras obtidas através dos diferentes métodos de amostragem, como amostragem simples, amostragem estratificada e amostragem por conglomerados. A verificação confirma a existência das amostras e o tamanho de cada uma delas.

Tabela 4.Tamanho da amostra das três técnicas

## Tamanho da Amostra Simples:  142
## Tamanho da Amostra Estratificada:  142
## Tamanho da Amostra por Conglomerados:  142


o teste de Kolmogorov-Smirnov verifica a similaridade entre a distribuição das amostras e a população original


Tabela 5.Resultados dos testes de KS para cada amostra

## Resultados dos Testes de Kolmogorov-Smirnov
## ============================
## 
## Teste KS para Amostra Simples
## ----------------------------
## Estatística D: 0.02899
## Valor p: 1.00000
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
## 
## Teste KS para Amostra Estratificada
## ----------------------------
## Estatística D: 0.03672
## Valor p: 0.99980
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
## 
## Teste KS para Amostra por Conglomerados
## ----------------------------
## Estatística D: 0.11708
## Valor p: 0.18449
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
## ============================


Interpretação das saídas:


1.Amostra simples

D: 0.02899 é a estatística do teste KS, que mede a maior diferença entre as funções de distribuição cumulativa (CDF) dos dois conjuntos de dados.

p-value: 1, um valor p alto indica que não há evidência suficiente para rejeitar a hipótese nula.

Como o valor p é 1, isso significa que não há diferença significativa entre a distribuição dos dados da população e a amostra simples. As distribuições são muito semelhantes.


2.Amostra estratificada

D: 0.03672, uma estatística de teste um pouco maior, mas ainda baixa.

p-value: 0.99980, um valor p muito alto, próximo de 1.

Semelhante à amostra simples, o valor p alto indica que não há diferença significativa entre a distribuição dos dados da população e a amostra estratificada. As distribuições são muito semelhantes.


3.Amostra por conglomerados

D: 0.11708, uma estatística de teste significativamente maior.

p-value: 0.18449, Um valor p alto (próximo de 1) sugere que não há evidências suficientes para rejeitar a hipótese nula de que as distribuições são semelhantes.

As distribuições da variável de interesse na amostra por conglomerados são estatisticamente semelhantes às da população total, dessa forma, a amostra por conglomerados parece ser representativa em relação à variável estudada.


Tabela 6. Apresentação das estatísticas descritivas das amostragens para fornecer uma visão resumida e quantitativa das características das variáveis de interesse em cada amostra.
Estatísticas Descritivas para as Amostras
Mínimo 1º Quartil.25% Mediana Média 3º Quartil.75% Máximo Desvio Padrão
População Original 1318 4377.00 5876.0 14594.64 10319.25 866300 59183.08
Amostra Simples 2269 4378.50 5830.5 17487.15 10458.00 866300 73897.08
Amostra Estratificada 2138 4389.75 6000.0 10757.60 10321.75 83090 12707.95
Amostra por Conglomerados 2269 4378.50 5636.0 29830.33 13881.00 866300 124023.15


A apresentação das estatísticas descritivas das amostragens é fundamental para uma análise robusta e uma interpretação confiável dos dados coletados. Auxiliando para que a garantia das conclusões do estudo sejam baseadas em amostras representativas e bem caracterizadas das populações estudadas.


Conclusão


Este relatório explora três técnicas de amostragem — simples, estratificada e por conglomerados — aplicadas a um conjunto oficial de dados do Estado do Piauí, Brasil, de 2021. O objetivo foi selecionar uma amostra representativa da população para análise estatística. Inicialmente, calculamos o tamanho da amostra para cada técnica com base nas características da população e nos critérios de representatividade desejados, concluindo que uma amostra de 142 observações seria adequada para a aplicação das técnicas mencionadas.

Ao aplicar o teste de Kolmogorov-Smirnov (KS), confirmamos que todas as amostras foram estatisticamente semelhantes à população original em relação à variável de interesse (‘População Residente’). Isso reforça a validade das técnicas de amostragem empregadas, demonstrando que cada abordagem foi capaz de capturar de maneira representativa as características da população estudada. A análise estatística, incluindo o teste de Kolmogorov-Smirnov, evidenciou que as distribuições das variáveis de interesse nas amostras foram semelhantes às da população original.

Esses resultados fornecem uma base sólida para a confiabilidade dos dados amostrais e para as conclusões derivadas deste estudo.Certamente, é pertinente destacar que a amostragem por conglomerado se apresentou como o aspecto mais desafiador deste estudo. Embora as demais técnicas tenham sido bem desenvolvidas, foi necessário realizar múltiplos testes para determinar o número adequado de conglomerados que atendesse ao objetivo proposto neste documento.


Referências bibliográficas



Anexo


Listagem dos comandos utilizados e os resultados:


#Foi utilizado para desativar as mensagens, avisos e eco do código
#{r message=FALSE, warning=FALSE, echo=FALSE}


  • Tamanho da amostra
# Parâmetros
N <- 224  # Tamanho da população
Z <- 1.96  # Valor crítico para 95% de confiança
p <- 0.5  # Proporção esperada (máxima variabilidade)
e <- 0.05  # Margem de erro

# Fórmula do tamanho da amostra
n <- (N * Z^2 * p * (1 - p)) / (e^2 * (N - 1) + Z^2 * p * (1 - p))
n <- ceiling(n)  # Arredondar para cima
# Saída: (Tamanho da amostra)
cat("Tamanho da amostra: ", n)
## Tamanho da amostra:  142


  • Amostragem aleatória simples


  • PR–> População Residente

Tabela 1.Aplicação da amostragem aleatória simples

# Carregar pacotes necessários
library(dplyr)
library(readxl)
library(knitr)
library(kableExtra)

# Definir o caminho e ler o arquivo Excel
meuxlsx <- "piaui.xlsx"
Dados <- read_excel(path = meuxlsx, sheet = 1)
dados <- as.data.frame(Dados)

# Selecionar apenas as colunas de interesse: Municípios e População Residente
dados_selecionados <- dados %>%
  select(Municipio, PR)

# Aplicando a Amostragem Aleatória Simples
set.seed(123)
amostra_simples <- dados_selecionados %>%
  sample_n(142) %>%  # Seleciona 142 municípios aleatoriamente
  mutate(Número = row_number()) %>%  # Adiciona a numeração das linhas
  select(Número, everything())  # Reorganiza as colunas para ter a numeração no início

# Mostrar a saída formatada com kable e kableExtra, com tabela paginada
kable(amostra_simples, format = "html", table.attr = "style='width:100%;'") %>%
  kable_styling(full_width = FALSE, position = "center") %>%
  scroll_box(height = "400px", width = "100%")  # Define a altura da caixa de rolagem e largura total da tabela
Número Municipio PR
1 Nova Santa Rita 4076
2 Sebastião Barros 3202
3 Santana do Piauí 4125
4 Aroeiras do Itaim 2690
5 São João do Piauí 21421
6 Regeneração 17133
7 Capitão de Campos 11100
8 Landri Sales 5213
9 Campinas do Piauí 4937
10 Várzea Grande 4417
11 União 46119
12 Patos do Piauí 5425
13 Gilbués 10892
14 Guadalupe 10270
15 São José do Peixe 3297
16 Simplício Mendes 13881
17 São Félix do Piauí 2842
18 Guaribas 4276
19 Nazária 10262
20 Itaueira 10323
21 Demerval Lobão 15853
22 Beneditinos 9873
23 Altos 47416
24 Valença do Piauí 22281
25 São Raimundo Nonato 38934
26 Piripiri 65450
27 Eliseu Martins 4377
28 Flores do Piauí 4414
29 Teresina 866300
30 Jatobá do Piauí 4494
31 Lagoa do Sítio 4520
32 Dom Inocêncio 9159
33 Olho D’Água do Piauí 2637
34 Bom Princípio do Piauí 5636
35 Juazeiro do Piauí 5214
36 São Miguel da Baixa Grande 2269
37 São Lourenço do Piauí 4410
38 Redenção do Gurguéia 8394
39 Dom Expedito Lopes 6320
40 Batalha 26300
41 Paulistana 21055
42 Caraúbas do Piauí 5630
43 Murici dos Portelas 9004
44 Santo Inácio do Piauí 3646
45 São Braz do Piauí 4358
46 Porto Alegre do Piauí 2364
47 Boqueirão do Piauí 6545
48 Currais 4844
49 São Miguel do Tapuio 17554
50 São João da Varjota 4383
51 Conceição do Canindé 4932
52 Novo Santo Antônio 2827
53 Isaías Coelho 7774
54 Sigefredo Pacheco 9460
55 Sussuapara 6220
56 Buriti dos Montes 7434
57 Barreiras do Piauí 3264
58 Cajueiro da Praia 7957
59 Socorro do Piauí 4141
60 Coivaras 4043
61 Assunção do Piauí 7452
62 Lagoa do Piauí 4810
63 Ilha Grande 9274
64 Alto Longá 13479
65 Francisco Macedo 2929
66 Picos 83090
67 Cabeceiras do Piauí 10212
68 Tamboril do Piauí 2949
69 Uruçuí 25203
70 Santa Luz 5336
71 Alagoinha do Piauí 6819
72 Aroazes 5369
73 Santa Filomena 6087
74 Miguel Alves 32150
75 Caracol 10318
76 Barro Duro 6640
77 Geminiano 5445
78 Belém do Piauí 3423
79 Brasileira 8436
80 Lagoinha do Piauí 2939
81 Bocaina 4078
82 Novo Oriente do Piauí 6097
83 Madeiro 8032
84 Júlio Borges 5388
85 Coronel José Dias 4250
86 Cristino Castro 10503
87 Manoel Emídio 5209
88 Esperantina 40970
89 Francisco Ayres 4412
90 Capitão Gervásio Oliveira 3974
91 São Francisco de Assis do Piauí 5577
92 Joaquim Pires 13886
93 Itainópolis 10790
94 Morro do Chapéu do Piauí 6425
95 Parnaíba 162159
96 Avelino Lopes 10866
97 Colônia do Piauí 6991
98 Campo Largo do Piauí 7419
99 Caridade do Piauí 5033
100 Pajeú do Piauí 3000
101 Jerumenha 4497
102 Ribeiro Gonçalves 6164
103 Lagoa de São Francisco 6331
104 Pio IX 17613
105 São Gonçalo do Gurguéia 2947
106 Bela Vista do Piauí 4091
107 Lagoa Alegre 8256
108 Francisco Santos 8237
109 Joca Marques 5394
110 São Gonçalo do Piauí 4837
111 Hugo Napoleão 3518
112 Luzilândia 25375
113 Sebastião Leal 4446
114 São Miguel do Fidalgo 2829
115 Jardim do Mulato 4180
116 São João da Fronteira 5522
117 Nossa Senhora de Nazaré 5228
118 Bertolínia 5562
119 Caldeirão Grande do Piauí 5503
120 Alegrete do Piauí 4634
121 Curralinhos 4413
122 São Julião 6025
123 Luís Correia 30641
124 São João da Canabrava 4242
125 Queimada Nova 8738
126 Castelo do Piauí 19288
127 Domingos Mourão 4075
128 Brejo do Piauí 3904
129 Floriano 62036
130 Palmeirais 13263
131 Pedro Laurentino 2458
132 Matias Olímpio 10641
133 Vera Mendes 3185
134 Amarante 17235
135 Curral Novo do Piauí 5073
136 Canavieira 3414
137 Elesbão Veloso 13607
138 Ipiranga do Piauí 9420
139 Caxingó 5496
140 Oeiras 38161
141 Curimatá 11270
142 Acauã 6420


Amostragem aleatória estratificada


  • PR–> População Residente

Tabela 2.Aplicação da amostragem aleatória estratificada

# Calcular o tamanho da amostra para cada estrato proporcionalmente
dados_selecionados <- dados_selecionados %>%
  mutate(PR_faixa = cut(PR, 
                        breaks = quantile(PR, probs = seq(0, 1, 0.25), na.rm = TRUE),
                        labels = c("Baixa", "Média", "Alta", "Muito Alta"),
                        include.lowest = TRUE))

tamanho_estratos <- dados_selecionados %>%
  group_by(PR_faixa) %>%
  summarise(tamanho = n()) %>%
  mutate(amostra_tamanho = round(tamanho * 142 / sum(tamanho)))

# Ajustar o tamanho para garantir que a soma seja exatamente 142
diferenca <- 142 - sum(tamanho_estratos$amostra_tamanho)
if (diferenca != 0) {
  tamanho_estratos$amostra_tamanho[1] <- tamanho_estratos$amostra_tamanho[1] + diferenca
}

amostra_estratificada <- data.frame()
set.seed(123)
for (i in 1:nrow(tamanho_estratos)) {
  estrato_atual <- dados_selecionados %>%
    filter(PR_faixa == tamanho_estratos$PR_faixa[i]) %>%
    sample_n(tamanho_estratos$amostra_tamanho[i], replace = FALSE)
  amostra_estratificada <- rbind(amostra_estratificada, estrato_atual)
}

amostra_estratificada <- amostra_estratificada %>%
  mutate(Número = row_number()) %>%
  select(Número, everything())

# Adicionar o número de linha como uma coluna
amostra_estratificada <- amostra_estratificada %>%
  mutate(Número = row_number()) %>%
  select(Número, everything())

# Mostrar a saída formatada com kable e kableExtra
kable(amostra_estratificada, format = "html", table.attr = "style='width:50%;'") %>%
  kable_styling(full_width = FALSE, position = "center") %>%
  scroll_box(height = "300px")
Número Municipio PR PR_faixa
1 Pau D’Arco do Piauí 3880 Baixa
2 Eliseu Martins 4377 Baixa
3 Sebastião Barros 3202 Baixa
4 Domingos Mourão 4075 Baixa
5 Barra D’Alcântara 3995 Baixa
6 Santo Inácio do Piauí 3646 Baixa
7 São Miguel do Fidalgo 2829 Baixa
8 São Braz do Piauí 4358 Baixa
9 Riacho Frio 4165 Baixa
10 Tanque do Piauí 2316 Baixa
11 Novo Santo Antônio 2827 Baixa
12 Olho D’Água do Piauí 2637 Baixa
13 Paes Landim 4088 Baixa
14 Bela Vista do Piauí 4091 Baixa
15 São Gonçalo do Gurguéia 2947 Baixa
16 Pajeú do Piauí 3000 Baixa
17 Cajazeiras do Piauí 3108 Baixa
18 Paquetá 3813 Baixa
19 Porto Alegre do Piauí 2364 Baixa
20 Brejo do Piauí 3904 Baixa
21 São João da Canabrava 4242 Baixa
22 Bocaina 4078 Baixa
23 Santo Antônio dos Milagres 2138 Baixa
24 Hugo Napoleão 3518 Baixa
25 São Luis do Piauí 2309 Baixa
26 Francisco Macedo 2929 Baixa
27 Capitão Gervásio Oliveira 3974 Baixa
28 Prata do Piauí 3042 Baixa
29 João Costa 2970 Baixa
30 Coivaras 4043 Baixa
31 Vila Nova do Piauí 2935 Baixa
32 Canavieira 3414 Baixa
33 Coronel José Dias 4250 Baixa
34 Passagem Franca do Piauí 4135 Baixa
35 Santa Cruz dos Milagres 3435 Baixa
36 Rio Grande do Piauí 5801 Média
37 Campo Alegre do Fidalgo 4616 Média
38 Geminiano 5445 Média
39 Joca Marques 5394 Média
40 Bom Princípio do Piauí 5636 Média
41 São Lourenço do Piauí 4410 Média
42 Lagoa do Piauí 4810 Média
43 Nossa Senhora de Nazaré 5228 Média
44 Jatobá do Piauí 4494 Média
45 Landri Sales 5213 Média
46 Júlio Borges 5388 Média
47 Arraial 4520 Média
48 Caldeirão Grande do Piauí 5503 Média
49 Caridade do Piauí 5033 Média
50 Caxingó 5496 Média
51 Curral Novo do Piauí 5073 Média
52 Lagoa do Sítio 4520 Média
53 São João da Varjota 4383 Média
54 São Francisco do Piauí 5392 Média
55 Francinópolis 4505 Média
56 Conceição do Canindé 4932 Média
57 Jerumenha 4497 Média
58 Lagoa do Barro do Piauí 4995 Média
59 Currais 4844 Média
60 Flores do Piauí 4414 Média
61 Jurema 4425 Média
62 Bertolínia 5562 Média
63 Caraúbas do Piauí 5630 Média
64 Santa Luz 5336 Média
65 Francisco Ayres 4412 Média
66 São Francisco de Assis do Piauí 5577 Média
67 São José do Divino 4841 Média
68 São João da Fronteira 5522 Média
69 Curralinhos 4413 Média
70 Patos do Piauí 5425 Média
71 Ribeiro Gonçalves 6164 Alta
72 Madeiro 8032 Alta
73 Anísio de Abreu 9407 Alta
74 Buriti dos Montes 7434 Alta
75 Assunção do Piauí 7452 Alta
76 São João da Serra 6114 Alta
77 Dom Inocêncio 9159 Alta
78 Cristalândia do Piauí 7283 Alta
79 Santa Filomena 6087 Alta
80 Lagoa Alegre 8256 Alta
81 Parnaguá 10103 Alta
82 Redenção do Gurguéia 8394 Alta
83 Dirceu Arcoverde 7054 Alta
84 Marcolândia 8533 Alta
85 Murici dos Portelas 9004 Alta
86 Ipiranga do Piauí 9420 Alta
87 Brasileira 8436 Alta
88 Isaías Coelho 7774 Alta
89 Nazaré do Piauí 6665 Alta
90 Nossa Senhora dos Remédios 8525 Alta
91 Cabeceiras do Piauí 10212 Alta
92 Ilha Grande 9274 Alta
93 Queimada Nova 8738 Alta
94 Beneditinos 9873 Alta
95 Angical do Piauí 6827 Alta
96 Novo Oriente do Piauí 6097 Alta
97 Sussuapara 6220 Alta
98 Francisco Santos 8237 Alta
99 Cajueiro da Praia 7957 Alta
100 Colônia do Piauí 6991 Alta
101 São João do Arraial 8186 Alta
102 Betânia do Piauí 6220 Alta
103 Cocal dos Alves 6386 Alta
104 Bonfim do Piauí 5913 Alta
105 Caracol 10318 Alta
106 Morro do Chapéu do Piauí 6425 Alta
107 Piripiri 65450 Muito Alta
108 Monte Alegre do Piauí 10660 Muito Alta
109 Buriti dos Lopes 19654 Muito Alta
110 Floriano 62036 Muito Alta
111 Canto do Buriti 19365 Muito Alta
112 Elesbão Veloso 13607 Muito Alta
113 Regeneração 17133 Muito Alta
114 Cristino Castro 10503 Muito Alta
115 São Raimundo Nonato 38934 Muito Alta
116 Oeiras 38161 Muito Alta
117 Picos 83090 Muito Alta
118 Luís Correia 30641 Muito Alta
119 Cocal 28212 Muito Alta
120 Inhuma 14958 Muito Alta
121 Gilbués 10892 Muito Alta
122 Barras 47938 Muito Alta
123 José de Freitas 42559 Muito Alta
124 Valença do Piauí 22281 Muito Alta
125 Pio IX 17613 Muito Alta
126 Itaueira 10323 Muito Alta
127 Matias Olímpio 10641 Muito Alta
128 Pimenteiras 11341 Muito Alta
129 Jaicós 17527 Muito Alta
130 Avelino Lopes 10866 Muito Alta
131 Baixa Grande do Ribeiro 13272 Muito Alta
132 Corrente 27285 Muito Alta
133 Piracuruca 28453 Muito Alta
134 Esperantina 40970 Muito Alta
135 Paulistana 21055 Muito Alta
136 Campo Maior 45793 Muito Alta
137 Amarante 17235 Muito Alta
138 Simplício Mendes 13881 Muito Alta
139 Castelo do Piauí 19288 Muito Alta
140 Demerval Lobão 15853 Muito Alta
141 São João do Piauí 21421 Muito Alta
142 Bom Jesus 28799 Muito Alta


Amostragem aleatória por conglomerado


  • PR–> População Residente

Tabela 3.Aplicação da amostragem por conglomerado

# Carregando os pacotes necessários
library(dplyr)
library(knitr)
library(kableExtra)

# Definindo o número de conglomerados e o tamanho da amostra desejada
num_conglomerados <- 50
tamanho_amostra <- 142

# Selecionando aleatoriamente os conglomerados
set.seed(123)
conglomerados_selecionados <- sample(unique(dados_selecionados$Municipio), num_conglomerados)

# Função para calcular o tamanho de amostra por conglomerado
calcular_tamanho_conglomerado <- function(tamanho_restante, num_conglomerados) {
  tamanho_medio <- tamanho_restante %/% num_conglomerados
  tamanho <- rep(tamanho_medio, num_conglomerados)
  tamanho <- tamanho + (seq_len(num_conglomerados) <= tamanho_restante %% num_conglomerados)
  return(tamanho)
}

# Calculando o tamanho de amostra necessário por conglomerado
tamanhos_conglomerados <- calcular_tamanho_conglomerado(tamanho_amostra, num_conglomerados)

# Amostrar aleatoriamente dentro de cada conglomerado selecionado
amostra_conglomerado <- dados_selecionados %>%
  filter(Municipio %in% conglomerados_selecionados) %>%
  group_by(Municipio) %>%
  sample_n(size = tamanhos_conglomerados[match(Municipio, conglomerados_selecionados)], replace = TRUE) %>%
  ungroup()

# Verificar o tamanho da amostra atual
tamanho_amostra_atual <- nrow(amostra_conglomerado)

# Ajustar para garantir que a amostra final tenha exatamente 142 observações
if (tamanho_amostra_atual > tamanho_amostra) {
  set.seed(123)
  amostra_conglomerado <- amostra_conglomerado %>%
    sample_n(tamanho_amostra, replace = FALSE)
}

# Adicionar o número de linha como uma coluna
amostra_conglomerado <- amostra_conglomerado %>%
  mutate(Número = row_number()) %>%
  select(Número, everything())

# Mostrar a saída formatada com kable e kableExtra
kable(amostra_conglomerado, format = "html", table.attr = "style='width:50%;'") %>%
  kable_styling(full_width = FALSE, position = "center") %>%
  scroll_box(height = "300px")
Número Municipio PR PR_faixa
1 Altos 47416 Muito Alta
2 Altos 47416 Muito Alta
3 Altos 47416 Muito Alta
4 Aroeiras do Itaim 2690 Baixa
5 Aroeiras do Itaim 2690 Baixa
6 Aroeiras do Itaim 2690 Baixa
7 Batalha 26300 Muito Alta
8 Batalha 26300 Muito Alta
9 Batalha 26300 Muito Alta
10 Beneditinos 9873 Alta
11 Beneditinos 9873 Alta
12 Beneditinos 9873 Alta
13 Bom Princípio do Piauí 5636 Média
14 Bom Princípio do Piauí 5636 Média
15 Bom Princípio do Piauí 5636 Média
16 Boqueirão do Piauí 6545 Alta
17 Boqueirão do Piauí 6545 Alta
18 Campinas do Piauí 4937 Média
19 Campinas do Piauí 4937 Média
20 Campinas do Piauí 4937 Média
21 Capitão de Campos 11100 Muito Alta
22 Capitão de Campos 11100 Muito Alta
23 Capitão de Campos 11100 Muito Alta
24 Caraúbas do Piauí 5630 Média
25 Caraúbas do Piauí 5630 Média
26 Caraúbas do Piauí 5630 Média
27 Currais 4844 Média
28 Currais 4844 Média
29 Demerval Lobão 15853 Muito Alta
30 Demerval Lobão 15853 Muito Alta
31 Demerval Lobão 15853 Muito Alta
32 Dom Expedito Lopes 6320 Alta
33 Dom Expedito Lopes 6320 Alta
34 Dom Expedito Lopes 6320 Alta
35 Dom Inocêncio 9159 Alta
36 Dom Inocêncio 9159 Alta
37 Dom Inocêncio 9159 Alta
38 Eliseu Martins 4377 Baixa
39 Eliseu Martins 4377 Baixa
40 Eliseu Martins 4377 Baixa
41 Flores do Piauí 4414 Média
42 Flores do Piauí 4414 Média
43 Flores do Piauí 4414 Média
44 Gilbués 10892 Muito Alta
45 Gilbués 10892 Muito Alta
46 Gilbués 10892 Muito Alta
47 Guadalupe 10270 Alta
48 Guadalupe 10270 Alta
49 Guadalupe 10270 Alta
50 Guaribas 4276 Baixa
51 Guaribas 4276 Baixa
52 Guaribas 4276 Baixa
53 Itaueira 10323 Muito Alta
54 Itaueira 10323 Muito Alta
55 Itaueira 10323 Muito Alta
56 Jatobá do Piauí 4494 Média
57 Jatobá do Piauí 4494 Média
58 Jatobá do Piauí 4494 Média
59 Juazeiro do Piauí 5214 Média
60 Juazeiro do Piauí 5214 Média
61 Juazeiro do Piauí 5214 Média
62 Lagoa do Sítio 4520 Média
63 Lagoa do Sítio 4520 Média
64 Lagoa do Sítio 4520 Média
65 Landri Sales 5213 Média
66 Landri Sales 5213 Média
67 Landri Sales 5213 Média
68 Murici dos Portelas 9004 Alta
69 Murici dos Portelas 9004 Alta
70 Nazária 10262 Alta
71 Nazária 10262 Alta
72 Nazária 10262 Alta
73 Nova Santa Rita 4076 Baixa
74 Nova Santa Rita 4076 Baixa
75 Nova Santa Rita 4076 Baixa
76 Olho D’Água do Piauí 2637 Baixa
77 Olho D’Água do Piauí 2637 Baixa
78 Olho D’Água do Piauí 2637 Baixa
79 Patos do Piauí 5425 Média
80 Patos do Piauí 5425 Média
81 Patos do Piauí 5425 Média
82 Paulistana 21055 Muito Alta
83 Paulistana 21055 Muito Alta
84 Paulistana 21055 Muito Alta
85 Piripiri 65450 Muito Alta
86 Piripiri 65450 Muito Alta
87 Piripiri 65450 Muito Alta
88 Porto Alegre do Piauí 2364 Baixa
89 Porto Alegre do Piauí 2364 Baixa
90 Redenção do Gurguéia 8394 Alta
91 Redenção do Gurguéia 8394 Alta
92 Redenção do Gurguéia 8394 Alta
93 Regeneração 17133 Muito Alta
94 Regeneração 17133 Muito Alta
95 Regeneração 17133 Muito Alta
96 Santana do Piauí 4125 Baixa
97 Santana do Piauí 4125 Baixa
98 Santana do Piauí 4125 Baixa
99 Santo Inácio do Piauí 3646 Baixa
100 Santo Inácio do Piauí 3646 Baixa
101 Sebastião Barros 3202 Baixa
102 Sebastião Barros 3202 Baixa
103 Sebastião Barros 3202 Baixa
104 Simplício Mendes 13881 Muito Alta
105 Simplício Mendes 13881 Muito Alta
106 Simplício Mendes 13881 Muito Alta
107 São Braz do Piauí 4358 Baixa
108 São Braz do Piauí 4358 Baixa
109 São Félix do Piauí 2842 Baixa
110 São Félix do Piauí 2842 Baixa
111 São Félix do Piauí 2842 Baixa
112 São José do Peixe 3297 Baixa
113 São José do Peixe 3297 Baixa
114 São José do Peixe 3297 Baixa
115 São João da Varjota 4383 Média
116 São João da Varjota 4383 Média
117 São João do Piauí 21421 Muito Alta
118 São João do Piauí 21421 Muito Alta
119 São João do Piauí 21421 Muito Alta
120 São Lourenço do Piauí 4410 Média
121 São Lourenço do Piauí 4410 Média
122 São Lourenço do Piauí 4410 Média
123 São Miguel da Baixa Grande 2269 Baixa
124 São Miguel da Baixa Grande 2269 Baixa
125 São Miguel da Baixa Grande 2269 Baixa
126 São Miguel do Tapuio 17554 Muito Alta
127 São Miguel do Tapuio 17554 Muito Alta
128 São Raimundo Nonato 38934 Muito Alta
129 São Raimundo Nonato 38934 Muito Alta
130 São Raimundo Nonato 38934 Muito Alta
131 Teresina 866300 Muito Alta
132 Teresina 866300 Muito Alta
133 Teresina 866300 Muito Alta
134 União 46119 Muito Alta
135 União 46119 Muito Alta
136 União 46119 Muito Alta
137 Valença do Piauí 22281 Muito Alta
138 Valença do Piauí 22281 Muito Alta
139 Valença do Piauí 22281 Muito Alta
140 Várzea Grande 4417 Média
141 Várzea Grande 4417 Média
142 Várzea Grande 4417 Média


Resultados e discussão


Tabela 4.Tamanho da amostra das três técnicas

cat("Tamanho da Amostra Simples: ", nrow(amostra_simples), "\n")
## Tamanho da Amostra Simples:  142
cat("Tamanho da Amostra Estratificada: ", nrow(amostra_estratificada), "\n")
## Tamanho da Amostra Estratificada:  142
cat("Tamanho da Amostra por Conglomerados: ", nrow(amostra_conglomerado), "\n")
## Tamanho da Amostra por Conglomerados:  142


Tabela 5.Resultados dos testes de KS para cada amostra

# Função para realizar o teste KS e formatar a saída
realizar_teste_ks <- function(dados_populacao, dados_amostra, nome_amostra) {
  resultado <- ks.test(dados_populacao, dados_amostra)
  cat(sprintf("\nTeste KS para %s\n", nome_amostra))
  cat("----------------------------\n")
  cat(sprintf("Estatística D: %.5f\n", resultado$statistic))
  cat(sprintf("Valor p: %.5f\n", resultado$p.value))
  if (resultado$p.value < 0.05) {
    cat("Resultado: Rejeitamos a hipótese nula (distribuições são diferentes)\n")
  } else {
    cat("Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)\n")
  }
  cat("----------------------------\n")
}

# Realização dos testes KS e formatação da saída
cat("Resultados dos Testes de Kolmogorov-Smirnov\n")
## Resultados dos Testes de Kolmogorov-Smirnov
cat("============================\n")
## ============================
realizar_teste_ks(dados_selecionados$PR, amostra_simples$PR, "Amostra Simples")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
## 
## Teste KS para Amostra Simples
## ----------------------------
## Estatística D: 0.02899
## Valor p: 1.00000
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
realizar_teste_ks(dados_selecionados$PR, amostra_estratificada$PR, "Amostra Estratificada")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
## 
## Teste KS para Amostra Estratificada
## ----------------------------
## Estatística D: 0.03672
## Valor p: 0.99980
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
realizar_teste_ks(dados_selecionados$PR, amostra_conglomerado$PR, "Amostra por Conglomerados")
## Warning in ks.test.default(dados_populacao, dados_amostra): p-value will be
## approximate in the presence of ties
## 
## Teste KS para Amostra por Conglomerados
## ----------------------------
## Estatística D: 0.11708
## Valor p: 0.18449
## Resultado: Não rejeitamos a hipótese nula (distribuições são semelhantes)
## ----------------------------
cat("============================\n")
## ============================


Tabela 6. Apresentação das estatísticas descritivas das amostragens para fornecer uma visão resumida e quantitativa das características das variáveis de interesse em cada amostra.

# Pacote necessário para formatação de tabelas
library(knitr)

# Função para calcular as estatísticas descritivas
desc_stats <- function(x) {
  stats <- c(
    "Mínimo" = min(x, na.rm = TRUE),
    "1º Quartil" = quantile(x, 0.25, na.rm = TRUE),
    "Mediana" = median(x, na.rm = TRUE),
    "Média" = mean(x, na.rm = TRUE),
    "3º Quartil" = quantile(x, 0.75, na.rm = TRUE),
    "Máximo" = max(x, na.rm = TRUE),
    "Desvio Padrão" = sd(x, na.rm = TRUE)
  )
  return(stats)
}

# Criar uma tabela com estatísticas descritivas
desc_table <- rbind(
  "População Original" = desc_stats(dados_selecionados$PR),
  "Amostra Simples" = desc_stats(amostra_simples$PR),
  "Amostra Estratificada" = desc_stats(amostra_estratificada$PR),
  "Amostra por Conglomerados" = desc_stats(amostra_conglomerado$PR)
)

# Formatar a tabela usando knitr
kable(desc_table, caption = "Estatísticas Descritivas para as Amostras", align = "c", format = "html") %>%
  kable_styling(full_width = FALSE)
Estatísticas Descritivas para as Amostras
Mínimo 1º Quartil.25% Mediana Média 3º Quartil.75% Máximo Desvio Padrão
População Original 1318 4377.00 5876.0 14594.64 10319.25 866300 59183.08
Amostra Simples 2269 4378.50 5830.5 17487.15 10458.00 866300 73897.08
Amostra Estratificada 2138 4389.75 6000.0 10757.60 10321.75 83090 12707.95
Amostra por Conglomerados 2269 4378.50 5636.0 29830.33 13881.00 866300 124023.15