[1] 910 994 1120 1159 1180 1192 1281 1294 1312 1332 1333 1358 1366 1411 1431
[16] 1435 1521 1533 1539 1546 1608 1620 1628 1638 1649 1710 1746 1751 1763 1769
[31] 1867 1876 1968 2015 2036
Atividades - Estatística descritiva - Turismo
Estatística descritiva
O objetivo das estatísticas descritivas é apresentar uma massa de dados de uma forma mais compreensível. Podemos resumir os dados em números como (a) alguma forma de média, ou em alguns casos uma proporção, (b) alguma medida de variabilidade e (c) quantidades como quartis ou percentis, que dividem os dados de forma que certas porcentagens dos dados estejam acima ou abaixo dessas marcas. Esta aula será sobre vários números de resumo.
O uso de um computador ou calculadora pode tornar o tratamento de conjuntos massivos de dados muito mais fácil, portanto, os cálculos de computador nesta serão considerados em detalhes e fornecidos na aula prática. No entanto, é necessário ter os fundamentos das estatísticas descritivas claramente em mente ao usar o computador, para que as ideias e relações das estatísticas descritivas sejam desenvolvidas primeiro para cálculos a lápis e papel com uma calculadora. Em seguida, os métodos de computador serão introduzidos e ilustrados com exemplos.
Exemplo 1
Apresenta-se, a seguir, um conjunto de dados fictício contendo 35 observações da variável ‘Gasto Médio por Turista’ (em dólares), referente ao valor médio gasto por turistas durante suas viagens.
Conjunto de Dados
Organização - Tabela de distribuição de frequências
Attaching package: 'fdth'
The following objects are masked from 'package:stats':
sd, var
Class limits f rf rf(%) cf cf(%)
[900.9,1065.966) 2 0.06 5.71 2 5.71
[1065.966,1231.031) 4 0.11 11.43 6 17.14
[1231.031,1396.097) 7 0.20 20.00 13 37.14
[1396.097,1561.163) 7 0.20 20.00 20 57.14
[1561.163,1726.229) 6 0.17 17.14 26 74.29
[1726.229,1891.294) 6 0.17 17.14 32 91.43
[1891.294,2056.36) 3 0.09 8.57 35 100.00
Medidas descritivas
Medidas posição
Min. 1st Qu. Median Mean 3rd Qu. Max.
910 1322 1533 1511 1728 2036
[1] "Moda" "1559.40697147268"
Medidas de variabilidade
[1] "Amplitude" "1126"
[3] "Variância Amostral" "80594.4403361344"
[5] "Desvio padrão Amostral" "283.891599622346"
[7] "Coeficiente de variação" "18.7861942235581"
Medidas Separatirizes
### Percentis e quartis
25% 50% 75%
"Quartis" "1322" "1533" "1728"
Gráficos
Variável Quantitativa contínua
Introdução
Neste estudo, iremos analisar a relação entre o Gasto Médio por Turista (R$) e o Tipo de Atração Turística visitada. Essa análise é relevante para compreender como diferentes tipos de turismo impactam os gastos dos visitantes e auxiliar na formulação de políticas e estratégias no setor.
Conjunto de Dados
Para esta análise, utilizaremos um conjunto de dados simulado com 200 observações, contendo as seguintes variáveis:
Gasto_Medio
: Valor médio gasto pelo turista em reais (R$).Tipo_Atracao
: Categoria da atração visitada (“Cultural”, “Natureza”, “Entretenimento”, “Negócios”).
Código em R
Simulação do Conjunto de Dados
set.seed(123) # Para reprodutibilidade
<- data.frame(
dados Tipo_Atracao = sample(c("Cultural", "Natureza", "Entretenimento", "Negócios"), 200, replace = TRUE),
Gasto_Medio = round(rnorm(200, mean = 500, sd = 150), 2)
)
# Visualizar as primeiras linhas
%>% head() %>% kable() dados
Tipo_Atracao | Gasto_Medio |
---|---|
Entretenimento | 393.44 |
Entretenimento | 538.53 |
Entretenimento | 463.00 |
Natureza | 447.87 |
Entretenimento | 357.26 |
Natureza | 493.25 |
Análise Descritiva
Medidas de Posição e Variabilidade
<- dados %>%
descritiva group_by(Tipo_Atracao) %>%
summarise(
Media = mean(Gasto_Medio),
Mediana = median(Gasto_Medio),
Desvio_Padrao = sd(Gasto_Medio),
Minimo = min(Gasto_Medio),
Maximo = max(Gasto_Medio),
Q1 = quantile(Gasto_Medio, 0.25),
Q3 = quantile(Gasto_Medio, 0.75)
)
# Exibir a tabela de estatísticas descritivas
%>% kable() descritiva
Tipo_Atracao | Media | Mediana | Desvio_Padrao | Minimo | Maximo | Q1 | Q3 |
---|---|---|---|---|---|---|---|
Cultural | 539.0091 | 513.380 | 151.0791 | 272.80 | 829.82 | 426.4200 | 637.8500 |
Entretenimento | 491.5259 | 473.585 | 152.5807 | 236.52 | 986.16 | 392.6750 | 555.8825 |
Natureza | 487.4375 | 489.300 | 125.5073 | 192.01 | 785.35 | 421.1200 | 555.7500 |
Negócios | 490.9721 | 476.285 | 146.8939 | 249.88 | 800.37 | 384.1675 | 600.1625 |
Tabela de Distribuição de Frequências
<- dados %>%
tabela_frequencia group_by(Tipo_Atracao) %>%
summarise(Frequencia = n()) %>%
mutate(Percentual = round((Frequencia / sum(Frequencia)) * 100, 2))
# Exibir a tabela de frequência
%>% kable() tabela_frequencia
Tipo_Atracao | Frequencia | Percentual |
---|---|---|
Cultural | 45 | 22.5 |
Entretenimento | 58 | 29.0 |
Natureza | 55 | 27.5 |
Negócios | 42 | 21.0 |
Visualizações Gráficas
Boxplot para Comparação de Gastos entre Atrações
ggplot(dados, aes(x = Tipo_Atracao, y = Gasto_Medio, fill = Tipo_Atracao)) +
geom_boxplot() +
labs(title = "Distribuição do Gasto Médio por Tipo de Atração", x = "Tipo de Atração", y = "Gasto Médio (R$)") +
theme_minimal()
Gráfico de Barras para Distribuição de Tipos de Atrações
ggplot(tabela_frequencia, aes(x = Tipo_Atracao, y = Frequencia, fill = Tipo_Atracao)) +
geom_bar(stat = "identity") +
labs(title = "Distribuição de Frequência dos Tipos de Atrações", x = "Tipo de Atração", y = "Frequência") +
theme_minimal()
Conclusão
Com base na análise, podemos observar as diferenças nos gastos médios dos turistas conforme o tipo de atração visitada. Essas informações podem ser valiosas para gestores e empreendedores do setor turístico ao planejarem estratégias para atrair diferentes perfis de visitantes.