Atividades - Estatística descritiva - Turismo

Author

Marcelo Ribeiro

Published

February 25, 2025

Estatística descritiva

O objetivo das estatísticas descritivas é apresentar uma massa de dados de uma forma mais compreensível. Podemos resumir os dados em números como (a) alguma forma de média, ou em alguns casos uma proporção, (b) alguma medida de variabilidade e (c) quantidades como quartis ou percentis, que dividem os dados de forma que certas porcentagens dos dados estejam acima ou abaixo dessas marcas. Esta aula será sobre vários números de resumo.

O uso de um computador ou calculadora pode tornar o tratamento de conjuntos massivos de dados muito mais fácil, portanto, os cálculos de computador nesta serão considerados em detalhes e fornecidos na aula prática. No entanto, é necessário ter os fundamentos das estatísticas descritivas claramente em mente ao usar o computador, para que as ideias e relações das estatísticas descritivas sejam desenvolvidas primeiro para cálculos a lápis e papel com uma calculadora. Em seguida, os métodos de computador serão introduzidos e ilustrados com exemplos.

Exemplo 1

Apresenta-se, a seguir, um conjunto de dados fictício contendo 35 observações da variável ‘Gasto Médio por Turista’ (em dólares), referente ao valor médio gasto por turistas durante suas viagens.

Conjunto de Dados

 [1]  910  994 1120 1159 1180 1192 1281 1294 1312 1332 1333 1358 1366 1411 1431
[16] 1435 1521 1533 1539 1546 1608 1620 1628 1638 1649 1710 1746 1751 1763 1769
[31] 1867 1876 1968 2015 2036

Organização - Tabela de distribuição de frequências


Attaching package: 'fdth'
The following objects are masked from 'package:stats':

    sd, var
        Class limits f   rf rf(%) cf  cf(%)
    [900.9,1065.966) 2 0.06  5.71  2   5.71
 [1065.966,1231.031) 4 0.11 11.43  6  17.14
 [1231.031,1396.097) 7 0.20 20.00 13  37.14
 [1396.097,1561.163) 7 0.20 20.00 20  57.14
 [1561.163,1726.229) 6 0.17 17.14 26  74.29
 [1726.229,1891.294) 6 0.17 17.14 32  91.43
  [1891.294,2056.36) 3 0.09  8.57 35 100.00

Medidas descritivas

Medidas posição

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    910    1322    1533    1511    1728    2036 
[1] "Moda"             "1559.40697147268"

Medidas de variabilidade

[1] "Amplitude"               "1126"                   
[3] "Variância Amostral"      "80594.4403361344"       
[5] "Desvio padrão Amostral"  "283.891599622346"       
[7] "Coeficiente de variação" "18.7861942235581"       

Medidas Separatirizes

### Percentis e quartis

                25%       50%       75% 
"Quartis"    "1322"    "1533"    "1728" 

Gráficos

Variável Quantitativa contínua

Introdução

Neste estudo, iremos analisar a relação entre o Gasto Médio por Turista (R$) e o Tipo de Atração Turística visitada. Essa análise é relevante para compreender como diferentes tipos de turismo impactam os gastos dos visitantes e auxiliar na formulação de políticas e estratégias no setor.

Conjunto de Dados

Para esta análise, utilizaremos um conjunto de dados simulado com 200 observações, contendo as seguintes variáveis:

  • Gasto_Medio: Valor médio gasto pelo turista em reais (R$).
  • Tipo_Atracao: Categoria da atração visitada (“Cultural”, “Natureza”, “Entretenimento”, “Negócios”).

Código em R

Simulação do Conjunto de Dados

set.seed(123) # Para reprodutibilidade
dados <- data.frame(
  Tipo_Atracao = sample(c("Cultural", "Natureza", "Entretenimento", "Negócios"), 200, replace = TRUE),
  Gasto_Medio = round(rnorm(200, mean = 500, sd = 150), 2)
)

# Visualizar as primeiras linhas
dados %>% head() %>% kable()
Tipo_Atracao Gasto_Medio
Entretenimento 393.44
Entretenimento 538.53
Entretenimento 463.00
Natureza 447.87
Entretenimento 357.26
Natureza 493.25

Análise Descritiva

Medidas de Posição e Variabilidade

descritiva <- dados %>% 
  group_by(Tipo_Atracao) %>% 
  summarise(
    Media = mean(Gasto_Medio),
    Mediana = median(Gasto_Medio),
    Desvio_Padrao = sd(Gasto_Medio),
    Minimo = min(Gasto_Medio),
    Maximo = max(Gasto_Medio),
    Q1 = quantile(Gasto_Medio, 0.25),
    Q3 = quantile(Gasto_Medio, 0.75)
  )

# Exibir a tabela de estatísticas descritivas
descritiva %>% kable()
Tipo_Atracao Media Mediana Desvio_Padrao Minimo Maximo Q1 Q3
Cultural 539.0091 513.380 151.0791 272.80 829.82 426.4200 637.8500
Entretenimento 491.5259 473.585 152.5807 236.52 986.16 392.6750 555.8825
Natureza 487.4375 489.300 125.5073 192.01 785.35 421.1200 555.7500
Negócios 490.9721 476.285 146.8939 249.88 800.37 384.1675 600.1625

Tabela de Distribuição de Frequências

tabela_frequencia <- dados %>% 
  group_by(Tipo_Atracao) %>% 
  summarise(Frequencia = n()) %>% 
  mutate(Percentual = round((Frequencia / sum(Frequencia)) * 100, 2))

# Exibir a tabela de frequência
tabela_frequencia %>% kable()
Tipo_Atracao Frequencia Percentual
Cultural 45 22.5
Entretenimento 58 29.0
Natureza 55 27.5
Negócios 42 21.0

Visualizações Gráficas

Boxplot para Comparação de Gastos entre Atrações

ggplot(dados, aes(x = Tipo_Atracao, y = Gasto_Medio, fill = Tipo_Atracao)) +
  geom_boxplot() +
  labs(title = "Distribuição do Gasto Médio por Tipo de Atração", x = "Tipo de Atração", y = "Gasto Médio (R$)") +
  theme_minimal()

Gráfico de Barras para Distribuição de Tipos de Atrações

ggplot(tabela_frequencia, aes(x = Tipo_Atracao, y = Frequencia, fill = Tipo_Atracao)) +
  geom_bar(stat = "identity") +
  labs(title = "Distribuição de Frequência dos Tipos de Atrações", x = "Tipo de Atração", y = "Frequência") +
  theme_minimal()

Conclusão

Com base na análise, podemos observar as diferenças nos gastos médios dos turistas conforme o tipo de atração visitada. Essas informações podem ser valiosas para gestores e empreendedores do setor turístico ao planejarem estratégias para atrair diferentes perfis de visitantes.