dados_titanic$Faixa_Etaria <-cut(dados_titanic$Idade,c(0, 18, 65, 200))dados_titanic$Faixa_Etarialevels(dados_titanic$Faixa_Etaria) <-c("Até 18 anos", "Maior que 18 e menor que 65 anos", "Maior que 65 anos")
Estatística Descritiva Univariada
Qualitativa
Vamos trabalhar com a variável classes econômica. Para começar, vamos construir uma tabela de distribuição de frequência. Podemos observar que a maioria dos passageiros era da terceira classe (55,11%), sendo a segunda classe contendo a menor proporção de passageiros (20,65%) (Figura 1).
library(summarytools)
Warning: package 'summarytools' was built under R version 4.2.3
freq(dados_titanic$Classe)
Frequencies
dados_titanic$Classe
Type: Factor
Freq % Valid % Valid Cum. % Total % Total Cum.
-------------- ------ --------- -------------- --------- --------------
Primeira 216 24.24 24.24 24.24 24.24
Segunda 184 20.65 44.89 20.65 44.89
Terceira 491 55.11 100.00 55.11 100.00
<NA> 0 0.00 100.00
Total 891 100.00 100.00 100.00 100.00
freq(dados_titanic$`Porto de Embarque`)
Frequencies
dados_titanic$`Porto de Embarque`
Type: Factor
Freq % Valid % Valid Cum. % Total % Total Cum.
----------- ------ --------- -------------- --------- --------------
C 168 18.90 18.90 18.86 18.86
Q 77 8.66 27.56 8.64 27.50
S 644 72.44 100.00 72.28 99.78
<NA> 2 0.22 100.00
Total 891 100.00 100.00 100.00 100.00
Vamos agora fazer um gráfico de barras para a variável classe econômica:
# Mudando a ordem das categoriasdados_titanic$Classe <-factor(dados_titanic$Classe, levels =c("Terceira", "Segunda", "Primeira"))library(ggplot2)
Warning: package 'ggplot2' was built under R version 4.2.3
ggplot(dados_titanic) +aes(x = Classe) +geom_bar(fill ="slateblue3") +labs(x ="Classe Econômica", y ="Frequência", title ="Figura 1: Classe Econômica dos passageiros do Titanic", subtitle =":)") +coord_flip() +theme_minimal() +theme(plot.title =element_text(face ="bold.italic", hjust =0.5))