Carregando os pacotes

library(forcats)
library(ggplot2)
library(ggpubr)
library(dplyr)

Carregando o banco de dados

load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
load("C:/Users/Priscila/Desktop/Base_de_dados-master/Titanic.RData")
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic)
##     Classe  Idade      Sexo Sobreviveu
## 1 Primeira adulto Masculino Sobreviveu
## 2 Primeira adulto Masculino Sobreviveu
## 3 Primeira adulto Masculino Sobreviveu
## 4 Primeira adulto Masculino Sobreviveu
## 5 Primeira adulto Masculino Sobreviveu
## 6 Primeira adulto Masculino Sobreviveu

Atividade 1

paste("Tinham", Titanic %>% nrow(), "pessoas a bordo do Titanic.")
## [1] "Tinham 2200 pessoas a bordo do Titanic."
paste("Existem", Titanic %>% ncol(), "variáveis no banco do Titanic. São elas:")
## [1] "Existem 4 variáveis no banco do Titanic. São elas:"
cat(names(Titanic))
## Classe Idade Sexo Sobreviveu

Atividade 2

paste("Sobreviveram", sort(table(Titanic$Sobreviveu),decreasing=FALSE)[1:1], 
      "pessoas.")
## [1] "Sobreviveram 710 pessoas."

Atividade 3

paste("A proporção de sobreviventes do Titanic é de 32%.")
## [1] "A proporção de sobreviventes do Titanic é de 32%."
round(prop.table(table(Titanic$Sobreviveu))*100)
## 
## Não sobreviveu     Sobreviveu 
##             68             32

Atividade 4

paste("Sobreviveram", Titanic %>%
  filter(Sexo == "Feminino") %>% 
  filter (Sobreviveu == "Sobreviveu") %>% 
  nrow(),"mulheres.")
## [1] "Sobreviveram 344 mulheres."

Atividade 5

paste("Sobreviveram", Titanic %>%
  filter(Idade == "criança") %>%
  filter(Sobreviveu == "Sobreviveu") %>%
  nrow(), "crianças.")
## [1] "Sobreviveram 57 crianças."

Atividade 6

paste("Sobreviveram", Titanic %>%
  filter(Classe == "Terceira")%>%
  filter(Sobreviveu == "Sobreviveu")%>%
  nrow(), "pessoas da terceira classe.")
## [1] "Sobreviveram 178 pessoas da terceira classe."

Atividade 7

paste("O percentual de mulheres que sobreviveram é de 73%.")
## [1] "O percentual de mulheres que sobreviveram é de 73%."
mulheres_titanic <- filter(Titanic,Sexo == "Feminino")
mulheres_sobreviveu2 <- table(mulheres_titanic$Sobreviveu)
round(prop.table(mulheres_sobreviveu2)*100)
## 
## Não sobreviveu     Sobreviveu 
##             27             73

Atividade 8

paste("O percentual de crianças que sobreviveram é de 52%.")
## [1] "O percentual de crianças que sobreviveram é de 52%."
criancas_titanic <- filter(Titanic,Idade == "criança")
criancas_sobreviveu <- table(criancas_titanic$Sobreviveu)
round(prop.table(criancas_sobreviveu)*100)
## 
## Não sobreviveu     Sobreviveu 
##             48             52

Atividade 9

paste("25% de pessoas da terceira classe sobreviberam.")
## [1] "25% de pessoas da terceira classe sobreviberam."
terceira_classe <- filter(Titanic,Classe == "Terceira")
terceira_classe_sobreviveu <- table(terceira_classe$Sobreviveu)
round(prop.table(terceira_classe_sobreviveu)*100)
## 
## Não sobreviveu     Sobreviveu 
##             75             25

Atividade 10

paste("Por serem variáveis categóricas, acredito que a melhor visualização dos dados seria através do gráfico em barras.")
## [1] "Por serem variáveis categóricas, acredito que a melhor visualização dos dados seria através do gráfico em barras."

Atividade 11

ggplot(Titanic, aes(x= Sobreviveu)) +
  geom_bar(fill = "#033973", width = 0.3) +
  labs(title = "Gráfico em barras - Sobreviventes") +
 facet_grid()

Atividade 12

ggplot(Titanic, aes(x= Sobreviveu))+
  geom_bar(fill= "#033973", width = 0.5)+
  labs(title = "Gráfico em barras - Sobeviventes por sexo" )+
  facet_grid(vars(), vars(Sexo))

Desafio: nova visualização de dados

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), main = "Sobreviventes do Titanic", color = c("#b0d1f5","#4c94e0"))

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela)
ggballoonplot(tabela, fill = "value")+
  ggtitle("Sobreviventes do Titanic")

Atividade 13

  ggplot(Titanic) +
    aes(x = Classe, fill = Sobreviveu) +
    geom_bar(position = "dodge") +
    scale_fill_brewer(palette = "Paired") +  
    labs(title = "Gráfico em barras - Sobreviventes por classe" )+
  facet_grid ()

Atividade 14

paste("Ambos os gráficos mostram a discrepância no número de sobreviventes em relação a classe ao qual pertencem. O primeiro gráfico apresenta a frequência absoluta de sobreviventes e não sobrevientes de forma que cada ponto é proporcional ao valor numérico de cada variável. Já o segundo gráfico apresenta uma visualização dos dados de maneira mais subjetiva. O que ambos os gráficos demonstram é que grande parte dos sobreviventes são pertencentes a primeira classe, enquanto a tripulação e a terceira classe, em sua maioria, não sobreviveram ao nafrágio do Titanic.")
## [1] "Ambos os gráficos mostram a discrepância no número de sobreviventes em relação a classe ao qual pertencem. O primeiro gráfico apresenta a frequência absoluta de sobreviventes e não sobrevientes de forma que cada ponto é proporcional ao valor numérico de cada variável. Já o segundo gráfico apresenta uma visualização dos dados de maneira mais subjetiva. O que ambos os gráficos demonstram é que grande parte dos sobreviventes são pertencentes a primeira classe, enquanto a tripulação e a terceira classe, em sua maioria, não sobreviveram ao nafrágio do Titanic."

Atividade 15

paste("A partir da visualização dos dados, é notório a discrepância no númeo de sobreviventes por classe. Em sua maioria, tanto a tripulação quanto as pessoas pertencentes a terceira classe não sobreviveram ao nafrágio. Posto isto, em primeiro lugar, recomendaria uma revisão na escolha de alocação dos tripulantes do navio nos botes salva vidas. Além disto, também acho necessário a reavaliação da quantidade de botes disponíveis. Caso houvessem mais botes, todos as pessoas que estavam a bordo do Titanic teriam chances de sobreviver.")
## [1] "A partir da visualização dos dados, é notório a discrepância no númeo de sobreviventes por classe. Em sua maioria, tanto a tripulação quanto as pessoas pertencentes a terceira classe não sobreviveram ao nafrágio. Posto isto, em primeiro lugar, recomendaria uma revisão na escolha de alocação dos tripulantes do navio nos botes salva vidas. Além disto, também acho necessário a reavaliação da quantidade de botes disponíveis. Caso houvessem mais botes, todos as pessoas que estavam a bordo do Titanic teriam chances de sobreviver."