Carregando os pacotes
library(forcats)
library(ggplot2)
library(ggpubr)
library(dplyr)
Carregando o banco de dados
load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
load("C:/Users/Priscila/Desktop/Base_de_dados-master/Titanic.RData")
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic)
## Classe Idade Sexo Sobreviveu
## 1 Primeira adulto Masculino Sobreviveu
## 2 Primeira adulto Masculino Sobreviveu
## 3 Primeira adulto Masculino Sobreviveu
## 4 Primeira adulto Masculino Sobreviveu
## 5 Primeira adulto Masculino Sobreviveu
## 6 Primeira adulto Masculino Sobreviveu
Atividade 1
paste("Tinham", Titanic %>% nrow(), "pessoas a bordo do Titanic.")
## [1] "Tinham 2200 pessoas a bordo do Titanic."
paste("Existem", Titanic %>% ncol(), "variáveis no banco do Titanic. São elas:")
## [1] "Existem 4 variáveis no banco do Titanic. São elas:"
cat(names(Titanic))
## Classe Idade Sexo Sobreviveu
Atividade 2
paste("Sobreviveram", sort(table(Titanic$Sobreviveu),decreasing=FALSE)[1:1],
"pessoas.")
## [1] "Sobreviveram 710 pessoas."
Atividade 3
paste("A proporção de sobreviventes do Titanic é de 32%.")
## [1] "A proporção de sobreviventes do Titanic é de 32%."
round(prop.table(table(Titanic$Sobreviveu))*100)
##
## Não sobreviveu Sobreviveu
## 68 32
Atividade 4
paste("Sobreviveram", Titanic %>%
filter(Sexo == "Feminino") %>%
filter (Sobreviveu == "Sobreviveu") %>%
nrow(),"mulheres.")
## [1] "Sobreviveram 344 mulheres."
Atividade 5
paste("Sobreviveram", Titanic %>%
filter(Idade == "criança") %>%
filter(Sobreviveu == "Sobreviveu") %>%
nrow(), "crianças.")
## [1] "Sobreviveram 57 crianças."
Atividade 6
paste("Sobreviveram", Titanic %>%
filter(Classe == "Terceira")%>%
filter(Sobreviveu == "Sobreviveu")%>%
nrow(), "pessoas da terceira classe.")
## [1] "Sobreviveram 178 pessoas da terceira classe."
Atividade 7
paste("O percentual de mulheres que sobreviveram é de 73%.")
## [1] "O percentual de mulheres que sobreviveram é de 73%."
mulheres_titanic <- filter(Titanic,Sexo == "Feminino")
mulheres_sobreviveu2 <- table(mulheres_titanic$Sobreviveu)
round(prop.table(mulheres_sobreviveu2)*100)
##
## Não sobreviveu Sobreviveu
## 27 73
Atividade 8
paste("O percentual de crianças que sobreviveram é de 52%.")
## [1] "O percentual de crianças que sobreviveram é de 52%."
criancas_titanic <- filter(Titanic,Idade == "criança")
criancas_sobreviveu <- table(criancas_titanic$Sobreviveu)
round(prop.table(criancas_sobreviveu)*100)
##
## Não sobreviveu Sobreviveu
## 48 52
Atividade 9
paste("25% de pessoas da terceira classe sobreviberam.")
## [1] "25% de pessoas da terceira classe sobreviberam."
terceira_classe <- filter(Titanic,Classe == "Terceira")
terceira_classe_sobreviveu <- table(terceira_classe$Sobreviveu)
round(prop.table(terceira_classe_sobreviveu)*100)
##
## Não sobreviveu Sobreviveu
## 75 25
Atividade 10
paste("Por serem variáveis categóricas, acredito que a melhor visualização dos dados seria através do gráfico em barras.")
## [1] "Por serem variáveis categóricas, acredito que a melhor visualização dos dados seria através do gráfico em barras."
Atividade 11
ggplot(Titanic, aes(x= Sobreviveu)) +
geom_bar(fill = "#033973", width = 0.3) +
labs(title = "Gráfico em barras - Sobreviventes") +
facet_grid()

Atividade 12
ggplot(Titanic, aes(x= Sobreviveu))+
geom_bar(fill= "#033973", width = 0.5)+
labs(title = "Gráfico em barras - Sobeviventes por sexo" )+
facet_grid(vars(), vars(Sexo))

Desafio: nova visualização de dados
mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), main = "Sobreviventes do Titanic", color = c("#b0d1f5","#4c94e0"))

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela)
ggballoonplot(tabela, fill = "value")+
ggtitle("Sobreviventes do Titanic")

Atividade 13
ggplot(Titanic) +
aes(x = Classe, fill = Sobreviveu) +
geom_bar(position = "dodge") +
scale_fill_brewer(palette = "Paired") +
labs(title = "Gráfico em barras - Sobreviventes por classe" )+
facet_grid ()

Atividade 14
paste("Ambos os gráficos mostram a discrepância no número de sobreviventes em relação a classe ao qual pertencem. O primeiro gráfico apresenta a frequência absoluta de sobreviventes e não sobrevientes de forma que cada ponto é proporcional ao valor numérico de cada variável. Já o segundo gráfico apresenta uma visualização dos dados de maneira mais subjetiva. O que ambos os gráficos demonstram é que grande parte dos sobreviventes são pertencentes a primeira classe, enquanto a tripulação e a terceira classe, em sua maioria, não sobreviveram ao nafrágio do Titanic.")
## [1] "Ambos os gráficos mostram a discrepância no número de sobreviventes em relação a classe ao qual pertencem. O primeiro gráfico apresenta a frequência absoluta de sobreviventes e não sobrevientes de forma que cada ponto é proporcional ao valor numérico de cada variável. Já o segundo gráfico apresenta uma visualização dos dados de maneira mais subjetiva. O que ambos os gráficos demonstram é que grande parte dos sobreviventes são pertencentes a primeira classe, enquanto a tripulação e a terceira classe, em sua maioria, não sobreviveram ao nafrágio do Titanic."
Atividade 15
paste("A partir da visualização dos dados, é notório a discrepância no númeo de sobreviventes por classe. Em sua maioria, tanto a tripulação quanto as pessoas pertencentes a terceira classe não sobreviveram ao nafrágio. Posto isto, em primeiro lugar, recomendaria uma revisão na escolha de alocação dos tripulantes do navio nos botes salva vidas. Além disto, também acho necessário a reavaliação da quantidade de botes disponíveis. Caso houvessem mais botes, todos as pessoas que estavam a bordo do Titanic teriam chances de sobreviver.")
## [1] "A partir da visualização dos dados, é notório a discrepância no númeo de sobreviventes por classe. Em sua maioria, tanto a tripulação quanto as pessoas pertencentes a terceira classe não sobreviveram ao nafrágio. Posto isto, em primeiro lugar, recomendaria uma revisão na escolha de alocação dos tripulantes do navio nos botes salva vidas. Além disto, também acho necessário a reavaliação da quantidade de botes disponíveis. Caso houvessem mais botes, todos as pessoas que estavam a bordo do Titanic teriam chances de sobreviver."