Carregando a Base de Dados Titanic.
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/Titanic.RData")
View(Titanic)
Carregando pacotes.
library(dplyr)
library(ggplot2)
Conheca seus dados e responda a essas perguntas:
2) Quantas pessoas sobreviveram ao Titanic?
Qtd_Sobreviventes<-table(Titanic$Sobreviveu, exclude = "Não sobreviveu")
Qtd_Sobreviventes
##
## Sobreviveu
## 710
3) Qual é a proporção de pessoas que sobreviveram ao Titanic?
Titanic %>%
pull(Sobreviveu) %>%
table () %>%
prop.table()
## .
## Não sobreviveu Sobreviveu
## 0.6772727 0.3227273
4) Quantas mulheres sobreviveram?
Mulheres_Sobreviventes<-table(Titanic$Sobreviveu,Titanic$Sexo, exclude = c("Masculino","Não sobreviveu"))
Mulheres_Sobreviventes
##
## Feminino
## Sobreviveu 344
5 Quantas crianças sobreviveram?
Criancas_Sobreviventes<-table(Titanic$Sobreviveu,Titanic$Idade, exclude = c("Não sobreviveu","adulto"))
Criancas_Sobreviventes
##
## criança
## Sobreviveu 57
6 Quantas pessoas da terceira classe sobreviveram?
Terc_Sobreviventes<-table(Titanic$Sobreviveu,Titanic$Classe, exclude = c("Tripulação","Primeira","Segunda","Não sobreviveu"))
Terc_Sobreviventes
##
## Terceira
## Sobreviveu 178
7 Qual o percentual de mulheres que sobreviveu? R:73,19%
Perc_mulher<-table(Titanic$Sobreviveu, Titanic$Sexo, exclude = "Masculino")
round(prop.table(Perc_mulher)*100,2)
##
## Feminino
## Não sobreviveu 26.81
## Sobreviveu 73.19
8) Qual o percentual de crianças que sobreviveu? R:52,29%
Perc_criança<-table(Titanic$Sobreviveu, Titanic$Idade, exclude = "adulto")
round(prop.table(Perc_criança)*100,2)
##
## criança
## Não sobreviveu 47.71
## Sobreviveu 52.29
9) Qual o percentual da terceira classe que sobreviveu? R:25,21%
Perc_terc<-table(Titanic$Sobreviveu,Titanic$Classe,exclude = c("Tripulação","Primeira","Segunda"))
round(prop.table(Perc_terc)*100,2)
##
## Terceira
## Não sobreviveu 74.79
## Sobreviveu 25.21
10) Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê? Em todos ate aqui podemos usar o grafico de barras, porque permite uma boa visualizacao em variaveis quantitativas e com o uso dos percentuais.
11) Você poderia construir um gráfico para a variável “sobreviveu”?
Sobreviventes<-table(Titanic$Sobreviveu)
Sobreviventes
##
## Não sobreviveu Sobreviveu
## 1490 710
barplot(Sobreviventes, main = "Sobreviventes", sub = "Sobreviveram 710/2200", beside = TRUE, ylim = c(0,1500), col=c("orange","red"))

12) Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?
Sobreviventes_Sexo<-table(Titanic$Sobreviveu,Titanic$Sexo,exclude="Não sobreviveu")
Sobreviventes_Sexo
##
## Feminino Masculino
## Sobreviveu 344 366
barplot(Sobreviventes_Sexo, main ="Sobreviventes por Sexo",beside = TRUE, col = c("pink","blue"),ylim=c(0,400))

13) Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?
ggplot(subset(Titanic,Sobreviveu=="Sobreviveu")) +
aes(x = Classe) +
geom_bar(aes(fill=Classe)) +
facet_wrap(vars(Sobreviveu)) +
labs(x="Classes", y="Quantidade", title="Sobreviventes por Classe")

14) Você consegue interpretar esses dois gráficos? o que eles estão dizendo?
Sim. No gráfico “ballonplot”, os tons de azul e o tamanho dos circulos estao indicando a quantidade de pessoas, quanto mais claro e maior o circulo, maior é a quantidade.
As classes que mais morreram foram a “Tripulacao” seguida da “Terceira Classe”.
No gráfico “mosaicplot”, é possivel notar que a “Tripulaçao” teve maior perda de vidas seguida da “Terceira Classe”. Quanto aos sobreviventes esse tipo de grafico gera duvidas pelo tamanho e largura das barras.