Nesta atividade foi proposto o seguinte: escolhermos duas variáveis categóricas e delas fazer um gráfico de barras,uma tabela de contingência e uma tabela de proporções na base de dados definida Titanic.Rdata
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Titanic.RData")
Nessa etapa eu usei as funções Summary e STR, para entender e visualizar as minhas variáveis.
summary(Titanic)
## Classe Idade Sexo Sobreviveu
## Tripulação:885 criança: 109 Feminino : 470 Não sobreviveu:1490
## Primeira :324 adulto :2091 Masculino:1730 Sobreviveu : 710
## Segunda :285
## Terceira :706
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
Nessa etapa eu elaborei a minha tese de análise. Que compreendia identificar se os passageiros que mais sobreviveram foram as pessoas da Primeira Classe.
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.5
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Tese 01, Sobreviveram mais pessoas da Primeira Classe
tabela1 <- Titanic %>% select(Classe, Sobreviveu) %>% table()
#Montando a Tabela
round(prop.table(tabela1,2)*100)
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 45 30
## Primeira 8 28
## Segunda 11 17
## Terceira 35 25
barplot(tabela1,beside= TRUE,
col=c("Navy", "blue","Skyblue","lightblue"),
main= "Análise Tese 01",
horiz = TRUE,
legend = TRUE,
xlim= c(0,800))
O primeiro objetivo da análise foi identificar uma possível correlação entre a classe e a taxa de sobrevivência. Ao plotar o gráfico é possível visualizar que as classes com maiores faixas de sobreviventes são: Tripulação e Primeira classe. Curiosamente a classe com menos sobrevivente foi a segunda, que também possuía menos tripulantes a bordo, dentre todas as classes. Sendo a Tripulação a classe com maiores números, devido a demanda de atender aos tripulantes, era um fator lógico que possivelmente eles estariam entre os maiores números de sobreviventes. Contudo forcando nas classes de passageiros, com destaque a primeira classe, com 324 passageiros ao todo, é interessante perceber que ela deve a maior porcentagem de sobrevivência. Seguido da terceira classe que tinha 706 passageiros e um percentual de salvamento de 25%. Considerando a estrutura do navio privilegiar no salvamento a primeira e segunda classe é curioso perceber que a segunda classe foi a que teve o menor percentual de sobreviventes, ainda que essa fosse a que possuía o menor número dentre as outras três.