Nesta atividade foi proposto o seguinte: escolhermos duas variáveis categóricas e delas fazer um gráfico de barras,uma tabela de contingência e uma tabela de proporções na base de dados definida Titanic.Rdata

1º Passo) Carregando dados:

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Titanic.RData")

2º Passo) Arrumando a casa:

Nessa etapa eu usei as funções Summary e STR, para entender e visualizar as minhas variáveis.

summary(Titanic)
##         Classe        Idade             Sexo               Sobreviveu  
##  Tripulação:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira  :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda   :285                                                        
##  Terceira  :706
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

3º Passo) Inicando a análise:

Nessa etapa eu elaborei a minha tese de análise. Que compreendia identificar se os passageiros que mais sobreviveram foram as pessoas da Primeira Classe.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.5
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Tese 01, Sobreviveram mais pessoas da Primeira Classe
tabela1 <- Titanic %>% select(Classe, Sobreviveu) %>% table()

#Montando a Tabela
round(prop.table(tabela1,2)*100)
##             Sobreviveu
## Classe       Não sobreviveu Sobreviveu
##   Tripulação             45         30
##   Primeira                8         28
##   Segunda                11         17
##   Terceira               35         25
barplot(tabela1,beside= TRUE,
        col=c("Navy", "blue","Skyblue","lightblue"),
        main= "Análise Tese 01",
        horiz = TRUE,
        legend = TRUE,
        xlim= c(0,800))

O primeiro objetivo da análise foi identificar uma possível correlação entre a classe e a taxa de sobrevivência. Ao plotar o gráfico é possível visualizar que as classes com maiores faixas de sobreviventes são: Tripulação e Primeira classe. Curiosamente a classe com menos sobrevivente foi a segunda, que também possuía menos tripulantes a bordo, dentre todas as classes. Sendo a Tripulação a classe com maiores números, devido a demanda de atender aos tripulantes, era um fator lógico que possivelmente eles estariam entre os maiores números de sobreviventes. Contudo forcando nas classes de passageiros, com destaque a primeira classe, com 324 passageiros ao todo, é interessante perceber que ela deve a maior porcentagem de sobrevivência. Seguido da terceira classe que tinha 706 passageiros e um percentual de salvamento de 25%. Considerando a estrutura do navio privilegiar no salvamento a primeira e segunda classe é curioso perceber que a segunda classe foi a que teve o menor percentual de sobreviventes, ainda que essa fosse a que possuía o menor número dentre as outras três.