Atividade 02

Nessa atividade irei analisar a base de dados Titanic, através das variáveis de classe, idade, sexo e sobreviveram.

Iniciamos baixando a base de dados

#install.packages("usethis")

#usethis::use_course("https://github.com/DATAUNIRIO/Base_de_dados/archive/master.zip")

Carregando a base de dados

load("C:/Users/19801926775/Desktop/Base_de_dados-master/Titanic.RData")

Resumo da base de dados

summary(Titanic)
##   Classe                    Idade             Sexo               Sobreviveu  
##  Tripula\xe7\xe3o:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira        :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda         :285                                                        
##  Terceira        :706

Classificando as variáveis qualitativas

class(Titanic$Classe) 
## [1] "factor"
class(Titanic$Idade)
## [1] "factor"
class(Titanic$Sexo) 
## [1] "factor"
class(Titanic$Sobreviveu)
## [1] "factor"

Consertando a variável de classe tripulação

Titanic$Classe = iconv(Titanic$Classe, "latin1","UTF-8")
tail(Titanic)
##          Classe  Idade     Sexo     Sobreviveu
## 2195 Tripulação adulto Feminino     Sobreviveu
## 2196 Tripulação adulto Feminino     Sobreviveu
## 2197 Tripulação adulto Feminino     Sobreviveu
## 2198 Tripulação adulto Feminino Não sobreviveu
## 2199 Tripulação adulto Feminino Não sobreviveu
## 2200 Tripulação adulto Feminino Não sobreviveu

Finalmente, chegamos nas tabelas de valores absolutos. São elas:

tabela_classe = table(Titanic$Classe)
View(tabela_classe)

tabela_idade = table(Titanic$Idade)
View(tabela_idade)

tabela_sexo = table(Titanic$Sexo)
View(tabela_sexo)

tabela_sobreviveu = table(Titanic$Sobreviveu)
View(tabela_sobreviveu)

Em valores absolutos, temos que:

Na tabela de classe, 324 eram da primeira classe; 285 eram da segunda; 706 eram da terceira; e os 885 restantes pertenciam a tripulação, mostrando assim que no Titanic predominavam passageiros pertencentes da tripulação.

Já na tabela de idade, existiam 109 crianças, enquanto o número de adultos era de 2091. Portanto, verifica-se que o número de adultos no Titanic era muito superior ao número de crianças.

A tabela de sexo nos mostrou que a predominância era do gênero masculino, com 1730 passageiros, enquanto do gênero feminino tinham 470.

Por fim, a tabela de sobreviventes indica que ocorreram muito mais mortes do que sobrevivências. 1490 não sobreviveram enquanto apenas 710 sobreviveram.

Agora, vamos as tabelas de proporções

prop.table(tabela_classe)*100
## 
##   Primeira    Segunda   Terceira Tripulação 
##   14.72727   12.95455   32.09091   40.22727
prop.table(tabela_idade)*100
## 
##   criança    adulto 
##  4.954545 95.045455
prop.table(tabela_sexo)*100
## 
##  Feminino Masculino 
##  21.36364  78.63636
prop.table(tabela_sobreviveu)*100
## 
## Não sobreviveu     Sobreviveu 
##       67.72727       32.27273

Analisando essas tabelas, infere-se que:

A proporção de adultos no Titanic era muito maior, chegando a 95,04% contra 4,95% das crianças.

Em relação ao sexo, a quantidade de homens era superior, 78,63%, contra 21,36% de passageiras femininas.

O número de não sobreviventes também é maior do que o de sobreviventes. Apenas 32,27% saíram do navio com vida, enquanto 67,72% não sobreviveram ao naufrágio.

Para encerrar a análise referente as tabelas de proporção, temos uma incidência maior de passageiros na terceira classe e na tripulação, 32,09% e 40,22%, respectivamente; enquanto na primeira e na segunda classe apenas 14,72% e 12,95%, respectivamente.

Gráficos de pizza

pie(tabela_classe, col = c("darksalmon","chocolate1","gold2","grey84"))

pie(tabela_idade, col = c("ivory4","seagreen3"))

pie(tabela_sexo, col = c("salmon4","tomato3"))

pie(tabela_sobreviveu, col = c("lightskyblue1","snow4"))

Conclusão

Foi um grande desafio realizar esse trabalho, mas no fim eu gostei bastante de analisar mais sobre o naufrágio do Titanic, seguindo dados e variáveis reais.