Introdução

Vamos fazer uma publicação com tabelas em valores absolutos, tabelas de proporção, e gráficos de pizza ou de barras para as variáveis qualitativas nominais na base de dados chamada “Titanic.RData”.

Carregando o banco de dados do RData

load("/Users/eduar/Base_de_dados-master/TITANIC.RData")

Resumo da base de dados Titanic

summary(Titanic)
##   Classe                    Idade             Sexo               Sobreviveu  
##  Tripula\xe7\xe3o:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira        :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda         :285                                                        
##  Terceira        :706
View(summary(Titanic))

Classificando as variáveis qualitativas

class(Titanic$Classe) 
## [1] "factor"
class(Titanic$Idade) 
## [1] "factor"
class(Titanic$Sexo) 
## [1] "factor"
class(Titanic$Sobreviveu) 
## [1] "factor"

Consertando a variável classe “tripulação” utilizando o gsub

Titanic$Classe = gsub("Tripula\xe7\xe3o", "Tripulação", Titanic$Classe)
class(Titanic$Classe)
## [1] "character"
View(Titanic) 

Problema resolvido

Refazendo o resumo da base Titanic.RData

summary(Titanic)
##     Classe              Idade             Sexo               Sobreviveu  
##  Length:2200        criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Class :character   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Mode  :character
View(summary(Titanic))

Tabelas de valores absolutos das variáveis classe, idade, sexo e sobreviveu

tabela_classe = table(Titanic$Classe)
tabela_classe
## 
##   Primeira    Segunda   Terceira Tripulação 
##        324        285        706        885
View(tabela_classe)
tabela_idade = table(Titanic$Idade)
tabela_idade
## 
## criança  adulto 
##     109    2091
View(tabela_idade)
tabela_sexo = table(Titanic$Sexo)
tabela_sexo
## 
##  Feminino Masculino 
##       470      1730
View(tabela_sexo)
tabela_sobreviveu = table(Titanic$Sobreviveu)
tabela_sobreviveu
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
View(tabela_sobreviveu)

Construindo as tabelas com proporções das variáveis

prop.table(tabela_classe)*100
## 
##   Primeira    Segunda   Terceira Tripulação 
##   14.72727   12.95455   32.09091   40.22727
prop.table(tabela_idade)*100
## 
##   criança    adulto 
##  4.954545 95.045455
prop.table(tabela_sexo)*100
## 
##  Feminino Masculino 
##  21.36364  78.63636
prop.table(tabela_sobreviveu)*100
## 
## Não sobreviveu     Sobreviveu 
##       67.72727       32.27273

Construindo os gráficos de pizza das variáveis

pie(tabela_classe, col = c("red", "purple", "green", "brown"))

pie(tabela_idade, col = c("yellow", "olivedrab4"))

pie(tabela_sexo, col = c("orange", "pink"))

pie(tabela_sobreviveu, col = c("violetred2", "turquoise2"))

Conclusão

Nessa atividade conseguimos realizar a importação da base de dados Titanic.RData, fizemos o resumo da base com a função summary, vimos que a classificação de 3 variáveis foi factor e 1 character, consertamos um erro na variável classe, construimos as tabelas com valores absolutos e com os valores de proporção e por fim construimos os gráficos de pizza.

Na tabelas junto de seus gráficos, foi possível analisar que na variável classe há 324 pessoas na primeira classe, 285 na segunda, 706 na terceira e 885 na tripulação; na variável idade percebemos que 109 são crianças e 2091 são adultos; na variável sexo, 470 são feminino e 1730 são masculino; na variável sobreviveu, percebemos que 1490 pessoas não sobreviveram e 710 sobreviveram.

Pelos gráficos de pizza, a maior concentração de pessoas está na parte da tripulação e a menor na primeira classe. A maior parte da população embarcada é de adultos. A maior parte da população é do sexo masculino. Houve mais casos de pessoas que não sobreviveram do que as que sobreviveram.