Vamos fazer uma publicação com tabelas em valores absolutos, tabelas de proporção, e gráficos de pizza ou de barras para as variáveis qualitativas nominais na base de dados chamada “Titanic.RData”.
load("/Users/eduar/Base_de_dados-master/TITANIC.RData")
summary(Titanic)
## Classe Idade Sexo Sobreviveu
## Tripula\xe7\xe3o:885 criança: 109 Feminino : 470 Não sobreviveu:1490
## Primeira :324 adulto :2091 Masculino:1730 Sobreviveu : 710
## Segunda :285
## Terceira :706
View(summary(Titanic))
class(Titanic$Classe)
## [1] "factor"
class(Titanic$Idade)
## [1] "factor"
class(Titanic$Sexo)
## [1] "factor"
class(Titanic$Sobreviveu)
## [1] "factor"
Titanic$Classe = gsub("Tripula\xe7\xe3o", "Tripulação", Titanic$Classe)
class(Titanic$Classe)
## [1] "character"
View(Titanic)
Problema resolvido
summary(Titanic)
## Classe Idade Sexo Sobreviveu
## Length:2200 criança: 109 Feminino : 470 Não sobreviveu:1490
## Class :character adulto :2091 Masculino:1730 Sobreviveu : 710
## Mode :character
View(summary(Titanic))
tabela_classe = table(Titanic$Classe)
tabela_classe
##
## Primeira Segunda Terceira Tripulação
## 324 285 706 885
View(tabela_classe)
tabela_idade = table(Titanic$Idade)
tabela_idade
##
## criança adulto
## 109 2091
View(tabela_idade)
tabela_sexo = table(Titanic$Sexo)
tabela_sexo
##
## Feminino Masculino
## 470 1730
View(tabela_sexo)
tabela_sobreviveu = table(Titanic$Sobreviveu)
tabela_sobreviveu
##
## Não sobreviveu Sobreviveu
## 1490 710
View(tabela_sobreviveu)
prop.table(tabela_classe)*100
##
## Primeira Segunda Terceira Tripulação
## 14.72727 12.95455 32.09091 40.22727
prop.table(tabela_idade)*100
##
## criança adulto
## 4.954545 95.045455
prop.table(tabela_sexo)*100
##
## Feminino Masculino
## 21.36364 78.63636
prop.table(tabela_sobreviveu)*100
##
## Não sobreviveu Sobreviveu
## 67.72727 32.27273
pie(tabela_classe, col = c("red", "purple", "green", "brown"))
pie(tabela_idade, col = c("yellow", "olivedrab4"))
pie(tabela_sexo, col = c("orange", "pink"))
pie(tabela_sobreviveu, col = c("violetred2", "turquoise2"))
Nessa atividade conseguimos realizar a importação da base de dados Titanic.RData, fizemos o resumo da base com a função summary, vimos que a classificação de 3 variáveis foi factor e 1 character, consertamos um erro na variável classe, construimos as tabelas com valores absolutos e com os valores de proporção e por fim construimos os gráficos de pizza.
Na tabelas junto de seus gráficos, foi possível analisar que na variável classe há 324 pessoas na primeira classe, 285 na segunda, 706 na terceira e 885 na tripulação; na variável idade percebemos que 109 são crianças e 2091 são adultos; na variável sexo, 470 são feminino e 1730 são masculino; na variável sobreviveu, percebemos que 1490 pessoas não sobreviveram e 710 sobreviveram.
Pelos gráficos de pizza, a maior concentração de pessoas está na parte da tripulação e a menor na primeira classe. A maior parte da população embarcada é de adultos. A maior parte da população é do sexo masculino. Houve mais casos de pessoas que não sobreviveram do que as que sobreviveram.