Vamos carregar base de dados Pokemon e Titanic, construir tabelas e gráficos a partir de suas variáveis qualitativas
Carregar as bases de dados Pokémon e Titanic > df_Pokemon > Titanic
load("C:/Estatistica/Base_de_dados-master/Titanic.RData")
load("C:/Estatistica/Base_de_dados-master/df_pokemon.RData")
Aqui vamos atribuir valores para as 4 variáveis qualitativas a serem analisadas
#Passo Um - Construir as tabelas
poke_type1<-table(df$type_1)
poke_type2<-table(df$type_2)
tnic1<-table(Titanic$Sexo)
tnic2<-table(Titanic$Sobreviveu)
Aqui será atribuído um valor para a variável “pokecolor”, cruzando os dados de cores presentes da base da dados com os dados dos tipos de Pokémons, a fim de padronizar as cores no gráfico para cada tipo respectivo existente no banco de dados.
pokecolor<-unique(df$color_1)
Serão mostradas as variáveis do tipo Primário e Secundário dos Pokemons, primeiramente atráves de um gráfico de pizza e posteriormente em um gráfico de barras.
pie(poke_type1,
main = "Distruição de Pokemons por tipo Primário",
col = pokecolor,
radius = c(1.0))
a = barplot(poke_type1,
main = "Distruição de Pokemons por tipo Primário",
ylim = c(0,120),
space = c(0.4),
las = 2,
col = pokecolor)
text(a,poke_type1 + 6, labels = poke_type1)
pie(poke_type2,
main = "Distribuição dos Pokémons por tipo Secundário",
col = pokecolor,
radius = c(1.0))
a = barplot(poke_type2,
main = "Distribuição dos Pokémons por tipo Secundário",
ylim = c(0,120),
space = c(0.4),
las = 2,
col = pokecolor)
text(a,poke_type2 + 6, labels = poke_type2)
Desta vez usaremos a Tabela Titanic para representar 2 variáveis, primeiramente atráves do gráfico de pizza e posteriormente através do gráfico de barras.
##Gráfico de barras da tabela Titanic
pie(tnic1,
main = "Sexo dos passageiros do Titanic",
col = c("222", "555"),
radius = c(1.0))
barplot(tnic1,
main = "Sexo dos passageiros do Titanic",
col = c("222", "555"),
ylim = c(0,2000),
cex.names = c("0.8"))
pie(tnic2,
tnic2,
main = "Sobreviventes dos passageiros do Titanic",
col = c("#FA0306", "#07B7F2"),
radius = c(1.0))
barplot(tnic2,
main = "Sobreviventes dos passageiros do Titanic",
col = c("#FA0306", "#07B7F2"),
ylim = c(0,2000),
cex.names = c("0.8"))
Foram apresentadas 4 variáveis qualitativas de 2 diferentes base de dados, primeiramente através do gráfico de pizza e posteriormente através do gráfico de barras. Conseguimos observar que na primeira amostragem, em casos de similaridade de fatias e/ou com um número elevado delas, a compreensão do gráfico fica prejudicada, sendo muito mais clara a utilização do segundo tipo de gráfico. Apesar da clara compreensão do gráfico de pizza em casos como o item 2, são várias as lacunas deixadas por ele, sendo assim, visando conservar a confiabilidade das informações, o gráfico de barras é a melhor escolha para a representação dessas variáveis.