load("C:/Users/alons/Base_de_dados-master/Titanic.RData")
Aula 2 de R
Primeiro passo: carregar a base dados
#Passo 2 - Olhar a base de dados
str(Titanic)
'data.frame': 2200 obs. of 4 variables:
$ Classe : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
$ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
$ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
$ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic$Classe)
[1] Primeira Primeira Primeira Primeira Primeira Primeira
Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
tail(Titanic$Classe)
[1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
[5] Tripula\xe7\xe3o Tripula\xe7\xe3o
Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
# Tripulação está escrito de forma errada
#Passo 3 - Corrigir o problema
$Classe = iconv(Titanic$Classe, "latin1", "UTF-8") Titanic
#Passo 4 - Verificar se o problema foi corrigido
str(Titanic)
'data.frame': 2200 obs. of 4 variables:
$ Classe : chr "Primeira" "Primeira" "Primeira" "Primeira" ...
$ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
$ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
$ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
tail(Titanic)
Classe Idade Sexo Sobreviveu
2195 Tripulação adulto Feminino Sobreviveu
2196 Tripulação adulto Feminino Sobreviveu
2197 Tripulação adulto Feminino Sobreviveu
2198 Tripulação adulto Feminino Não sobreviveu
2199 Tripulação adulto Feminino Não sobreviveu
2200 Tripulação adulto Feminino Não sobreviveu
View(Titanic)
# problema resolvido!
# Questões de pesquisa
#Quantas pessoas sobreviveram?
#Quantas pessoas da primeira classe?
#Qual apporporção de mulheres no Titanic?
# Variáveis de interesse
# Sobreviveu, classes e sexo
#Passo 5 - Tabela de frequência
= table(Titanic$Sobreviveu)
tabela_sobrevivencia tabela_sobrevivencia
Não sobreviveu Sobreviveu
1490 710
= table(Titanic$Classe)
tabela_clsse tabela_clsse
Primeira Segunda Terceira Tripulação
324 285 706 885
= table(Titanic$Sexo)
tabela_sexo tabela_sexo
Feminino Masculino
470 1730
#Passo 6 - Proporções
prop.table(tabela_sobrevivencia)*100
Não sobreviveu Sobreviveu
67.72727 32.27273
round(prop.table(tabela_sobrevivencia)*100,2)
Não sobreviveu Sobreviveu
67.73 32.27
round(prop.table(tabela_clsse)*100,2)
Primeira Segunda Terceira Tripulação
14.73 12.95 32.09 40.23
round(prop.table(tabela_sexo)*100,2)
Feminino Masculino
21.36 78.64
#Passo 7 - Gráfico de pizza
pie(tabela_sobrevivencia)
pie(tabela_sobrevivencia, main = "Gráfico 1 - sobrevivência do Titanic")
pie(tabela_sobrevivencia, col = c("aquamarine2","pink"),
main = "Gráfico 1 - sobrevivência do Titanic com as cores da Mangueira")
#colors()
pie(tabela_clsse, main = "Gráfico 2 - clsse do titanic")
pie(tabela_clsse, col = c("purple","paleturquoise1","palegreen","lightyellow2"),
main = "Gráfico 2 - clsse do Titanic com as cores da Mangueira")
#colors()
pie(tabela_sexo,main = "Gráfico 3 - sexo do titanic")
pie(tabela_sexo, col = c("#183bba","blanchedalmond"),
main = "Gráfico 3 - sexo do Titanic com as cores da Mangueira")
# obs: usar o seletor de cores do google(mais cores)
#Passo 8 - Gráfico de barras para variáveis ordinais
barplot(tabela_clsse, main = "Gráfico 2 - clsse do titanic")
barplot(tabela_clsse, col = c("purple","paleturquoise1","palegreen","lightyellow2"),
main = "Gráfico 2 - clsse do Titanic")
#Passo 9 - Novo gráfico
prop.table(tabela_sexo)
Feminino Masculino
0.2136364 0.7863636
library(waffle)
Carregando pacotes exigidos: ggplot2
?waffle
inicializando servidor httpd de ajuda ...
concluído
<- c(Feminino=21, Masculino=79)
Fatias waffle(Fatias)
waffle(Fatias,colors = c("mediumaquamarine","khaki"))
#Passo 10 - Tabelas
library(flextable)
tabela_clsse
Primeira Segunda Terceira Tripulação
324 285 706 885
class(tabela_clsse)
[1] "table"
= data.frame(tabela_clsse)
tabela_classe2 class(tabela_classe2)
[1] "data.frame"
library(reactable)
reactable(tabela_classe2)
Conclusão
1- Importante identificar o tipo de variável para fazer as estatísticas
2- Gráficos de pizza são feitos com o comando pie( )
3- Gráficos de barras são feitos com o comando barplot()
4- O R é demais!