Aqui vou importar a base de dados, carregar as bibliotecas, fazer média, variância e desvio padrão do minutos de tela dos personagens de Game of Thrones. Primeiro eu fiz a média arredondada e logo em seguida o desvio padrão que são respectivamente 27.26 e 46.03 minutos. Por último fiz o resumo que mostra o mínimo, primeiro quartil, mediana, média, terceiro quartil e o máximo.
# Passo 1 - importação base de dados
load("C:/Users/luuan/Desktop/UNIRIO/estatistica/Base_de_dados-master/Game of Thrones.RData")
# Passo 2 - carregar bibliotecas
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
# Passo 3 - Média e Desvio Padrão
media_1 <- round(mean(tempo_de_tela$minutos),2)
media_1## [1] 27.26
desvio_1 <- round(sd(tempo_de_tela$minutos),2)
desvio_1## [1] 46.03
summary(tempo_de_tela$minutos)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.150 4.375 10.300 27.261 27.650 293.300
O Bloxplot permite que a gente tenha outra visão dessas informações com mais clareza. A linha destacada é a mediana que fica ali em 10 minutos, podemos observar que a mediana é muito menor em relação a média e que possui oito ouliers, representados pelas bolinhas no boxplot.
# Passo 4 - Boxplot
boxplot(tempo_de_tela$episodios,col = c("royalblue"),main = "Boxplot do numero de episódios dos personagens")As duas variáveis qualitativas que eu escolhi analisar são sexo e nobreza, relacionando o numero de não nobres no sexo masculino e feminino. Primeiramente eu tive que fazer um tratamento na variável de nobreza usando o ifelse para atribuir os nomes no lugar dos números 1 e 0. Logo depois ja fiz a tabela e conseguir analisar que há muito mais homens pobres(não nobres) do que mulheres, sendo 760 homens não nobres e somente 157 mulheres não nobres.
# Passo 5 - Tratamento
personagens_livro$nobre <- ifelse(personagens_livro$nobre==1,'Nobre','Não Nobre')
# Passo 6 - Tabela e proporção de duas variáveis qualitativas
tabela_1 <- table(personagens_livro$sexo,personagens_livro$nobre)
tabela_1##
## Não Nobre Nobre
## femenino 73 84
## masculino 414 346
tabela_1 %>% data.frame() %>% flextable() %>% theme_tron()Var1 | Var2 | Freq |
femenino | Não Nobre | 73 |
masculino | Não Nobre | 414 |
femenino | Nobre | 84 |
masculino | Nobre | 346 |
prop_1 <- prop.table(tabela_1,2)*100
prop_1##
## Não Nobre Nobre
## femenino 14.98973 19.53488
## masculino 85.01027 80.46512
prop_1 %>% data.frame() %>% flextable() %>% theme_vader() Var1 | Var2 | Freq |
femenino | Não Nobre | 14.98973 |
masculino | Não Nobre | 85.01027 |
femenino | Nobre | 19.53488 |
masculino | Nobre | 80.46512 |
Com o gráfico de barras conseguimos visualizar melhor a análise feita na tabela sobre o sexo relacionado a nobreza, vendo claramente que a barra do masculino é bem maior que a barra das mulheres.
# Passo 7 - Gráfico de barras
graf_barras <- barplot(tabela_1,legend=TRUE,beside=TRUE,
main = "Grafico número de pobres por sexo", col=c("purple","brown"))graf_barras## [,1] [,2]
## [1,] 1.5 4.5
## [2,] 2.5 5.5
Podemos concluir que provavelmente existe um número maior de homens do que mulheres nesse contexto, tendo em vista que o número de homens não nobres é bem maior que o de mulheres, porém o número de nobres também é superior o masculino.