1) Média, variânica e desvio padrão

Aqui vou importar a base de dados, carregar as bibliotecas, fazer média, variância e desvio padrão do minutos de tela dos personagens de Game of Thrones. Primeiro eu fiz a média arredondada e logo em seguida o desvio padrão que são respectivamente 27.26 e 46.03 minutos. Por último fiz o resumo que mostra o mínimo, primeiro quartil, mediana, média, terceiro quartil e o máximo.

# Passo 1 - importação base de dados
load("C:/Users/luuan/Desktop/UNIRIO/estatistica/Base_de_dados-master/Game of Thrones.RData")

# Passo 2 - carregar bibliotecas
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

# Passo 3 - Média e Desvio Padrão
media_1 <- round(mean(tempo_de_tela$minutos),2)
media_1
## [1] 27.26
desvio_1 <- round(sd(tempo_de_tela$minutos),2)
desvio_1
## [1] 46.03
summary(tempo_de_tela$minutos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.150   4.375  10.300  27.261  27.650 293.300

2) Bloxplot

O Bloxplot permite que a gente tenha outra visão dessas informações com mais clareza. A linha destacada é a mediana que fica ali em 10 minutos, podemos observar que a mediana é muito menor em relação a média e que possui oito ouliers, representados pelas bolinhas no boxplot.

# Passo 4 - Boxplot 
boxplot(tempo_de_tela$episodios,col = c("royalblue"),main = "Boxplot do numero de episódios dos personagens")

3) Tabelas de duas variáveis qualitativas e de proporção

As duas variáveis qualitativas que eu escolhi analisar são sexo e nobreza, relacionando o numero de não nobres no sexo masculino e feminino. Primeiramente eu tive que fazer um tratamento na variável de nobreza usando o ifelse para atribuir os nomes no lugar dos números 1 e 0. Logo depois ja fiz a tabela e conseguir analisar que há muito mais homens pobres(não nobres) do que mulheres, sendo 760 homens não nobres e somente 157 mulheres não nobres.

# Passo 5 - Tratamento
personagens_livro$nobre <- ifelse(personagens_livro$nobre==1,'Nobre','Não Nobre')


# Passo 6 - Tabela e proporção de duas variáveis qualitativas
tabela_1 <- table(personagens_livro$sexo,personagens_livro$nobre)
tabela_1
##            
##             Não Nobre Nobre
##   femenino         73    84
##   masculino       414   346
tabela_1 %>% data.frame() %>% flextable() %>% theme_tron()
prop_1 <- prop.table(tabela_1,2)*100 
prop_1
##            
##             Não Nobre    Nobre
##   femenino   14.98973 19.53488
##   masculino  85.01027 80.46512
prop_1 %>% data.frame() %>% flextable() %>% theme_vader() 

4) Gráfico de barras duas variáveis qualitativas

Com o gráfico de barras conseguimos visualizar melhor a análise feita na tabela sobre o sexo relacionado a nobreza, vendo claramente que a barra do masculino é bem maior que a barra das mulheres.

# Passo 7 - Gráfico de barras
graf_barras <- barplot(tabela_1,legend=TRUE,beside=TRUE,
                       main = "Grafico número de pobres por sexo", col=c("purple","brown"))

graf_barras
##      [,1] [,2]
## [1,]  1.5  4.5
## [2,]  2.5  5.5

Podemos concluir que provavelmente existe um número maior de homens do que mulheres nesse contexto, tendo em vista que o número de homens não nobres é bem maior que o de mulheres, porém o número de nobres também é superior o masculino.