Logo de inicio transportei a base de dados, carreguei a biblioteca e calculei a média, desvio padrão e a variância. Foi possivel identificar a mediana seria 299, supostamente um dos momentos de ápice da série,onde morreu um grande numero de personagens. Logo apos há as análises onde contém a mediana e os quartis,a variância,e o desvio-padrão.
# Passo 1 Transportar a base de dados
load("C:/Users/manuc/Desktop/Base_de_dados-master/Game of Thrones.RData")
# Passo 2 - carregar bibliotecas
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
# Passo 3 - Média e variancia
summary(personagens_livro$ano_morte)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 297.0 299.0 299.0 299.2 300.0 300.0 612
variância <- var(personagens_livro$ano_morte,na.rm = TRUE)
variância
## [1] 0.4948878
sd(personagens_livro$ano_morte,na.rm = TRUE)
## [1] 0.7034826
Para analisar de uma forma melhor, fiz o boxplot. Assim fica claro que a mediana ocorreu no ano de 297, dado que a median é onde a maior parte dos personagens morreram, dando continuidade a analise é possivel identificar um outlier que é aonde a média se distanciou,provavelmente foi aonde morreu pouquissimas pessoas.
# Boxplot
boxplot(personagens_livro$ano_morte,col = c("pink"),main = "Boxplot de quantos personagens morreram por ano")
As variáveis escolhidas foram sexo e nobreza. Observando a tabela identifiquei o resultado de 760 homens pobres, já as mulheres foram 157 pobres. Devemos considerar tambem a relação de numero de homens analisados para o de mulheres.
# Passo 5 - Tratamento
personagens_livro$nobre <- ifelse(personagens_livro$nobre==1,'Nobre','Não Nobre')
# Passo 6 - Tabela e proporção de duas variáveis qualitativas
tabela_1 <- table(personagens_livro$sexo,personagens_livro$nobre)
tabela_1
##
## Não Nobre Nobre
## femenino 73 84
## masculino 414 346
tabela_1 %>% data.frame() %>% flextable() %>% theme_tron()
Var1 | Var2 | Freq |
femenino | Não Nobre | 73 |
masculino | Não Nobre | 414 |
femenino | Nobre | 84 |
masculino | Nobre | 346 |
prop_1 <- prop.table(tabela_1,2)*100
prop_1
##
## Não Nobre Nobre
## femenino 14.98973 19.53488
## masculino 85.01027 80.46512
prop_1 %>% data.frame() %>% flextable() %>% theme_vader()
Var1 | Var2 | Freq |
femenino | Não Nobre | 14.98973 |
masculino | Não Nobre | 85.01027 |
femenino | Nobre | 19.53488 |
masculino | Nobre | 80.46512 |
# Gráfico de barras
Foi possivel identificar melhor as analises feita na tabela atraves do gráfico de barras. Aqui fica bem visivel que o sexo masculino possui um nivel de pobreza maior, além disso o sexo masculino também contem o maior número em questão de riqueza.
```r
# Passo 7 - Gráfico de barras
graf_barras <- barplot(tabela_1,legend=TRUE,beside=TRUE,
main = "Grafico número de pobres por sexo", col=c("blue","green"))
graf_barras
## [,1] [,2]
## [1,] 1.5 4.5
## [2,] 2.5 5.5