Este post apresenta os resultados da atividade 5 e 6 da disciplina Estatística aplicada à Ciências Humanas em que foram utilizados os recursos para:
carregar uma BD no formato R;
efetuar um resumo estatístico de uma variável quantitativa da BD;
efetuar os cálculos da variância e do desvio padrão;
elaborar um gráfico do tipo boxplot;
criar e formatar tabelas em números absolutos e relativos; e
criar gráfico de barras com duas variáveis qualitativas.
Para essa primeira parte da Atividade, a BD carregada e utilizada na atividade foi a seguinte:
#---------
#Passo 1 - Carregamento de BD
#---------
load("D:/Curso Adm Publica/Semestre 8/Estatistica/Base_de_dados-master/Game of Thrones.RData")
head(tempo_de_tela) nome minutos episodios
1 Tyrion Lannister 293.30 54
2 Jon Nieve 268.15 49
3 Daenerys Targaryen 221.30 49
4 Cersei Lannister 201.45 52
5 Sansa Stark 199.30 47
6 Arya Stark 189.15 47
Foi efetuado um resumo estatístico do conjunto de dados da variável minutos, que é o tempo, em minutos, que cada personagem esteve em tela, da BD selecianada. Além disso, foram calculados a média, a variância e o desvio padrão. O resultado obtido foi o seguinte:
#---------
#Passo 2 - Resumo estatístico - média, mediana, 1 e 3 quartis
# Desvio padrão e variância
#---------
summary(tempo_de_tela$minutos) Min. 1st Qu. Median Mean 3rd Qu. Max.
1.150 4.375 10.300 27.261 27.650 293.300
media_tempo_tela <- mean(tempo_de_tela$minutos)
desvio_padrao_tempo_tela <- sd(tempo_de_tela$minutos)
variancia_tempo_tela <- var(tempo_de_tela$minutos)
desvio_padrao_tempo_tela[1] 46.03292
variancia_tempo_tela[1] 2119.029
Foi criado um boxplot utilizando-se a variável quantitativa minutos (tempo, em minutos, que cada personagem esteve em tela) da BD selecionada, conforme apresentado no gráfico a seguir.
#---------
#Passo 3 - Criação de Boxplot
#---------
boxplot(tempo_de_tela$minutos,col = "skyblue",
main="Gráfico 1 - boxplot do tempo de tela para cada personagem")De acordo com os valores apresentados, a média de minutos em tela, do cojunto de personagens da série, foi de 27,261 minutos, com um desvio padrão de 46,033 minutos. Esse desvio padrão, com relação ao valor da média, reflete uma alta variabilidade dos minutos em tela, considerando todo o conjunto de dados, ou seja, todos os personagens da série.
No boxplot originado, é observada uma grande quantidade de outliers, o que corrobora com a alta variabilidade verificada a partir do desvio padrão. Como todos os valores são utilizados para o cálculo da média e do desvio padrão, e sendo muitos deles outliers, era de se esperar essa alta variabilidade.
Verifica-se, ainda, que o boxplot apresenta uma assimetria e, excluindo-se os outliers, há uma baixa dispersão nos dados da variável analisada.
Para essa segunda parte da Atividade, a BD carregada e utilizada na atividade foi a seguinte:
#---------
#Passo 1 - Carregamento de BD
#---------
head(personagens_livro) nome lealdade sexo nobre Guerra_dos_Tronos
1 Addam Marbrand Lannister masculino 1 1
2 Aegon Frey (Jinglebell) Ninguna masculino 1 0
3 Aegon Targaryen Targaryen masculino 1 0
4 Adrack Humble Greyjoy masculino 1 0
5 Aemon Costayne Lannister masculino 1 0
6 Aemon Estermont Baratheon masculino 1 0
Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos Danca_dos_Dragoes
1 1 1 1 0
2 0 1 0 0
3 0 0 0 1
4 0 0 0 1
5 0 1 0 0
6 1 1 0 0
capitulo_apresentacao ano_morte livro inteiro da morte capitulo_morte
1 56 NA NA NA
2 49 299 3 51
3 5 NA NA NA
4 20 300 5 20
5 NA NA NA NA
6 NA NA NA NA
Foi criada uma tabela para duas variáveis qualitativas, constando os valores quantitativos absolutos de lealdade (a qual casa determinado personagem é leal) e sexo, considerando a BD selecianada.
#---------
#Passo 2 - Análise estatística - Tabela em números absolutos
#---------
library(flextable)
library(reactable)
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
Tabela 1 - Quantidade absoluta de personagens leais a cada casa, por sexo.
personagens_livro %>% select(lealdade,sexo) %>%
table() %>% data.frame() %>% flextable()lealdade | sexo | Freq |
Arryn | femenino | 6 |
Baratheon | femenino | 6 |
Greyjoy | femenino | 5 |
Guardia de la Noche | femenino | 0 |
Lannister | femenino | 14 |
Martell | femenino | 14 |
Ninguna | femenino | 51 |
Salvajes | femenino | 16 |
Stark | femenino | 27 |
Targaryen | femenino | 6 |
Tully | femenino | 2 |
Tyrell | femenino | 10 |
Arryn | masculino | 24 |
Baratheon | masculino | 58 |
Greyjoy | masculino | 70 |
Guardia de la Noche | masculino | 116 |
Lannister | masculino | 88 |
Martell | masculino | 23 |
Ninguna | masculino | 202 |
Salvajes | masculino | 24 |
Stark | masculino | 81 |
Targaryen | masculino | 30 |
Tully | masculino | 28 |
Tyrell | masculino | 16 |
Em seguida, foram criadas duas tabelas para as mesmas variáveis qualitativas, constando os valores quantitativos relativos de lealdade e sexo, considerando a BD selecianada.
Tabela 2 - Percentual de personagens de cada sexo, por lealdade a cada casa.
#---------
#Passo 3 - Análise estatística - Tabela em números relativos
#---------
Tabela1 <- personagens_livro %>% select(lealdade,sexo) %>%
table() %>% prop.table(1) %>% round(4)*100
Tabela1 %>% data.frame() %>% flextable()lealdade | sexo | Freq |
Arryn | femenino | 20.00 |
Baratheon | femenino | 9.38 |
Greyjoy | femenino | 6.67 |
Guardia de la Noche | femenino | 0.00 |
Lannister | femenino | 13.73 |
Martell | femenino | 37.84 |
Ninguna | femenino | 20.16 |
Salvajes | femenino | 40.00 |
Stark | femenino | 25.00 |
Targaryen | femenino | 16.67 |
Tully | femenino | 6.67 |
Tyrell | femenino | 38.46 |
Arryn | masculino | 80.00 |
Baratheon | masculino | 90.62 |
Greyjoy | masculino | 93.33 |
Guardia de la Noche | masculino | 100.00 |
Lannister | masculino | 86.27 |
Martell | masculino | 62.16 |
Ninguna | masculino | 79.84 |
Salvajes | masculino | 60.00 |
Stark | masculino | 75.00 |
Targaryen | masculino | 83.33 |
Tully | masculino | 93.33 |
Tyrell | masculino | 61.54 |
Tabela 3 - Distribuição relativa de personagens a cada casa, por sexo.
Tabela2 <- personagens_livro %>% select(lealdade,sexo) %>%
table() %>% prop.table(2) %>% round(4)*100
Tabela2 %>% data.frame() %>% flextable()lealdade | sexo | Freq |
Arryn | femenino | 3.82 |
Baratheon | femenino | 3.82 |
Greyjoy | femenino | 3.18 |
Guardia de la Noche | femenino | 0.00 |
Lannister | femenino | 8.92 |
Martell | femenino | 8.92 |
Ninguna | femenino | 32.48 |
Salvajes | femenino | 10.19 |
Stark | femenino | 17.20 |
Targaryen | femenino | 3.82 |
Tully | femenino | 1.27 |
Tyrell | femenino | 6.37 |
Arryn | masculino | 3.16 |
Baratheon | masculino | 7.63 |
Greyjoy | masculino | 9.21 |
Guardia de la Noche | masculino | 15.26 |
Lannister | masculino | 11.58 |
Martell | masculino | 3.03 |
Ninguna | masculino | 26.58 |
Salvajes | masculino | 3.16 |
Stark | masculino | 10.66 |
Targaryen | masculino | 3.95 |
Tully | masculino | 3.68 |
Tyrell | masculino | 2.11 |
Por último, foi criado um gráfico de barras com as mesmas variáveis qualitativas consideradas anteriormente, com uma extratificação por sexo.
#---------
#Passo 4 - Gráfico de barras
#---------
library(RColorBrewer)
COR <- brewer.pal(12,"Set3")
graf_barras <- personagens_livro %>% select(lealdade,sexo) %>%
table() %>% barplot(beside = TRUE, horiz = TRUE, col=COR,
main = "Gráfico 1 - Lealdade à casa em função do sexo",
legend.text=TRUE, args.legend = list(x = "bottomright"))graf_barras [,1] [,2]
[1,] 1.5 14.5
[2,] 2.5 15.5
[3,] 3.5 16.5
[4,] 4.5 17.5
[5,] 5.5 18.5
[6,] 6.5 19.5
[7,] 7.5 20.5
[8,] 8.5 21.5
[9,] 9.5 22.5
[10,] 10.5 23.5
[11,] 11.5 24.5
[12,] 12.5 25.5
Na tabela 1 é observada a quantidade absoluta de personagens leais a cada casa, extratificada por sexo, enquanto na tabela 2, observa-se essa mesma distribuiçao relativa, ou seja, o percentual de personagens de cada sexo presente em cada casa de lealdade. Assim, a título de exemplo, existem 30 personagens leais à casa Arryn, sendo 6 do sexo feminino, o que equivale a 20% do número total dessa casa, e 24 do sexo masculino, equivalente a 80% desse mesmo total.
Já na Tabela 3, observa-se uma distribuição relativa de personagens com lealdade a cada casa, de acordo com o sexo. Dessa forma, verifica-se que, tomando-se todos os personagens do sexo feminino, 3,82% são leais à casa Arryn, 3,82% são leais à casa Baratheon, 3,18% são leais à casa Greyjov e assim por diante. E tomando-se todos os personagens do sexo masculino, 3,16% são leais à casa Arrun, 7,63 são leais à casa Baratheon e assim por diante.
Finalmente, no gráfico de barras apresentado, verifica-se a distribuição absoluta dos personagens com lealdade a cada casa, extratificada pelo sexo. A titulo de exemplo, de verde no referido gráfico, estão representados os personagens leais à casa Ninguna, sendo 202 do sexo masculino e 51 do sexo feminino.