Introdução

Este post apresenta os resultados da atividade 5 e 6 da disciplina Estatística aplicada à Ciências Humanas em que foram utilizados os recursos para:

  • carregar uma BD no formato R;

  • efetuar um resumo estatístico de uma variável quantitativa da BD;

  • efetuar os cálculos da variância e do desvio padrão;

  • elaborar um gráfico do tipo boxplot;

  • criar e formatar tabelas em números absolutos e relativos; e

  • criar gráfico de barras com duas variáveis qualitativas.

Primeira Atividade

Carregamento da BD (em R)

Para essa primeira parte da Atividade, a BD carregada e utilizada na atividade foi a seguinte:

#---------
#Passo 1 - Carregamento de BD
#---------
load("D:/Curso Adm Publica/Semestre 8/Estatistica/Base_de_dados-master/Game of Thrones.RData")
head(tempo_de_tela)
                nome minutos episodios
1   Tyrion Lannister  293.30        54
2          Jon Nieve  268.15        49
3 Daenerys Targaryen  221.30        49
4   Cersei Lannister  201.45        52
5        Sansa Stark  199.30        47
6         Arya Stark  189.15        47

Resumo do conjunto de dados

Foi efetuado um resumo estatístico do conjunto de dados da variável minutos, que é o tempo, em minutos, que cada personagem esteve em tela, da BD selecianada. Além disso, foram calculados a média, a variância e o desvio padrão. O resultado obtido foi o seguinte:

#---------
#Passo 2 - Resumo estatístico - média, mediana, 1 e 3 quartis
#           Desvio padrão e variância
#---------
summary(tempo_de_tela$minutos)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.150   4.375  10.300  27.261  27.650 293.300 
media_tempo_tela <- mean(tempo_de_tela$minutos)
desvio_padrao_tempo_tela <- sd(tempo_de_tela$minutos)
variancia_tempo_tela <- var(tempo_de_tela$minutos)
desvio_padrao_tempo_tela
[1] 46.03292
variancia_tempo_tela
[1] 2119.029

Criação do boxplot

Foi criado um boxplot utilizando-se a variável quantitativa minutos (tempo, em minutos, que cada personagem esteve em tela) da BD selecionada, conforme apresentado no gráfico a seguir.

#---------
#Passo 3 - Criação de Boxplot
#---------
boxplot(tempo_de_tela$minutos,col = "skyblue",
        main="Gráfico 1 - boxplot do tempo de tela para cada personagem")

Interpretação dos resultados

De acordo com os valores apresentados, a média de minutos em tela, do cojunto de personagens da série, foi de 27,261 minutos, com um desvio padrão de 46,033 minutos. Esse desvio padrão, com relação ao valor da média, reflete uma alta variabilidade dos minutos em tela, considerando todo o conjunto de dados, ou seja, todos os personagens da série.

No boxplot originado, é observada uma grande quantidade de outliers, o que corrobora com a alta variabilidade verificada a partir do desvio padrão. Como todos os valores são utilizados para o cálculo da média e do desvio padrão, e sendo muitos deles outliers, era de se esperar essa alta variabilidade.

Verifica-se, ainda, que o boxplot apresenta uma assimetria e, excluindo-se os outliers, há uma baixa dispersão nos dados da variável analisada.

Segunda Atividade

Carregamento da BD (em R)

Para essa segunda parte da Atividade, a BD carregada e utilizada na atividade foi a seguinte:

#---------
#Passo 1 - Carregamento de BD
#---------
head(personagens_livro)
                     nome  lealdade      sexo nobre Guerra_dos_Tronos
1          Addam Marbrand Lannister masculino     1                 1
2 Aegon Frey (Jinglebell)   Ninguna masculino     1                 0
3         Aegon Targaryen Targaryen masculino     1                 0
4           Adrack Humble   Greyjoy masculino     1                 0
5          Aemon Costayne Lannister masculino     1                 0
6         Aemon Estermont Baratheon masculino     1                 0
  Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos Danca_dos_Dragoes
1              1                   1                 1                 0
2              0                   1                 0                 0
3              0                   0                 0                 1
4              0                   0                 0                 1
5              0                   1                 0                 0
6              1                   1                 0                 0
  capitulo_apresentacao ano_morte livro inteiro da morte capitulo_morte
1                    56        NA                     NA             NA
2                    49       299                      3             51
3                     5        NA                     NA             NA
4                    20       300                      5             20
5                    NA        NA                     NA             NA
6                    NA        NA                     NA             NA

Tabela números absolutos

Foi criada uma tabela para duas variáveis qualitativas, constando os valores quantitativos absolutos de lealdade (a qual casa determinado personagem é leal) e sexo, considerando a BD selecianada.

#---------
#Passo 2 - Análise estatística - Tabela em números absolutos
#---------
library(flextable)
library(reactable)
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union

Tabela 1 - Quantidade absoluta de personagens leais a cada casa, por sexo.

personagens_livro %>% select(lealdade,sexo) %>% 
  table() %>% data.frame() %>% flextable()

Tabelas números relativos

Em seguida, foram criadas duas tabelas para as mesmas variáveis qualitativas, constando os valores quantitativos relativos de lealdade e sexo, considerando a BD selecianada.

Tabela 2 - Percentual de personagens de cada sexo, por lealdade a cada casa.

#---------
#Passo 3 - Análise estatística - Tabela em números relativos
#---------
Tabela1 <- personagens_livro %>% select(lealdade,sexo) %>%
  table() %>% prop.table(1) %>% round(4)*100

Tabela1 %>% data.frame() %>% flextable()

Tabela 3 - Distribuição relativa de personagens a cada casa, por sexo.

Tabela2 <- personagens_livro %>% select(lealdade,sexo) %>% 
  table() %>% prop.table(2) %>% round(4)*100

Tabela2 %>% data.frame() %>% flextable()

Gráfico de barras

Por último, foi criado um gráfico de barras com as mesmas variáveis qualitativas consideradas anteriormente, com uma extratificação por sexo.

#---------
#Passo 4 - Gráfico de barras
#---------
library(RColorBrewer)
COR <- brewer.pal(12,"Set3")

graf_barras <- personagens_livro %>% select(lealdade,sexo) %>% 
  table() %>% barplot(beside = TRUE, horiz = TRUE, col=COR, 
  main = "Gráfico 1 - Lealdade à casa em função do sexo",
  legend.text=TRUE, args.legend = list(x = "bottomright"))

graf_barras
      [,1] [,2]
 [1,]  1.5 14.5
 [2,]  2.5 15.5
 [3,]  3.5 16.5
 [4,]  4.5 17.5
 [5,]  5.5 18.5
 [6,]  6.5 19.5
 [7,]  7.5 20.5
 [8,]  8.5 21.5
 [9,]  9.5 22.5
[10,] 10.5 23.5
[11,] 11.5 24.5
[12,] 12.5 25.5

Interpretação dos resultados

Na tabela 1 é observada a quantidade absoluta de personagens leais a cada casa, extratificada por sexo, enquanto na tabela 2, observa-se essa mesma distribuiçao relativa, ou seja, o percentual de personagens de cada sexo presente em cada casa de lealdade. Assim, a título de exemplo, existem 30 personagens leais à casa Arryn, sendo 6 do sexo feminino, o que equivale a 20% do número total dessa casa, e 24 do sexo masculino, equivalente a 80% desse mesmo total.

Já na Tabela 3, observa-se uma distribuição relativa de personagens com lealdade a cada casa, de acordo com o sexo. Dessa forma, verifica-se que, tomando-se todos os personagens do sexo feminino, 3,82% são leais à casa Arryn, 3,82% são leais à casa Baratheon, 3,18% são leais à casa Greyjov e assim por diante. E tomando-se todos os personagens do sexo masculino, 3,16% são leais à casa Arrun, 7,63 são leais à casa Baratheon e assim por diante.

Finalmente, no gráfico de barras apresentado, verifica-se a distribuição absoluta dos personagens com lealdade a cada casa, extratificada pelo sexo. A titulo de exemplo, de verde no referido gráfico, estão representados os personagens leais à casa Ninguna, sendo 202 do sexo masculino e 51 do sexo feminino.