Estatísticas da variáveil quantitativa “minutos” da base de dados “tempo_de_tela”.

Carregando a base da dados:

load("~/Base_de_dados-master/Game of Thrones.RData")

Exercício 1

Média da variável:

mean(tempo_de_tela$minutos)
[1] 27.26099

Variância da variável:

var(tempo_de_tela$minutos)
[1] 2119.029

Desvio padão da variável:

sd(tempo_de_tela$minutos)
[1] 46.03292

Exercício 2

Box-plot da variável:

boxplot(tempo_de_tela$minutos,
        col="green",
        main="Gráfico do tempo de tela dos personagens em minutos")

Estatísticas das variáveis qualitativas “sexo” e “nobre” da base de dados “personagens_livro”.

Exercício 3

Tratamento dos dados:

personagens_livro$nobre <-ifelse (personagens_livro$nobre==1,"Nobre", "Não nobre")

Gráfico de barras das variáveis:

library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
personagens_livro %>% select(sexo, nobre) %>% table() %>% barplot(beside=TRUE,
                                                          horiz=TRUE,
                                                          col=c("#e61ea6", "blue"))

Exercício 4

Tabela para as variáveis:

personagens_livro %>% select(sexo, nobre) %>% table()
           nobre
sexo        Não nobre Nobre
  femenino         73    84
  masculino       414   346

Exercício 5

Tabela de proporção para as variáveis:

personagens_livro %>% select(sexo, nobre) %>% table() %>% prop.table(1)*100
           nobre
sexo        Não nobre    Nobre
  femenino   46.49682 53.50318
  masculino  54.47368 45.52632

Interpretação dos resultados

  No exercício 1, é possível concluir que a variância e o desvio padrão são muito altos o que significa que há uma variabilidade muito grande dos dados da variável "minuto", ou seja, há personagens que aparecem durante muito tempo e outros que aparecem durante muito pouco tempo.
  Já no exercício 2, tem-se um gráfico box-plot da variável "minuto", o qual revela uma grande concentração dos dados. Isso é visto considerando o tamanho do box-plot. Nota-se também uma certa assimetria dos dados. Por fim, observa-se uma grande quantidade de outliers, valores que se distanciam radicalmente de todos os outros.
  Analizando o gráfico gerado no exercício 3, observa-se que tanto nobres quanto não nobres há uma presença predominante de homens na amostra. Dentre eles a maioria não é nobre. Já em relação as mulheres, a maioria é nobre. Informações essas que são certificadas observando o exercício 4.
  No exercício 5, é possível concluir que, dentre a amostra de mulheres, a proporção de nobres é maior do que a de não nobres. O inverso ocorre em relação a amostra de homens.