Introdução

Este post apresenta as atividades relacionadas à disciplina Estatística aplicada à Ciências Humanas em que foram utilizados os recursos para:

Importação da BD (csv)

A BD importada e utilizada na atividade foi FifaData, com as seguintes informações:

## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_double(),
##   Name = col_character(),
##   Nationality = col_character(),
##   National_Position = col_character(),
##   Club = col_character(),
##   Club_Position = col_character(),
##   Club_Joining = col_character(),
##   Height = col_character(),
##   Weight = col_character(),
##   Preffered_Foot = col_character(),
##   Birth_Date = col_character(),
##   Preffered_Position = col_character(),
##   Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.
## # A tibble: 6 x 53
##   Name    Nationality National_Positi~ National_Kit Club  Club_Position Club_Kit
##   <chr>   <chr>       <chr>                   <dbl> <chr> <chr>            <dbl>
## 1 Cristi~ Portugal    LS                          7 Real~ LW                   7
## 2 Lionel~ Argentina   RW                         10 FC B~ RW                  10
## 3 Neymar  Brazil      LW                         10 FC B~ LW                  11
## 4 Luis S~ Uruguay     LS                          9 FC B~ ST                   9
## 5 Manuel~ Germany     GK                          1 FC B~ GK                   1
## 6 De Gea  Spain       GK                          1 Manc~ GK                   1
## # ... with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
## #   Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
## #   Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
## #   Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
## #   Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
## #   Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
## #   Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>,
## #   Short_Pass <dbl>, Long_Pass <dbl>, Acceleration <dbl>, Speed <dbl>,
## #   Stamina <dbl>, Strength <dbl>, Balance <dbl>, Agility <dbl>, Jumping <dbl>,
## #   Heading <dbl>, Shot_Power <dbl>, Finishing <dbl>, Long_Shots <dbl>,
## #   Curve <dbl>, Freekick_Accuracy <dbl>, Penalties <dbl>, Volleys <dbl>,
## #   GK_Positioning <dbl>, GK_Diving <dbl>, GK_Kicking <dbl>, GK_Handling <dbl>,
## #   GK_Reflexes <dbl>

Resumo de dados e cálculo de média e dp

Foi efetuado um resumo estatístico do conjunto de dados da variável Long_Pass, que é a quantidade de passes longos de cada jogador, da BD selecianada. Além disso, foram calculados a média e o desvio padrão dessa mesma variável. O resultado obtido foi o seguinte:

#---------
#Passo 2 - Resumo estatístico - média, Desvio padrão e variância
#---------

summary(Fifa$Long_Pass)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    7.0    42.0    56.0    52.4    64.0    93.0 
media_pl <- mean(Fifa$Long_Pass)
desvio_padrao_pl <- sd(Fifa$Long_Pass)
variancia_pl <- var(Fifa$Long_Pass)
media_pl
[1] 52.39607
desvio_padrao_pl
[1] 15.61607
variancia_pl
[1] 243.8617

Criação de histograma

Foi criado um histograma utilizando-se a variável quantitativa Long_Pass da BD selecionada.

Conclusão

Verificou-se que é relativamente fácil carregar uma BD no formato csv, efetuar um resumo do conjunto de dados de uma BD e calcular a média e o desvio padrão no R.

De acordo com os valores apresentados, a média de passes longos dos jogadores foi de 52, com um desvio padrão de 15. Esse desvio padrão, em relação ao valor da média, reflete uma alta variabilidade dos passes longos, considerando todo o conjunto de dados.

Em relação ao histograma, que é um tipo de gráfico utilizado para variáveis quantitativas, verifica-se que este é assimétrico, não existe qualquer jogador com passes longos inferior a 7 e nem superior a 93. Além disso, a maior parte dos jogadores apresenta quantidades de passes longos compreendidos na faixa entre 55 e 65.

Assim, a faixa compreendida entre 55 a 60 passes longos é observada para cerca de 2500 jogadores, e a faixa compreendida entre 60 a 65 passes longos também é observada para cerca de 2500 jogadores.