Este post apresenta as atividades relacionadas à disciplina Estatística aplicada à Ciências Humanas em que foram utilizados os recursos para:
importar BD csv;
efetuar um resumo estatístico de uma variável do BD;
criar histograma; e
efetuar os cálculos de média e do desvio padrão.
A BD importada e utilizada na atividade foi FifaData, com as seguintes informações:
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## Name = col_character(),
## Nationality = col_character(),
## National_Position = col_character(),
## Club = col_character(),
## Club_Position = col_character(),
## Club_Joining = col_character(),
## Height = col_character(),
## Weight = col_character(),
## Preffered_Foot = col_character(),
## Birth_Date = col_character(),
## Preffered_Position = col_character(),
## Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.
## # A tibble: 6 x 53
## Name Nationality National_Positi~ National_Kit Club Club_Position Club_Kit
## <chr> <chr> <chr> <dbl> <chr> <chr> <dbl>
## 1 Cristi~ Portugal LS 7 Real~ LW 7
## 2 Lionel~ Argentina RW 10 FC B~ RW 10
## 3 Neymar Brazil LW 10 FC B~ LW 11
## 4 Luis S~ Uruguay LS 9 FC B~ ST 9
## 5 Manuel~ Germany GK 1 FC B~ GK 1
## 6 De Gea Spain GK 1 Manc~ GK 1
## # ... with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
## # Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
## # Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
## # Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
## # Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
## # Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
## # Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>,
## # Short_Pass <dbl>, Long_Pass <dbl>, Acceleration <dbl>, Speed <dbl>,
## # Stamina <dbl>, Strength <dbl>, Balance <dbl>, Agility <dbl>, Jumping <dbl>,
## # Heading <dbl>, Shot_Power <dbl>, Finishing <dbl>, Long_Shots <dbl>,
## # Curve <dbl>, Freekick_Accuracy <dbl>, Penalties <dbl>, Volleys <dbl>,
## # GK_Positioning <dbl>, GK_Diving <dbl>, GK_Kicking <dbl>, GK_Handling <dbl>,
## # GK_Reflexes <dbl>
Foi efetuado um resumo estatístico do conjunto de dados da variável Long_Pass, que é a quantidade de passes longos de cada jogador, da BD selecianada. Além disso, foram calculados a média e o desvio padrão dessa mesma variável. O resultado obtido foi o seguinte:
#---------
#Passo 2 - Resumo estatístico - média, Desvio padrão e variância
#---------
summary(Fifa$Long_Pass)
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.0 42.0 56.0 52.4 64.0 93.0
media_pl <- mean(Fifa$Long_Pass)
desvio_padrao_pl <- sd(Fifa$Long_Pass)
variancia_pl <- var(Fifa$Long_Pass)
media_pl
[1] 52.39607
desvio_padrao_pl
[1] 15.61607
variancia_pl
[1] 243.8617
Foi criado um histograma utilizando-se a variável quantitativa Long_Pass da BD selecionada.
Verificou-se que é relativamente fácil carregar uma BD no formato csv, efetuar um resumo do conjunto de dados de uma BD e calcular a média e o desvio padrão no R.
De acordo com os valores apresentados, a média de passes longos dos jogadores foi de 52, com um desvio padrão de 15. Esse desvio padrão, em relação ao valor da média, reflete uma alta variabilidade dos passes longos, considerando todo o conjunto de dados.
Em relação ao histograma, que é um tipo de gráfico utilizado para variáveis quantitativas, verifica-se que este é assimétrico, não existe qualquer jogador com passes longos inferior a 7 e nem superior a 93. Além disso, a maior parte dos jogadores apresenta quantidades de passes longos compreendidos na faixa entre 55 e 65.
Assim, a faixa compreendida entre 55 a 60 passes longos é observada para cerca de 2500 jogadores, e a faixa compreendida entre 60 a 65 passes longos também é observada para cerca de 2500 jogadores.