ATIVIDADE 5
library(readr)
FullData <- read_csv("bases_curso_estatistica/Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## .default = col_double(),
## Name = col_character(),
## Nationality = col_character(),
## National_Position = col_character(),
## Club = col_character(),
## Club_Position = col_character(),
## Club_Joining = col_character(),
## Height = col_character(),
## Weight = col_character(),
## Preffered_Foot = col_character(),
## Birth_Date = col_character(),
## Preffered_Position = col_character(),
## Work_Rate = col_character()
## )
## ℹ Use `spec()` for the full column specifications.
class(FullData$Ball_Control)
## [1] "numeric"
FullData$Ball_Control <- as.factor(FullData$Ball_Control)
class(FullData$Ball_Control)
## [1] "factor"
tabela_fulldata <- table(FullData$Ball_Control)
tabela_fulldata
##
## 5 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
## 1 2 6 32 37 73 70 76 104 119 123 147 140 162 122 181 168 141 93 50
## 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
## 28 27 41 48 36 42 66 57 71 33 30 53 44 83 82 103 100 103 132 141
## 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
## 129 168 177 199 211 286 267 324 388 376 415 491 445 557 564 619 702 702 769 699
## 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86
## 616 699 503 598 485 440 438 386 384 300 243 165 129 140 85 88 58 45 46 30
## 87 88 89 90 91 92 93 95
## 19 11 5 10 5 1 2 2
barplot(tabela_fulldata, las=2, col = "#06051c", main = "Controle de Bola")

par(cex = 0.7)
——-
Análise de Dados
——-
summary(FullData$Ball_Control)
## 5 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
## 1 2 6 32 37 73 70 76 104 119 123 147 140 162 122 181 168 141 93 50
## 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
## 28 27 41 48 36 42 66 57 71 33 30 53 44 83 82 103 100 103 132 141
## 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
## 129 168 177 199 211 286 267 324 388 376 415 491 445 557 564 619 702 702 769 699
## 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86
## 616 699 503 598 485 440 438 386 384 300 243 165 129 140 85 88 58 45 46 30
## 87 88 89 90 91 92 93 95
## 19 11 5 10 5 1 2 2
FullData$Ball_Control <- as.numeric(FullData$Ball_Control)
hist(FullData$Ball_Control, col = "#d408a4", main = "Histograma do controle da pelota")

mean(FullData$Ball_Control)
## [1] 51.97277
median(FullData$Ball_Control)
## [1] 57
max(FullData$Ball_Control)
## [1] 88
min(FullData$Ball_Control)
## [1] 1
install.packages("outliers")
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
library(outliers)
outlier(FullData$Ball_Control)
## [1] 1
Comentários
#### Diferentemente dos gráficos anteriores, que abordamos durante o último encontro é que o OUTLIER é de um número muito baixo ("1"), ao invés de um muito alto.
#### Podemos perceber que a média de controle de bola dos atletas fica em torno de 51, mas a maior parte dos jogadores possui números entre 55 e 59.
#### O ponto negativo, que acaba por limitar o gráfico é o fato de atletas que atuem como goleiros serem incluídos no gráfico com controle de bola e sabemos que suas chances de demonstrar essa habilidade são bem inferiores, o que pode modificar seus dados consideravelmente.