ATIVIDADE 5

library(readr)
FullData <- read_csv("bases_curso_estatistica/Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   .default = col_double(),
##   Name = col_character(),
##   Nationality = col_character(),
##   National_Position = col_character(),
##   Club = col_character(),
##   Club_Position = col_character(),
##   Club_Joining = col_character(),
##   Height = col_character(),
##   Weight = col_character(),
##   Preffered_Foot = col_character(),
##   Birth_Date = col_character(),
##   Preffered_Position = col_character(),
##   Work_Rate = col_character()
## )
## ℹ Use `spec()` for the full column specifications.
class(FullData$Ball_Control)
## [1] "numeric"
FullData$Ball_Control <- as.factor(FullData$Ball_Control)
class(FullData$Ball_Control)
## [1] "factor"
tabela_fulldata <- table(FullData$Ball_Control)
tabela_fulldata
## 
##   5   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26 
##   1   2   6  32  37  73  70  76 104 119 123 147 140 162 122 181 168 141  93  50 
##  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46 
##  28  27  41  48  36  42  66  57  71  33  30  53  44  83  82 103 100 103 132 141 
##  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66 
## 129 168 177 199 211 286 267 324 388 376 415 491 445 557 564 619 702 702 769 699 
##  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86 
## 616 699 503 598 485 440 438 386 384 300 243 165 129 140  85  88  58  45  46  30 
##  87  88  89  90  91  92  93  95 
##  19  11   5  10   5   1   2   2
barplot(tabela_fulldata, las=2, col = "#06051c", main = "Controle de Bola")

par(cex = 0.7)

——-

Análise de Dados

——-

summary(FullData$Ball_Control)
##   5   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26 
##   1   2   6  32  37  73  70  76 104 119 123 147 140 162 122 181 168 141  93  50 
##  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46 
##  28  27  41  48  36  42  66  57  71  33  30  53  44  83  82 103 100 103 132 141 
##  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66 
## 129 168 177 199 211 286 267 324 388 376 415 491 445 557 564 619 702 702 769 699 
##  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86 
## 616 699 503 598 485 440 438 386 384 300 243 165 129 140  85  88  58  45  46  30 
##  87  88  89  90  91  92  93  95 
##  19  11   5  10   5   1   2   2
FullData$Ball_Control <- as.numeric(FullData$Ball_Control)
hist(FullData$Ball_Control, col = "#d408a4", main = "Histograma do controle da pelota")

mean(FullData$Ball_Control)
## [1] 51.97277
median(FullData$Ball_Control)
## [1] 57
max(FullData$Ball_Control)
## [1] 88
min(FullData$Ball_Control)
## [1] 1
install.packages("outliers")
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
library(outliers)
outlier(FullData$Ball_Control)
## [1] 1

Comentários

  #### Diferentemente dos gráficos anteriores, que abordamos durante o último encontro é que o OUTLIER é de um número muito baixo ("1"), ao invés de um muito alto.
  #### Podemos perceber que a média de controle de bola dos atletas fica em torno de 51, mas a maior parte dos jogadores possui números entre 55 e 59.
  #### O ponto negativo, que acaba por limitar o gráfico é o fato de atletas que atuem como goleiros serem incluídos no gráfico com controle de bola e sabemos que suas chances de demonstrar essa habilidade são bem inferiores, o que pode modificar seus dados consideravelmente.