#Bibliotecas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.92 loaded

#Base de dados

library(readr)

Fifa <- read_csv("C:/Users/npm25/Desktop/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(Fifa)
## # A tibble: 6 × 53
##   Name    Nationality National_Positi… National_Kit Club  Club_Position Club_Kit
##   <chr>   <chr>       <chr>                   <dbl> <chr> <chr>            <dbl>
## 1 Cristi… Portugal    LS                          7 Real… LW                   7
## 2 Lionel… Argentina   RW                         10 FC B… RW                  10
## 3 Neymar  Brazil      LW                         10 FC B… LW                  11
## 4 Luis S… Uruguay     LS                          9 FC B… ST                   9
## 5 Manuel… Germany     GK                          1 FC B… GK                   1
## 6 De Gea  Spain       GK                          1 Manc… GK                   1
## # … with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
## #   Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
## #   Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
## #   Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
## #   Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
## #   Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
## #   Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>, …

##HIPOTESE #1- A idade influencia no nivel de agressividade #Diagrama

par(bg="grey")
plot(Fifa$Age,Fifa$Aggression,pch=20, col="blue",
     main = "Relação da idade com o nivel de agressividade",xlab = "Idade",
     ylab = "Agressividade")
par(bg="white")

abline(lsfit( Fifa$Aggression,Fifa$Age),
       col="red")

#Matriz de correlação

names(Fifa)
##  [1] "Name"               "Nationality"        "National_Position" 
##  [4] "National_Kit"       "Club"               "Club_Position"     
##  [7] "Club_Kit"           "Club_Joining"       "Contract_Expiry"   
## [10] "Rating"             "Height"             "Weight"            
## [13] "Preffered_Foot"     "Birth_Date"         "Age"               
## [16] "Preffered_Position" "Work_Rate"          "Weak_foot"         
## [19] "Skill_Moves"        "Ball_Control"       "Dribbling"         
## [22] "Marking"            "Sliding_Tackle"     "Standing_Tackle"   
## [25] "Aggression"         "Reactions"          "Attacking_Position"
## [28] "Interceptions"      "Vision"             "Composure"         
## [31] "Crossing"           "Short_Pass"         "Long_Pass"         
## [34] "Acceleration"       "Speed"              "Stamina"           
## [37] "Strength"           "Balance"            "Agility"           
## [40] "Jumping"            "Heading"            "Shot_Power"        
## [43] "Finishing"          "Long_Shots"         "Curve"             
## [46] "Freekick_Accuracy"  "Penalties"          "Volleys"           
## [49] "GK_Positioning"     "GK_Diving"          "GK_Kicking"        
## [52] "GK_Handling"        "GK_Reflexes"
MC <- Fifa%>% select(Aggression, Age) %>% cor()
MC
##            Aggression       Age
## Aggression  1.0000000 0.2595643
## Age         0.2595643 1.0000000
par(bg="#cccaca")
corrplot(MC)

corrplot.mixed(MC)

#Conclusão Primeiro, importei a base de dados,depois fiz um diagrama de dispersão para observar se há alguma relação visivel entre a idade e o nivel de agressividade dos jogadores. Foi observado uma linearidade, ou seja, ausência de correlação entre uma variavel e outra.Então, a minha hipotese não foi comprovada! Depois, calculei a correleção pra medir a direção e a intensidade da relação linear entre essas duas variaveis.O resultado encontrado foi : 0.25. Isso quer dizer que a correlação é positiva e de grau fraco de associação. Por fim, criei uma matriz de correlação para elucidar graficamente o resultado.É possivel perceber que a associação é muito fraca, porém, positiva.