LEVANTAMENTO DE DADOS DAS ALTURAS DOS JOGADORES

Certo jornalista, foi chamada pela FIFA para fazer uma análise e divulgação da altura de jogadores de diversos clubes. Onde foi fornecida uma base de dados para que pudesse realizar seus estudos.

Primeiro importaremos nossa base de dados FifaData.

library(readr)
FifaData <- read_csv("C:/Users/rioch/Desktop/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(FifaData)

Para isso, é necessário tratar os dados, visto que estão na forma de caracteres.

library(stringr)
altura = c(FifaData$Height)

Temos um vetor apenas com números.

altura =c(str_sub(altura,0,3))
altura = as.numeric(altura)

Vamos pedir para o R fazer uma análise geral do altura dos Jogadores:

summary(altura)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   155.0   176.0   181.0   181.1   186.0   207.0

Observe que o jogador mais baixo, tem uma altura, 155 cm, e o mais alto, tem 207 cm. e a média da altura de todos jogadores é, aproximadamente, 181.1 cm e a mediana é 181 cm.

Também é possivel gerar a média e a mediana com o comando “mean” e “median”, respectivamente, como você pode ver abaixo:

mean(altura)
## [1] 181.1055
median(altura)
## [1] 181

Vamos verificar qual é o Desvio-padrão da altura dos jogadores.

sd(altura)
## [1] 6.67516
Sendo assim, é possível ver que o desvio padrão é 6.67516 cm.

HISTOGRAMA

O jornalista, achou os dados conclusivos, então resolveu gerar um Histograma para que as informações ficassem mais visuais.

hist(altura,col="#2b2820",main = "Histograma - altura dos Jogadores", 
     xlab="altura", ylab="Quantidade de Jogadores")

ANÁLISE DO JORNALISTA

Após analisar o conjunto dos dados, concluiu que há presença de “Height” na base de dados, isto é, há um jogador que apresente um altura muito destacado dos outros de modo geral.

Também concluiu que as alturas estão consentradas ao redor de 180cm a 185cm, o que é evidenciado pela proximidade do valor da média com a mediana. O histograma, por sua vez, deixa essa distribuição mais evidente ainda, apresentando simetria e formato de sino, o que significa que as variações vão diminuindo de maneira simétrica em direção às extremidades.