Variável em Analise

1/3 – Passes na área do adversário Passes completos que ficam a 1/3 do campo mais próximo do gol, Não incluindo peças fixas

Exercicio 1

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ purrr     1.0.2
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
passe = data.frame(terco_final = br_2024$`1/3`,
                   jogador=br_2024$Jogador,
                   equipe=br_2024$Equipe,
                   posicao=br_2024$Pos.,
                   partidas=br_2024$`90s`,
                   passe_por_partida=br_2024$`1/3`/br_2024$`90s`)
view(passe)

summary(passe$partidas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00    2.60    9.50   11.46   18.15   38.00       1
#help - descobrindo que o pacote faz
?dplyr
## inicializando servidor httpd de ajuda ... concluído
#Amplitude
length(passe$partidas)
## [1] 728
#No filtro removido os NAs e a posição de Goleiro
passe <- passe %>% 
  filter(!is.na(terco_final), !is.na(jogador), !is.na(equipe), !is.na(posicao), posicao!='G', terco_final>=100)
summary(passe$terco_final)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   100.0   111.5   125.0   133.6   144.5   255.0
view(passe)

max = max(passe$terco_final) # ponto maximo
min = min(passe$terco_final) # ponto minimo

Amplitude =  max - min #  a subtração dos pontos em questão.
Amplitude # resultado da Estatistica.
## [1] 155
#Variância
media = mean(passe$terco_final)
media
## [1] 133.5818
variancia = var(passe$terco_final)
variancia
## [1] 997.3219
#desvio_padrao
desvio_padrao = sd(passe$terco_final)
desvio_padrao
## [1] 31.5804
#coeficiente de variação
cv = (desvio_padrao/media)*100
cv
## [1] 23.64124
hist(passe$terco_final)

summary(passe$terco_final)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   100.0   111.5   125.0   133.6   144.5   255.0

Amplitude: Estudo de passes no terço final dO campeonato brasileiro de 2024. Tem amplitude de 255, sendo o igual ao valor máximo, pois nesse caso o valor minimo é zero.

assimetria <- function(x) {
  n <- length(x) # quantidade total de registros
  media <- mean(x) # media
  desvio_padrao <- sd(x) # desvio padrão
  soma <- sum((x - media)^3) / n # soma das diferenças elevadas ao cubo
  skewness <- soma / (desvio_padrao^3) # formula da assimetria
  return(skewness)
}

dados <- c(10, 12, 14, 18, 20, 30)

assimetria(passe$terco_final)
## [1] 1.848614
#install.packages("moments")
library(moments)

curtose <- kurtosis(passe$terco_final)
print(curtose)
## [1] 6.775621

Gráficos

1.1 Preferi usar a variável passe por partida, ao inves da variável terço final, pois ela leva em consideração o número de jogos que cada atleta realizou. Através do Dataframe foi criada a variável usando a divisão do terço final pelo numero de 90 minutos inteiros jogados.

1.2 Eixo X = Passe por partida e Eixo Y = Distribuição na amostra

plot(passe$passe_por_partida) #Distribuição