1/3 – Passes na área do adversário Passes completos que ficam a 1/3 do campo mais próximo do gol, Não incluindo peças fixas
Exercicio 1
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ purrr 1.0.2
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
passe = data.frame(terco_final = br_2024$`1/3`,
jogador=br_2024$Jogador,
equipe=br_2024$Equipe,
posicao=br_2024$Pos.,
partidas=br_2024$`90s`,
passe_por_partida=br_2024$`1/3`/br_2024$`90s`)
view(passe)
summary(passe$partidas)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 2.60 9.50 11.46 18.15 38.00 1
#help - descobrindo que o pacote faz
?dplyr
## inicializando servidor httpd de ajuda ... concluído
#Amplitude
length(passe$partidas)
## [1] 728
#No filtro removido os NAs e a posição de Goleiro
passe <- passe %>%
filter(!is.na(terco_final), !is.na(jogador), !is.na(equipe), !is.na(posicao), posicao!='G', terco_final>=100)
summary(passe$terco_final)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 100.0 111.5 125.0 133.6 144.5 255.0
view(passe)
max = max(passe$terco_final) # ponto maximo
min = min(passe$terco_final) # ponto minimo
Amplitude = max - min # a subtração dos pontos em questão.
Amplitude # resultado da Estatistica.
## [1] 155
#Variância
media = mean(passe$terco_final)
media
## [1] 133.5818
variancia = var(passe$terco_final)
variancia
## [1] 997.3219
#desvio_padrao
desvio_padrao = sd(passe$terco_final)
desvio_padrao
## [1] 31.5804
#coeficiente de variação
cv = (desvio_padrao/media)*100
cv
## [1] 23.64124
hist(passe$terco_final)
summary(passe$terco_final)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 100.0 111.5 125.0 133.6 144.5 255.0
Amplitude: Estudo de passes no terço final dO campeonato brasileiro de 2024. Tem amplitude de 255, sendo o igual ao valor máximo, pois nesse caso o valor minimo é zero.
assimetria <- function(x) {
n <- length(x) # quantidade total de registros
media <- mean(x) # media
desvio_padrao <- sd(x) # desvio padrão
soma <- sum((x - media)^3) / n # soma das diferenças elevadas ao cubo
skewness <- soma / (desvio_padrao^3) # formula da assimetria
return(skewness)
}
dados <- c(10, 12, 14, 18, 20, 30)
assimetria(passe$terco_final)
## [1] 1.848614
#install.packages("moments")
library(moments)
curtose <- kurtosis(passe$terco_final)
print(curtose)
## [1] 6.775621
1.1 Preferi usar a variável passe por partida, ao inves da variável terço final, pois ela leva em consideração o número de jogos que cada atleta realizou. Através do Dataframe foi criada a variável usando a divisão do terço final pelo numero de 90 minutos inteiros jogados.
1.2 Eixo X = Passe por partida e Eixo Y = Distribuição na amostra
plot(passe$passe_por_partida) #Distribuição