colnames(dados_archive_2_)[3]<-"Idade"colnames(dados_archive_2_)[1]<-"Jogador"colnames(dados_archive_2_)[2]<-"Posição"colnames(dados_archive_2_)[4]<-"Time"colnames(dados_archive_2_)[7]<-"Minutos Jogados pelo jogador"colnames(dados_archive_2_)[29]<-"Pontos Marcados pelo Jogador"colnames(dados_archive_2_)[5]<-"Partidas Jogadas pelo jogador"colnames(dados_archive_2_)[6]<-"Partidas iniciadas pelo jogador"colnames(dados_archive_2_)[8]<-"Número de arremessos(cestas) pelo jogador"colnames(dados_archive_2_)[9]<-"Número de tentativas de arremessos (cestas) pelo jogador"colnames(dados_archive_2_)[11]<-"Número de assistências"colnames(dados_archive_2_)[10]<-"Número de rebotes pelo jogador"colnames(dados_archive_2_)[25]<-"Número de Roubadas de bola feitas pelo jogador"
Transformando em fator
str(dados_archive_2_)
tibble [696 × 29] (S3: tbl_df/tbl/data.frame)
$ Jogador : chr [1:696] "Precious Achiuwa" "Steven Adams" "Bam Adebayo" "Ochai Agbaji" ...
$ Posição : chr [1:696] "C" "C" "C" "SG" ...
$ Idade : num [1:696] 23 29 25 22 22 24 24 24 27 24 ...
$ Time : chr [1:696] "TOR" "MEM" "MIA" "UTA" ...
$ Partidas Jogadas pelo jogador : num [1:696] 55 42 75 59 77 59 36 23 72 68 ...
$ Partidas iniciadas pelo jogador : num [1:696] 12 42 75 22 20 3 3 0 70 68 ...
$ Minutos Jogados pelo jogador : num [1:696] 20.7 27 34.6 20.5 21.8 15 14.7 15.5 27.4 32.6 ...
$ Número de arremessos(cestas) pelo jogador : num [1:696] 3.6 3.7 8 2.8 3.2 2.2 2.3 2.1 3.4 5.9 ...
$ Número de tentativas de arremessos (cestas) pelo jogador: num [1:696] 7.3 6.3 14.9 6.5 6.8 5 4.7 5.4 7.7 9.2 ...
$ Número de rebotes pelo jogador : num [1:696] 0.485 0.597 0.54 0.427 0.47 0.444 0.488 0.384 0.44 0.644 ...
$ Número de assistências : num [1:696] 0.5 0 0 1.4 1.2 1 1 1.1 2 0 ...
$ 3PA : num [1:696] 2 0 0.2 3.9 3.5 2.7 2.4 3.1 5.1 0.1 ...
$ 3P% : num [1:696] 0.269 0 0.083 0.355 0.353 0.384 0.402 0.361 0.399 0.1 ...
$ 2P : num [1:696] 3 3.7 8 1.4 2 1.2 1.3 1 1.4 5.9 ...
$ 2PA : num [1:696] 5.4 6.2 14.7 2.7 3.4 2.3 2.3 2.3 2.7 9.1 ...
$ 2P% : num [1:696] 0.564 0.599 0.545 0.532 0.591 0.515 0.578 0.415 0.518 0.653 ...
$ eFG% : num [1:696] 0.521 0.597 0.541 0.532 0.56 0.547 0.591 0.488 0.571 0.645 ...
$ FT : num [1:696] 1.6 1.1 4.3 0.9 1.4 0.7 0.8 0.6 1.6 2.4 ...
$ FTA : num [1:696] 2.3 3.1 5.4 1.2 1.9 1 1.1 0.9 1.8 3.3 ...
$ FT% : num [1:696] 0.702 0.364 0.806 0.812 0.75 0.667 0.692 0.619 0.905 0.733 ...
$ ORB : num [1:696] 1.8 5.1 2.5 0.7 1.1 0.3 0.2 0.3 0.8 3.3 ...
$ DRB : num [1:696] 4.1 6.5 6.7 1.3 3.7 1.5 1.4 1.5 2.4 6.5 ...
$ TRB : num [1:696] 6 11.5 9.2 2.1 4.8 1.7 1.6 1.8 3.3 9.8 ...
$ AST : num [1:696] 0.9 2.3 3.2 1.1 1.3 1.8 2.1 1.4 2.3 1.7 ...
$ Número de Roubadas de bola feitas pelo jogador : num [1:696] 0.6 0.9 1.2 0.3 0.6 0.5 0.7 0.3 0.9 0.8 ...
$ BLK : num [1:696] 0.5 1.1 0.8 0.3 0.6 0.4 0.4 0.3 0.2 1.2 ...
$ TOV : num [1:696] 1.1 1.9 2.5 0.7 0.8 0.9 1.3 0.4 1 1.4 ...
$ PF : num [1:696] 1.9 2.3 2.8 1.7 1.9 1.5 1.6 1.3 1.6 2.3 ...
$ Pontos Marcados pelo Jogador : num [1:696] 9.2 8.6 20.4 7.9 9 6.2 6.3 5.9 10.4 14.3 ...
Warning: package 'summarytools' was built under R version 4.2.3
QUANTI x QUALI
a) Pontos Marcados X Posição
Existe relação entre os pontos marcados e a posição do jogador ?
Foi utilizado para essa relação um gráfico Boxplot. Em relação à posição de pivô, o 1º quartil ficou entre 4 a 6 pontos marcados, sua mediana foi um valor aproximado de 7, e o seu terceiro quartil se estende até 11 pontos aproximadamente, seu bigode foi de 11 a 21 pontos, e houve a presença de um outlier acima de 30 pontos.
Em relação à posição de ala pivô, seu 1º quartil se inicia nos 5 pontos, sua mediana está aproximadamente em 6 pontos, seu 3º quartil se estende até 12 pontos aproximadamente, seu limite superior se estende um pouco acima de 20 pontos e há a presença de outliers acima de 30 pontos. Em relação à posição de armador, seu 1º quartil se inicia aos 5 pontos, sua mediana se aproximou de 9 pontos, eu terceiro quartil se estendeu até 15 pontos, seu limite superior se estende até 29 pontos, e há a presença de outliers um pouco acima de 30 pontos.
Em relação à posição ala, seu 1º quartil se inicia em 5 pontos, sua mediana se dá aproximadamente a 6 pontos, seu 3º quartil atinge aproximadamente 12 pontos, seu limite superior se estende até 23 pontos, e há a presença de outliers até 30 pontos.
Em relação à posição ala armador, seu 1º quartil se inicia aos 5 pontos, sua mediana atinge 3 pontos, seu 3º quartil atinge aproximadamente 12 pontos, seu limite superior é de um pouco mais de 20 pontos, e há outliers até 28 pontos. Todos os limites inferiores marcaram abaixo de 5 pontos.
Em comparação aos 1º quartis, todas as posições marcaram de 0 a 5 pontos, com exceção do pivô, que marcou abaixo de 0 a 4 pontos.
Em comparação às suas medianas, o armador foi a posição que conseguiu uma mediana mais alta, as posições ala pivô, ala e ala armador obtiveram medianas semelhantes, marcando quase o mesmo número de pontos, e o pivô obteve a menor mediana, indicando a posição com menos pontos marcados. O armador foi a posição que obteve a maior amplitude de pontos, pois seu IQR é o maior, enquanto as outras posições obtiveram amplitude semelhante.
Em relação ao limite superior, o armador também foi a posição que obteve o valor máximo de pontos maior em relação a todos os outros, o ala-pivô, ala e ala armador obtiveram valores próximos de máximo de pontos, e o pivô foi a posição com menor número de pontos.
Em relação aos outliers, o pivô obteve um valor inesperado acima de 30 pontos, o que se torna muito discrepante. O ala-pivô, armador e ala obtiveram valores discrepantes variando de 30 a 32 pontos, enquanto o ala-armador teve o menor valor discrepante, aproximadamente 28 pontos máximos.
Montando o Gráfico
library(dplyr)
Warning: package 'dplyr' was built under R version 4.2.3
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(ggplot2)
Warning: package 'ggplot2' was built under R version 4.2.3
library(dplyr)library(ggplot2)dados_archive_2_ %>%filter(Posição %in%c("Pivô", "Ala pivô", "Armador", "Ala", "Ala armador")) %>%ggplot() +aes(x = Posição, y =`Pontos Marcados pelo Jogador`) +geom_boxplot(fill ="#FF69B4") +labs(x ="Posição do jogador", y ="Pontos marcados", title ="Pontos marcados em relação à posição do jogador ") +theme_minimal() +theme(plot.title =element_text(size = 18L, face ="bold", hjust =0.5), axis.title.y =element_text(size = 14L, face ="bold.italic"), axis.title.x =element_text(size = 14L, face ="bold.italic"))
library(summarytools)with(dados_archive_2_, stby(`Pontos Marcados pelo Jogador`, Posição, descr))
Descriptive Statistics
Pontos Marcados pelo Jogador by Posição
Data Frame: dados_archive_2_
N: 123
Pivô Ala pivô Armador Ala Ala armador
----------------- -------- ---------- --------- -------- -------------
Mean 7.82 9.72 10.97 9.26 9.25
Std.Dev 5.68 7.10 7.65 6.06 6.23
Min 0.90 1.30 1.20 0.90 1.00
Q1 3.80 4.90 5.20 4.70 4.80
Median 6.10 7.85 8.90 7.60 7.80
Q3 10.80 12.00 15.30 12.10 11.50
Max 33.10 31.10 32.40 30.10 28.30
MAD 4.00 4.74 6.60 5.04 4.60
IQR 6.80 6.70 9.98 7.40 6.70
CV 0.73 0.73 0.70 0.65 0.67
Skewness 1.62 1.29 0.97 1.16 1.14
SE.Skewness 0.22 0.22 0.23 0.22 0.20
Kurtosis 3.12 0.90 0.21 1.00 0.77
N.Valid 123.00 116.00 106.00 117.00 153.00
Pct.Valid 100.00 100.00 100.00 100.00 100.00
b) Número de Tentativas de arremessos (CESTAS) X Posição
Existe relação entre as tentativas de arremesso (cestas)e a posição do jogador?
O gráfico utilizado para analisar esse tipo de relação foi o gráfico Boxplot onde todos apresentaram assimetria positiva. Em relação a posição Pivô, o 1° quartil ficou entre de 3 e 4 tentativas de arremessos, sua mediana em aproximadamente 4 e o 3° quartil entre 4 e 7. Há a presença de outliers em 15, 16, 17 e 20. Na posição Ala Pivô, o 1° quartil ficou entre 3 e 6 tentativas, a mediana ficou em 6 tentativas e o 3° quartil entre 6 e 10 tentativas. Há a presença de dois outliers acima de 20 tentativas. Na posição Armador, o 1° quartil ficou entre 4 e 8 tentativas, a mediana ficou em 8 tentativas e o 3° quartil entre 8 e 12 tentativas. Há a presença de um outlier aproxamado de 22 tentativas. Na posição Ala, o 1° quartil ficou entre 4 e 7 tentativas, a mediana ficou em 7 tentativas e o 3° quartil entre 7 e 9 tentativas. Há a presença de seis outliers acima de 15 tentativas. A posição ala armador apresentou caracteristicas muito semehantes a da posição Ala, tendo seu 1° quartil também entre 4 e 7 tentativas, sua mediana também em 7 tentativas e seu 3° quartil também entre 7 e 9 tentativas. A maior divergencia foi na presença de 8 outliers entre 15 e 20 tentativas, e um outlier acima de 20 tentativas. Todos os limites inferiores marcaram abaixo de 5 tentativas, entretanto, os limites superiores fora: Pivô: Entre 10 e 15 tentativas; Ala pivô: entre 15 e 20 tentativas; Armador: acima de 20 tentativas; Ala: entre 15 e 20 tentativas; Ala armador: entre 15 e 20 tentativas.
Montando o Gráfico
library(dplyr)library(ggplot2)library(dplyr)library(ggplot2)dados_archive_2_ %>%filter(Posição %in%c("Pivô", "Ala pivô", "Armador", "Ala", "Ala armador")) %>%ggplot() +aes(x = Posição, y =`Número de tentativas de arremessos (cestas) pelo jogador`) +geom_boxplot(fill ="#9477EB") +labs(x ="Posição do Jogador", y ="Tentativas de arremessos ", title ="Tentativas de arremessos em relação à posição do jogador") +theme_minimal() +theme(plot.title =element_text(size = 18L, face ="bold.italic", hjust =0.5), axis.title.y =element_text(size = 14L, face ="bold.italic"), axis.title.x =element_text(size = 14L, face ="bold.italic"))
library(summarytools)with(dados_archive_2_, stby(`Número de tentativas de arremessos (cestas) pelo jogador`,Posição, descr))
Descriptive Statistics
Número de tentativas de arremessos (cestas) pelo jogador by Posição
Data Frame: dados_archive_2_
N: 123
Pivô Ala pivô Armador Ala Ala armador
----------------- -------- ---------- --------- -------- -------------
Mean 5.51 7.41 8.80 7.46 7.47
Std.Dev 3.76 4.81 5.41 4.53 4.74
Min 1.00 1.10 1.30 0.90 0.50
Q1 2.90 3.70 4.60 4.10 4.00
Median 4.30 6.30 8.15 6.30 6.40
Q3 7.50 9.90 11.30 9.30 9.40
Max 20.10 22.20 22.00 21.10 20.60
MAD 2.82 4.00 5.19 3.71 4.15
IQR 4.60 6.20 6.68 5.20 5.40
CV 0.68 0.65 0.61 0.61 0.63
Skewness 1.41 1.07 0.69 1.05 1.03
SE.Skewness 0.22 0.22 0.23 0.22 0.20
Kurtosis 1.76 0.39 -0.49 0.52 0.39
N.Valid 123.00 116.00 106.00 117.00 153.00
Pct.Valid 100.00 100.00 100.00 100.00 100.00
QUANTI X QUANTI
a) Número de cestas X Número de Jogos
Qual a relação entre o número de jogos e a quantidade de cestas feitas pelos jogadores?
O gráfico utilizado para analisar esse tipo de relação foi o gráfico de dispersão, afim de entender se existia alguma correlação entre as partidas jogadas e os números de cestas, se elas aumentavam ou diminuiam paralelamente. Foi possivel notar uma assimetria possitiva/à direita, com um coeficiente de correlação por volta de 0,30, caracterizando uma relação fraca. Ainda que dispersos, o número de cestas se concentrou em até 5, sendo a partir disso ainda mais disperso.
library(ggplot2)library(ggplot2)library(ggplot2)ggplot(dados_archive_2_) +aes(x =`Partidas Jogadas pelo jogador`, y =`Número de arremessos(cestas) pelo jogador`) +geom_point(shape ="circle", size =1.5, colour ="#5E2010") +geom_smooth(span = 1L) +labs(x ="Partidas Jogadas", y ="Número de Cestas", title ="Relação entre o número de cestas e as partidas jogadas") +theme_minimal() +theme(plot.title =element_text(size = 18L, face ="bold.italic", hjust =0.5), axis.title.y =element_text(size = 14L, face ="bold.italic"), axis.title.x =element_text(size = 14L, face ="bold.italic"))
`geom_smooth()` using method = 'loess' and formula = 'y ~ x'
b) Número de cestas X Tentativas de arremesso
Existe relação entre o número de cestas e tentativas de arremesso?
Foi utilizado um gráfico de dispersão para analisar se o número de cestas aumentava ou diminuía conforme o número de tentativas de arremessos ia aumentando. No gráfico notou-se uma assimetria positiva e um coeficiente de variação de aproximadamente 0,8, o que caracteriza se caracteriza forte. Foi visto também que quanto maior a tentativa de arremessos, maior a quantidade de cestas. É perceptível que o maior número de cestas se concentrou quando a tentativa de arremessos variava entre 1 a 10 tentativas.
library(ggplot2)library(ggplot2)ggplot(dados_archive_2_) +aes(x =`Número de tentativas de arremessos (cestas) pelo jogador`, y =`Número de arremessos(cestas) pelo jogador`) +geom_point(shape ="circle", size =1.5, colour ="#5E2010") +geom_smooth(span = 1L) +labs(x ="Tentativas de arremesso ", y ="Número de cestas ( pontos marcados)", title ="Número de cestas e tentativas de arremesso") +theme_minimal() +theme(plot.title =element_text(size = 18L, face ="bold.italic", hjust =0.5), axis.title.y =element_text(size = 14L, face ="bold.italic"), axis.title.x =element_text(size = 14L, face ="bold.italic"))
`geom_smooth()` using method = 'loess' and formula = 'y ~ x'
QUALI X QUALI
Quais posições atingiram uma maior faixa de pontuação?
Esta relação foi analisada através do gráfico de barras múltiplas, as duas categorias são apresentadas por barras. Em relação à posição de Pivô, a Faixa de pontuação de até 16 pontos ultrapassa à 125, já na classe mais que 16 pontos e menos 34, chega à aproximadamente 10. Em relação à Ala Pivô, a até 16 pontos a faixa é de aproximadamente 100, mais que 16 e menos de 34 chega a aproximadamente 15.
Em relação à posição de de Armador, a Faixa de até 16 pontos está entre 90 e 100, na faixa de mais que 16 pontos e menos que 34 chega a aproximadamente 15.
Em relação à posição Ala a faixa de pontuação de até 16 pontos ultrapassa 100 e menor que 120, na faixa de mais que 16 pontos e menos que 34 é entre 10 e 15.
Em relação à posição de Ala Armador a faixa de pontuação de até 16 pontos é de aproximadamente 140, enquanto a faixa de pontuação mais que 16 pontos e menos que 34 é aproximadamente 15.
Criando uma variável
dados_archive_2_$Faixa_de_Pontos <-cut(dados_archive_2_$`Pontos Marcados pelo Jogador`,c(0, 16, 34))levels(dados_archive_2_$Faixa_de_Pontos)
[1] "(0,16]" "(16,34]"
levels(dados_archive_2_$Faixa_de_Pontos) <-c("Até 16 pontos", "Mais que 16 pontos e menos que 34")
Cross-Tabulation, Row Proportions
Posição * Faixa_de_Pontos
Data Frame: dados_archive_2_
------------- ----------------- --------------- ----------------------------------- --------------
Faixa_de_Pontos Até 16 pontos Mais que 16 pontos e menos que 34 Total
Posição
Pivô 112 (91.1%) 11 ( 8.9%) 123 (100.0%)
Ala pivô 96 (82.8%) 20 (17.2%) 116 (100.0%)
Armador 83 (78.3%) 23 (21.7%) 106 (100.0%)
Ala 102 (87.2%) 15 (12.8%) 117 (100.0%)
Ala armador 130 (85.0%) 23 (15.0%) 153 (100.0%)
Total 523 (85.0%) 92 (15.0%) 615 (100.0%)
------------- ----------------- --------------- ----------------------------------- --------------
library(ggplot2)ggplot(dados_archive_2_) +aes(x = Posição, fill = Faixa_de_Pontos) +geom_bar(position ="fill") +scale_fill_manual(values =c(`Até 16 pontos`="#AC4DBC", `Mais que 16 pontos e menos que 34`="#FFB9E4")) +labs(x ="Posição", y =" ", title ="Relação da faixa de pontuação do jogador com sua posição", fill ="Faixa de Pontuação") +theme_minimal() +theme(plot.title =element_text(size = 13L, face ="bold", hjust =0.5), axis.title.x =element_text(size = 12L, face ="bold.italic"))