CESTA DE DADOS: Explorando as estatísticas dos melhores jogadores da NBA

Author

Ana Paula da Silva Costa, Carolina Alves Barcellos, Esther Fernandes da Rocha, Mariana Guida Lopes e Melissa Vieira Rocha.

RESUMO


O trabalho aborda o basquete, modalidade esportiva, criada em 1891 por James Naismith , que possui popularidade a nível global, especialmente por meio da NBA (National Basketball Association), fundada em 1946. O objetivo foi analisar os dados dos melhores jogadores da NBA, destacando algumas de suas características como pontos marcados, esforço de arremesso, número de jogos e posições em quadra. A metodologia utiliza dados do Kaggle, uma plataforma de dados, e inclui variáveis como posição, tentativa de arremesso, número de jogos, pontos marcados e faixa de pontuação. A análise é realizada por meio de gráficos, como o Boxplot, dispersão, barras empilhadas e tabelas, buscando relações entre as variáveis analisadas. Alguns testes estatísticos como o de Shapiro-Wilk, Kruskal-Wallis, Spearman e Qui-quadrado são aplicados, sempre utilizando uma significância de 0,05. Ao se falar dos resultados, eles revelam uma compreensão sobre a distribuição de pontos por posição, tentativas de arremesso (cestas) relacionado à posição do jogador, correlações entre número de jogos e cestas, e a influência da posição na faixa de pontuação atingida. Logo, é compreendida uma visão mais detalhada das estatísticas dos jogadores da NBA, contribuindo para uma análise mais profunda do desempenho no esporte.

1.INTRODUÇÃO


O basquete é um esporte de alto rendimento físico que exige dos jogadores uma grande agilidade, e na maioria dos casos, uma grande estatura [1]. Essa modalidade foi criada em 1891 por um professor canadense chamado James Naismith, com a finalidade de entreter os alunos durante o inverno de Massachusetts, ele desenvolveu 13 regras básicas para que o jogo acontecesse e pendurou cestas de pêssego em uma estaca para que os pontos fossem contabilizados, e a partir dali definiu as posições de cada jogador.

Dentre as posições, estão presentes o Armador (responsável por pensar pela equipe e organizar as jogadas, ele faz a transição da bola entre a defesa e o ataque do time, normalmente é o jogador de menor estatura), o Ala Armador (responsável por ajudar o armador se infiltrando no time adversário, além de receber o contra-ataque para a cesta e impedir o avanço do outro, normalmente é o jogador de mais agilidade e com maior velocidade), o Ala (posicionado na lateral da quadra, exerce várias funções como o contra-ataque e o rebote, porém sua maior característica são as cestas de longas distâncias), o Ala Pivô (é o jogador que fica responsável pelo bloqueio do adversário, normalmente são escolhidos mediante à sua força física e altura por estarem ao lado da cesta de seu time), e o Pivô (o jogador que fica posicionado no centro da quadra, protegem o garrafão e são escolhidos mediante à sua altura pois são responsáveis pelo rebote) [2].

Desde então, o basquete se tornou um dos esportes mais populares do mundo,e foi incluído nas Olimpíadas em 1936. | | A NBA é a maior e mais importante liga de basquete do mundo, fundada em 1946 na cidade de Nova York. Inicialmente conhecida como BAA (Associação de Basquete da América), a liga tinha 11 equipes e passou a se chamar NBA após a fusão com a NBL (Liga Nacional de Basquete) [3]. Nomes importantes como Michael Jordan, LeBron James e Kobe Bryant participaram e ganharam várias disputas, se tornando atletas reconhecidos em todo mundo e, principalmente, entre os amantes do esporte. [4]

1.1. OBJETIVO GERAL


Nosso objetivo nesse trabalho é analisar os dados dos melhores jogadores da NBA e traçar uma relação entre suas características mais marcantes em campo.

1.1.1. Objetivos específicos:

Analisar se existe relação entre os pontos marcados e a posição do jogador;

Avaliar qual a a relação entre as tentativas de arremesso (cestas) e a posição do jogador;

Investigar a relação entre o número de jogos e a quantidade de cestas feitas pelo jogador;

Averiguar se existe relação entre o número de cestas e tentativas de arremesso;

Verificar qual é a relação entre as posições e as faixas de pontuação atingidas.

2. METODOLOGIA


O seguinte estudo foi realizado utilizando os dados disponíveis no banco de dados do website Kaggle (https://www.kaggle.com/datasets/joebeachcapital/nba-player-statistics) com o tema NBA Player Statistics (Estatísticas dos Jogadores da NBA). O conjunto de dados utilizado continha 30 linhas e 6 variáveis, com pelo menos duas variáveis qualitativas e duas quantitativas. Das 29 variáveis disponíveis, foram selecionadas cinco para a análise: posição, tentativas de arremesso (cestas), número de jogos, quantidade de cestas (pontos) marcados e faixa de pontuação atingida.

Das 29 variáveis, 5 foram escolhidas para a análise: posição, tentativas de arremesso (cestas), número de jogos, quantidade de cestas (pontos) marcados e faixa de pontuação atingida. Para a variável qualitativa posição foram consideradas as categorias Pivô, Ala pivô, Armador, Ala e Ala armador e para a variável quantitativa Faixa de pontos foi considerado os valores até 16 pontos e valores maiores que 16 e menores que 34. Para a variável qualitativa “posição”, foram consideradas as categorias Pivô, Ala pivô, Armador, Ala e Ala-armador. Já para a variável quantitativa “faixa de pontos”, foram considerados valores até 16 pontos e valores maiores que 16 e menores que 34.

Após a coleta dos dados e seleção das variáveis, foram gerados gráficos utilizando o software R Studio na versão 4.3.1. Foram elaborados cinco gráficos: dois Boxplot (gráficos 1 e 2), dois gráficos de dispersão (gráficos 3 e 4) e um gráfico de barras empilhadas (gráfico 5). O Boxplot (gráfico 1) foi utilizado para analisar a relação entre as variáveis “pontos marcados” e “posição” dos jogadores. Já o segundo Boxplot gerado (gráfico 2) foi utilizado para analisar a relação entre as variáveis “tentativas de arremesso” (cestas) e “posição” dos jogadores. O gráfico de dispersão (gráfico 3) foi utilizado para analisar a correlação entre o número de jogos e a quantidade de cestas realizadas pelos jogadores. Novamente, o gráfico de dispersão (gráfico 4) foi utilizado para analisar a correlação entre a quantidade de cestas realizadas e as tentativas de arremesso. Por fim, o gráfico de barras empilhadas foi utilizado para analisar a associação entre as variáveis “posição” e “faixa de pontuação”.

Além disso, foram criadas tabelas: Tabela 1, que continha todos os dados dos jogadores, incluindo posição, idade, partidas jogadas, número de arremessos feitos, número de tentativas de arremessos, pontos marcados e faixas de pontos. Tabela 2, que continha os dados utilizados na análise do primeiro gráfico. Tabela 3, que continha os dados utilizados na análise do segundo gráfico; e Tabela 4, que mostrava os dados obtidos no quarto gráfico.

Para complementar a análise dos dados, foram realizados testes estatísticos. O teste de Shapiro-Wilk foi utilizado para avaliar a normalidade dos dados. O teste de Kruskal-Wallis, juntamente com o post-hoc de Dunn, foi utilizado para avaliar a significância estatística das diferenças. O teste de Spearman foi utilizado para avaliar a correlação entre as variáveis quantitativas. E o teste Qui-quadrado foi utilizado para avaliar a associação entre duas variáveis qualitativas independentes. Em todos os testes estatísticos realizados, foi adotado um nível de significância de 0,05.

Após a aplicação dos testes, foi utilizada a regressão logística para análise dos dados.

3.RESULTADOS E DISCUSSÕES

TABELA SOBRE OS DADOS


Podemos observar que foi registrado 615 jogadores, que atuam em 5 posições, 20% atuam na posição de Pivô, 19% na posição de Ala pivô, 17% na posição Armador, 19% atuam na posição Ala e 25% na posição Ala Armador.

A faixa etária dos jogadores é entre, 23 e 29 anos, com uma média de 25 anos.

Em times, a variável é politômica, com 31 categorias. A categoria que possui a maior porcentagem de jogadores é a categoria que o jogador atua em mais de um time por temporada, conhecido na liga como (TOT) com 9.3% é o time que possui a menor é o New York Knicks (NYK) com 2.3%. O número de partidas jogadas pelo jogador está entre 25 e 67 partidas, com a média de 48 partidas jogadas.

O número de arremessos (cestas) pelo jogador é entre 1.70 e 4.50, com uma média de 2.70 e o número de tentativas de arremessos (cestas) pelo jogador é entre 3.6 e 9.7, com a média 6.0 de tentativas. Os pontos marcados é entre 5 e 12, com a média de 7 pontos.

A faixa de pontos até 16 pontos é de 85% e mais que 16 pontos e menos de 34 é de 15%.

Com isso, abaixo visualizaremos para analisar em tabela os dados dos jogadores da NBA:

TABELA 1

TABELA 1. DADOS DOS JOGADORES DA NBA
DADOS N = 6151
Posição
    Pivô 123 (20%)
    Ala pivô 116 (19%)
    Armador 106 (17%)
    Ala 117 (19%)
    Ala armador 153 (25%)
Idade 25.0 (23.0, 29.0)
Partidas Jogadas pelo jogador 48 (25, 67)
Número de arremessos(cestas) pelo jogador 2.70 (1.70, 4.50)
Número de tentativas de arremessos (cestas) pelo jogador 6.0 (3.6, 9.7)
Pontos Marcados pelo Jogador 7 (5, 12)
Faixa de Pontos
    Até 16 pontos 523 (85%)
    Mais que 16 pontos e menos que 34 92 (15%)
1 n (%); Median (IQR)

Existe diferença dos pontos marcados em relação à posição do jogador?


Pontos Marcados X Posição

Utilizando o gráfico de boxplot para analisar se há relação entre o número de pontos marcados e a posição do jogador, foram possíveis observar os seguintes dados:

Em relação à mediana, o Armador foi a posição que obteve a maior pontuação (8.90), seguido do Ala Pivô (7.85), Ala Armador (7.80), Ala (7.60) e Pivô (6.10).

Em relação à amplitude e aos quartis, o Armador também foi a posição que obteve a maior amplitude, atingindo 9.98 pontos, seguido das posições de Ala (7.40), Pivô (6.80), enquanto as posições de Ala Pivô e Ala Armador obtiveram a mesma amplitude de pontos (6.70).

Em relação à presença de Outliers, todas as posições obtiveram aparição de jogadores com um desempenho fora da curva, sendo a posição de Pivô a categoria com a presença do maior outlier (33.1), seguido do Armador (32.4), Ala Pivô (31.1), Ala (30.1), Ala Armador (28.6).

GRÁFICO 1

TABELA 2

Descriptive Statistics  
Pontos Marcados pelo Jogador by Posição  
Data Frame: dados_archive_2_  
N: 123  

                      Pivô   Ala pivô   Armador      Ala   Ala armador
----------------- -------- ---------- --------- -------- -------------
             Mean     7.82       9.72     10.97     9.26          9.25
          Std.Dev     5.68       7.10      7.65     6.06          6.23
              Min     0.90       1.30      1.20     0.90          1.00
               Q1     3.80       4.90      5.20     4.70          4.80
           Median     6.10       7.85      8.90     7.60          7.80
               Q3    10.80      12.00     15.30    12.10         11.50
              Max    33.10      31.10     32.40    30.10         28.30
              MAD     4.00       4.74      6.60     5.04          4.60
              IQR     6.80       6.70      9.98     7.40          6.70
               CV     0.73       0.73      0.70     0.65          0.67
         Skewness     1.62       1.29      0.97     1.16          1.14
      SE.Skewness     0.22       0.22      0.23     0.22          0.20
         Kurtosis     3.12       0.90      0.21     1.00          0.77
          N.Valid   123.00     116.00    106.00   117.00        153.00
        Pct.Valid   100.00     100.00    100.00   100.00        100.00

TESTE DE HIPÓTESE

O primeiro gráfico trata da relação entre duas variáveis distintas com mais de 3 grupos independentes , logo há três possibilidades de análise: ANOVA,ANOVA COM WELCH e teste de Kruskal-Wallis.

Verificando a normalidade dos 5 grupos da variável Posição:


    Shapiro-Wilk normality test

data:  dados_archive_2_$`Pontos Marcados pelo Jogador`[dados_archive_2_$Posição == "Pivô"]
W = 0.84928, p-value = 7.399e-10

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Pontos Marcados pelo Jogador`[dados_archive_2_$Posição == "Ala pivô"]
W = 0.85571, p-value = 2.956e-09

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Pontos Marcados pelo Jogador`[dados_archive_2_$Posição == "Armador"]
W = 0.90788, p-value = 1.886e-06

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Pontos Marcados pelo Jogador`[dados_archive_2_$Posição == "Ala"]
W = 0.902, p-value = 3.302e-07

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Pontos Marcados pelo Jogador`[dados_archive_2_$Posição == "Ala armador"]
W = 0.89633, p-value = 6.365e-09

Aplicando o teste de Kruskal-Wallis:


    Kruskal-Wallis rank sum test

data:  Pontos Marcados pelo Jogador by Posição
Kruskal-Wallis chi-squared = 12.135, df = 4, p-value = 0.01637

Aplicando o test post-hoc de Dunn


  Dunnett's test for comparing several treatments with a control :  
    95% family-wise confidence level

$Pivô
                     diff     lwr.ci   upr.ci   pval    
Ala pivô-Pivô    1.901177 -0.1686036 3.970958 0.0823 .  
Armador-Pivô     3.149356  1.0299249 5.268787 0.0011 ** 
Ala-Pivô         1.444590 -0.6206335 3.509814 0.2559    
Ala armador-Pivô 1.435390 -0.5013143 3.372094 0.2110    

---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Existe relação entre o número de tentativas de arremessos (CESTAS) e a posição do jogador?


Para analisar se há relação entre as tentativas de arremessos com a posição do jogador, foi utilizado um gráfico de boxplot, onde foi possível encontrar os dados abaixo.

Quanto a mediana, a posição Armador obteve maior tentativas de arremessos (8.15), seguido da posição Ala Armador (6.40), em terceiro lugar, as posições Ala e Ala Pivô empataram na mediana dos números de tentativas (6.30), e por ultimo, a posição Pivô (4.30). Já na amplitude, a posição Armador também se destacou com a maior amplitude (6.68), seguida das posições Ala Pivô (6.20), Ala Armador (5.40), Ala (5.20) e por último novamente, a posição Pivô (4.60). Em todas as posições analisadas foi possiel observar a presença de outliers, ou seja, jogadores de determinadas posições com números de tentativas de arremessos discrepantes dos demais, sendo o maior deles a posição Ala Pivô (22.20), seguida das posições Armador (22.00), Ala (21.10), Ala Armador (20.60), e como nas outras medidas, por último a posição Pivô (20.10).

GRÁFICO 2

TABELA 3

Descriptive Statistics  
Número de tentativas de arremessos (cestas) pelo jogador by Posição  
Data Frame: dados_archive_2_  
N: 123  

                      Pivô   Ala pivô   Armador      Ala   Ala armador
----------------- -------- ---------- --------- -------- -------------
             Mean     5.51       7.41      8.80     7.46          7.47
          Std.Dev     3.76       4.81      5.41     4.53          4.74
              Min     1.00       1.10      1.30     0.90          0.50
               Q1     2.90       3.70      4.60     4.10          4.00
           Median     4.30       6.30      8.15     6.30          6.40
               Q3     7.50       9.90     11.30     9.30          9.40
              Max    20.10      22.20     22.00    21.10         20.60
              MAD     2.82       4.00      5.19     3.71          4.15
              IQR     4.60       6.20      6.68     5.20          5.40
               CV     0.68       0.65      0.61     0.61          0.63
         Skewness     1.41       1.07      0.69     1.05          1.03
      SE.Skewness     0.22       0.22      0.23     0.22          0.20
         Kurtosis     1.76       0.39     -0.49     0.52          0.39
          N.Valid   123.00     116.00    106.00   117.00        153.00
        Pct.Valid   100.00     100.00    100.00   100.00        100.00

TESTE DE HIPÓTESE

Assim como o primeiro , segundo gráfico trata da relação entre duas variáveis distintas com mais de 3 grupos independentes , logo há três possibilidades de análise: ANOVA,ANOVA COM WELCH e teste de Kruskal-Wallis.

Verificando a normalidade dos 5 grupos da variável Posição:


    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`[dados_archive_2_$Posição == "Pivô"]
W = 0.86143, p-value = 2.344e-09

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`[dados_archive_2_$Posição == "Ala pivô"]
W = 0.89346, p-value = 1.366e-07

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`[dados_archive_2_$Posição == "Armador"]
W = 0.92734, p-value = 2.106e-05

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`[dados_archive_2_$Posição == "Ala"]
W = 0.90767, p-value = 6.518e-07

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`[dados_archive_2_$Posição == "Ala armador"]
W = 0.9026, p-value = 1.446e-08

Aplicando o teste de Kruskal-Wallis


    Kruskal-Wallis rank sum test

data:  Número de tentativas de arremessos (cestas) pelo jogador by Posição
Kruskal-Wallis chi-squared = 30.893, df = 4, p-value = 3.219e-06

Aplicando o teste post-hoc de Dunn


 Dunn's test of multiple comparisons using rank sums : holm  

                     mean.rank.diff    pval    
Ala pivô-Pivô             77.736578  0.0051 ** 
Armador-Pivô             123.998696 1.4e-06 ***
Ala-Pivô                  86.708985  0.0013 ** 
Ala armador-Pivô          84.321856  0.0008 ***
Armador-Ala pivô          46.262118  0.3159    
Ala-Ala pivô               8.972406  1.0000    
Ala armador-Ala pivô       6.585277  1.0000    
Ala-Armador              -37.289711  0.4702    
Ala armador-Armador      -39.676841  0.3860    
Ala armador-Ala           -2.387129  1.0000    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Qual a relação entre o número de jogos e a quantidade de cestas feitas pelos jogadores?


Número de cestas X Número de Jogos

O gráfico utilizado para analisar esse tipo de relação foi o gráfico de dispersão para entender a relação entre o número de jogos e a quantidade de cestas feitas, se elas aumentavam ou diminuiam paralelamente. O desvio padrão do número de jogos foi de 24,7 e a sua variância de 611, já da quantidade de cestas, o desvio padrão foi de 2,36 e sua variância foi de 5,6. Dessa forma é possivel concluir que o número de cestas se concentram até 6 em relação a quantidade de partidas jogadas.

GRÁFICO 3

TESTE DE HIPÓTESE

Visto que ambas as variáveis apresentam -p < 0,001, conclui-se que não há normalidade, logo o teste correto a ser realizado é o teste de correlação de Spearman.

Onde: HO: não há correlação entre o número de cestas e o número de jogos.

H1: há correlação entre o número de cestas e o número de jogos.

Ao realizar o teste de correlação de Spearman, foi obtido um valor -p < 0,001, indicando haver uma correlação estatisticamente significativa entre as variáveis. O coeficiente de correlação rho = 0,52 indica que esta correlação é significativa porém fraca a moderada.

Verificando a normalidade das variáveis


    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de arremessos(cestas) pelo jogador`
W = 0.89377, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Partidas Jogadas pelo jogador`
W = 0.94445, p-value = 2.072e-14

Aplicando o teste de Spearman


    Spearman's rank correlation rho

data:  dados_archive_2_$`Número de arremessos(cestas) pelo jogador` and dados_archive_2_$`Partidas Jogadas pelo jogador`
S = 18573567, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.5209042 

Como é a relação entre o número de cestas e as tentativas de arremesso?

Número de cestas X Tentativas de arremesso

Para analisar se houve relação entre o número de cestas e as tentativas de arremesso, foi utilizado um gráfico de dispersão, e para chegar nos resultados é preciso calcular o coeficiente de variação, que se dá pela divisão do desvio padrão pela média, e o resultado é multiplicado por 100, assim, chegamos num valor percentual. Logo, o coeficiente de de variação do número de cestas é 26,6%, pois sua média está em 8,26 pontos e seu desvio padrão em 2,36 pontos. Já o coeficiente de variação das tentativas de arremesso está em 69,2%, pois sua média está em 6,92 pontos e seu desvio padrão em 4,79 pontos. Logo, é possível observar que quanto maior o número de tentativas de arremesso, maior o número de cestas feita.

GRÁFICO 4

TESTE DE HIPÓTESE

Visto que ambas as variáveis apresentam -p < 0,001, concui-se que não há normalidade, logo o teste correto a ser realizado é o teste de correlação de Spearman.

Onde: HO: não há correlação entre o número de cestas e as tentativas de arremesso.

H1: há correlação entre o número de cestas e as tentativas de arremesso.

Ao realizar o teste de correlação de Spearman, foi obtido um valor-p < 0,001, indicando haver uma correlação estatisticamente significativa entre as variáveis. O coeficiente de correlação rho = 0,97 indica que esta correlação é positiva e forte.

Verificando a normalidade:


    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de arremessos(cestas) pelo jogador`
W = 0.89377, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`
W = 0.90086, p-value < 2.2e-16

Aplicando o teste de Spearman


    Spearman's rank correlation rho

data:  dados_archive_2_$`Número de arremessos(cestas) pelo jogador` and dados_archive_2_$`Número de tentativas de arremessos (cestas) pelo jogador`
S = 1073300, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.9723148 

A posição interfere na faixa de pontuação do jogador?


Posição x Faixa de Pontos

O gráfico utilizado para analisar essa relação foi o gráfico de barras empilhadas. Tem as categorias representadas por barras que estão empilhadas, cada barra totaliza a frequência relativa de cada posição, representado entre 0% e 100%. Observando o gráfico podemos analisar que independente da posição, a maioria dos jogadores marcaram até 16 pontos, variando entre 78,3% que atuam na posição de Armador e 91,1% que são os jogadores que atuam na posição de pivô. Proporcionalmente, os jogadores que atuam como Pivô são os que menos marcam mais que 16 pontos e menos que 34, com 8,9%, já os jogadores da posição Armador são os que tem maior porcentagem, com 21,7%.

Os jogadores que atuam nas posições Ala Armador e Ala a porcentagem de pontos é bastante semelhante, mais que 16 pontos varia entre 85,0% e 87,2% respectivamente. Proporcionalmente, é na faixa de mais que 16 pontos e menos que 34, entre 15,0% e 12,8%.

Logo, as três posições que se destacam nessa relação, na qual a porcentagem de jogadores marcaram mais que 16 pontos foi, a posição de Armador com 21,7%, Ala pivô com 17,2% e a Ala armador com 15,0%.

TABELA 4

Cross-Tabulation, Row Proportions  
Posição * Faixa_de_Pontos  
Data Frame: dados_archive_2_  

------------- ----------------- --------------- ----------------------------------- --------------
                Faixa_de_Pontos   Até 16 pontos   Mais que 16 pontos e menos que 34          Total
      Posição                                                                                     
         Pivô                       112 (91.1%)                          11 ( 8.9%)   123 (100.0%)
     Ala pivô                        96 (82.8%)                          20 (17.2%)   116 (100.0%)
      Armador                        83 (78.3%)                          23 (21.7%)   106 (100.0%)
          Ala                       102 (87.2%)                          15 (12.8%)   117 (100.0%)
  Ala armador                       130 (85.0%)                          23 (15.0%)   153 (100.0%)
        Total                       523 (85.0%)                          92 (15.0%)   615 (100.0%)
------------- ----------------- --------------- ----------------------------------- --------------

GRÁFICO 5

TESTE DE HIPÓTESE

Por se tratar de duas variáveis qualitativas o teste de hipótese utilizado foi o de associação Qui-quadrado.

Onde:

HO: Não existe associação entre a posição do jogador e a faixa de pontuação.

H1: Existe associação entre a posição do jogador e a faixa de pontuação.

Visto que o teste qui-quadrado apresentou valor -p > 0,05 (0,085), os dados sugerem que não há uma associação estatisticamente significativa entre a posição do jogador e a faixa de pontuação obtida nos jogos.


    Pearson's Chi-squared test

data:  dados_archive_2_$Posição and dados_archive_2_$Faixa_de_Pontos
X-squared = 8.1796, df = 4, p-value = 0.08522
Cross-Tabulation, Row Proportions  
Posição * Faixa_de_Pontos  
Data Frame: dados_archive_2_  

------------- ----------------- --------------- ----------------------------------- --------------
                Faixa_de_Pontos   Até 16 pontos   Mais que 16 pontos e menos que 34          Total
      Posição                                                                                     
         Pivô                       112 (91.1%)                          11 ( 8.9%)   123 (100.0%)
     Ala pivô                        96 (82.8%)                          20 (17.2%)   116 (100.0%)
      Armador                        83 (78.3%)                          23 (21.7%)   106 (100.0%)
          Ala                       102 (87.2%)                          15 (12.8%)   117 (100.0%)
  Ala armador                       130 (85.0%)                          23 (15.0%)   153 (100.0%)
        Total                       523 (85.0%)                          92 (15.0%)   615 (100.0%)
------------- ----------------- --------------- ----------------------------------- --------------

5.Regressão Logística


Vamos começar nossa análise construindo um modelo de regressãologística. Para isso, nossa variável resposta precisa ser qualitativa binária. - Variável resposta: Faixa de Pontos

A partir do modelo a seguir, observamos que em relação ao Pivô, a posição Armador possui quase 3 vezes mais chance de obter uma pontuação acima de 16 pontos (e abaixo de 34 pontos). Observamos também que a cada partida adicional jogada, aumenta-se a chance em 4% de pontuar acima de 16 pontos (e abaixo de 34 pontos).

Characteristic OR1 95% CI1 p-value
Posição
    Pivô
    Ala pivô 2.00 0.91, 4.62 0.092
    Armador 2.92 1.34, 6.69 0.009
    Ala 1.36 0.58, 3.23 0.5
    Ala armador 1.90 0.88, 4.30 0.11
Idade 1.03 0.97, 1.08 0.3
Partidas 1.04 1.02, 1.05 <0.001
1 OR = Odds Ratio, CI = Confidence Interval

6.Conclusão


Após as análises dos testes estatisticos realizados, podemos concluir que na relação entre posição e pontos marcados, a posição Armador liderou com os maiores pontos, e que os outliers aconteceram em todas as posições. Já na relação entre número de tentativas de arremessos e a posição do jogador, a posição Armador novamente se destacou com o maior número de tentaivas de arremessos, sendo os outliers presentes em todos as posições novamente. Nas análises de relação entre o número de jogos e a quantidade de cestas feitas pelos jogadores, podemos concluir que houve uma correlação estatisticamente significativa, entretanto, fraca. Quando analisados as variáveis número de cestas e as tentativas de arremesso, obtivemos uma correlação estatisticamente significativa, forte e positiva. E, por fim, ao analisar se a posição do jogador interfere no número de pontos do jogador, obseramos que não há uma associação significativa entre as variaveis, ou seja, a posição não interfere na faixa de pontuação do jogador.

REFERÊNCIAS BIBLIOGRÁFICAS


  1. CUNHA, MATHEUS NAKAHASHI. DIFERENÇA DE APROVEITAMENTO NA LINHA DE LANCES LIVRES ENTRE PIVÔS E ARMADORES NA NBA (1996-2022). Orientador: Júlia Barreira Augusto. 2022. Trabalho de conclusão de curso (Bacharel em Educação Física) - UNIVERSIDADE ESTADUAL PAULISTA

  2. MENEZES, João Lucas Galvão. Rumo ao estrelato: Uma análise com estatísticas de jogadores recém ingressados na NBA. Orientador: Professor Dr. Nazareno Ferreira de Andrade. 2022. 10 p. Trabalho de conclusão de curso (Bacharel em Ciência da Computação.) - UNIVERSIDADE FEDERAL DE CAMPINA GRANDE, Campina Grande- PB, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25005. Acesso em: 16 out. 2023.

  3. MIGUEL, Caio Garbo. SUCESSO NA NBA E SEUS POSSÍVEIS PREDITORES. Orientador: Prof. Dr. Humberto Moreira Carvalho. 2022. 36 p. Trabalho de conclusão de curso (Bacharel em Eduação Física) - Universidade Federal de Santa Catarina, Florianópolis, 2022. Disponível em: https://repositorio.ufsc.br/handle/123456789/233489. Acesso em: 16 out. 2023.

  4. JÚLIO DE MESQUITA FILHO, São Paulo, 2022. Disponível em: http://hdl.handle.net/11449/238088. Acesso em: 16 out. 2023.

  5. PONTÉ, João Victor. A GLOBALIZAÇÃO DO BASQUETEBOL E SUA POSTERIOR INTERNACIONALIZAÇÃO: UMA ANÁLISE DA NBA E DE MICHAEL JORDAN. Orientador: Prof. Dr. Rafael Salatini de Almeida. 2023. Trabalho de conclusão de curso (Bacharel em Relações Internacionais) - UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO”, Marília - SP, 2023. Disponível em: http://hdl.handle.net/11449/242884. Acesso em: 16 out. 2023.