1 Introducción

En este documento analizaremos las estadisticas acerca del tiempo, en mintos, que suman los jugadores de la NBA y su promedio de intenciones de anotar registradas en la temporada 2021-22.

La información será descrita manualmente para obtener solo lo necesario para el presente análisis, dicha información es recogida directamente desde la base de datos oficial de la nba, podemos verlo aquí.

2 Inserción del Conjunto de Datos

datos1 <- read_xlsx("StatsNBA.xlsx")
datos1
## # A tibble: 38 × 3
##    NAME                   MIN   FGA
##    <chr>                <dbl> <dbl>
##  1 Kevin Durant          44    20.8
##  2 Dorian Finney-Smith   43.3  10.2
##  3 Pascal Siakam         43.3  17.8
##  4 Tobias Harris         40.8  12.8
##  5 Giannis Atetokounmpo  33.6  17.6
##  6 Draymond Green        32.8   6.8
##  7 Aaron Gordon          32    10.8
##  8 Royce O´Neale         31.3   5.8
##  9 Patrick Williams      30.6   9.4
## 10 Grant Williams        29.8   6.5
## # … with 28 more rows

Donde: MIN: Minutos jugados FGA: Promedio de anotaciones intentadas

3 Correlación

Verificamos, a través de la fórmula del coeficiente de correlación de Pearson, qué tan correlacionadas se encuentran nuestran variables.

3.1 Correlación usando la Fórmula

a <-  datos1$MIN
b <-  datos1$FGA

ma <- mean(a)
mb <- mean(b)

x=sum((a-ma)*(b-mb))
y=sqrt(sum((a-ma)^2))*sqrt(sum((b-mb)^2))
corr=x/y
corr
## [1] 0.779

3.2 Correlación aplicando cor

cor(a,b)
## [1] 0.779

4 Prueba de Hipótesis

H0 : ρ=0 H1 : ρ≠0

4.1 Hallamos el tcal

n <- length(a) #cantidad de valores
tcalc <- corr*sqrt(n-2)/sqrt(1-corr^2)
tcalc
## [1] 7.46

4.2 Hallamos el valor crítico

Nivel de significancia de 0.05

qt(0.05,n-2)
## [1] -1.69

4.3 Hallamos el pvalor

2*pt(abs(tcalc),n-2,lower.tail=FALSE)
## [1] 0.0000000082

4.4 Comprobamos

cor.test(a, b, method = "pearson", alternative = "two.sided", conf.level = 0.95)
## 
##  Pearson's product-moment correlation
## 
## data:  a and b
## t = 7, df = 36, p-value = 0.000000008
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.612 0.880
## sample estimates:
##   cor 
## 0.779

4.5 Interpretamos

Dado que el \(Ttab\) > valor crítico, este caerá en la zona de rechazo para \(H_0\).

Pvalor < 0.05, se rechaza \(H_0\), a un nivel de significancia de 0.05, existe evidencia estadística para afirmar que la correlacion existe.

5 Gráfico de Dispersión

plot(a, b, col = "green", 
      xlab = "Minutos", ylab = "Intención de anotar")

6 Conclusión

El coeficiente de correlación tiene el valor de 0.779328 empleando las dos formas de operación. Resulta una correlación positiva, es decir, una relación directamente proporcional. Mientras los jugadores suman minutos de juego, su posibilidad e intención de anotar también incrementa. Dado que dicho valor se aproxima a 1, concluimos que ambas variables tienen un alto grado de asociación.