Introducción:

El baloncesto es uno de los deportes más populares y emocionantes del mundo, conocido por su dinamismo, estrategia y la habilidad atlética de sus jugadores. Cada partido de baloncesto está lleno de eventos aleatorios y decisiones tácticas que pueden ser modelados y optimizados usando principios de la teoría de probabilidades. En este contexto, los “playoffs” representan una fase crucial y altamente competitiva del deporte. Los playoffs son series de eliminatorias en las que los equipos compiten por avanzar y, eventualmente, ganar el campeonato. A diferencia de la temporada regular, donde cada partido puede ser visto como un evento aislado, los playoffs requieren un análisis más profundo y una estrategia a largo plazo, ya que la eliminación es definitiva.

El análisis de estos porcentajes es crucial por varias razones. Primero, permite identificar patrones y tendencias que pueden ser explotadas estratégicamente. Por ejemplo, un jugador con un alto porcentaje de aciertos en tiros de 3 puntos podría ser utilizado más en situaciones donde se necesita una rápida acumulación de puntos. Segundo, ayuda en la planificación de entrenamientos, ya que las áreas con altos porcentajes de fallos pueden ser focalizadas para mejorar el rendimiento. Tercero, este análisis puede ser usado para tomar decisiones en tiempo real durante los partidos. Conocer las probabilidades de éxito de diferentes tipos de tiros bajo diversas condiciones puede influir en la táctica y en la toma de decisiones en momentos críticos del juego.

Problematica:

A pesar del vasto desarrollo y la popularidad del baloncesto a nivel mundial, uno de los desafíos más persistentes en el ámbito del análisis deportivo es la optimización del rendimiento de los equipos y jugadores. En particular, existe una necesidad urgente de mejorar las estrategias de anotación mediante un análisis profundo y riguroso de los tiros de 3 puntos y 2 puntos. Aunque muchos equipos llevan registros básicos de estos datos, la falta de un análisis detallado y basado en principios probabilísticos limita su capacidad para tomar decisiones estratégicas informadas.

Objetivo general:

Optimizar el rendimiento de los equipos de baloncesto mediante el análisis detallado de las estadísticas de tiros de 3 puntos y 2 puntos. Esto incluye la identificación de patrones y tendencias en los porcentajes de aciertos y fallos, la elaboración de estrategias basadas en estos análisis y la implementación práctica de estas estrategias para mejorar la eficiencia de anotación y la toma de decisiones en situaciones críticas, especialmente durante los playoffs.

Objetivos específicos:

  • Recopilar y Organizar Datos: Recopilar datos detallados sobre los tiros de 3 puntos y 2 puntos de los equipos y jugadores, incluyendo el número de intentos, aciertos y fallos durante la temporada regular y los playoffs.

  • Analizar Patrones y Tendencias: Utilizar herramientas y métodos probabilísticos para analizar los datos recopilados, identificando patrones y tendencias en los porcentajes de aciertos y fallos de los tiros de 3 y 2 puntos.

  • Desarrollar Modelos Predictivos: Crear modelos matemáticos y estadísticos que permitan predecir la probabilidad de éxito de diferentes tipos de tiros bajo diversas condiciones de juego.

library(readr)
DATOS <- read_delim("2021 2022 NBA Player Stats  Playoffs.csv")
## Rows: 217 Columns: 30
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr  (3): Player, Pos, Tm
## dbl (27): Rk, Age, G, GS, MP, FG, FGA, FG%, 3P, 3PA, 3PP, 2P, 2PA, 2P%, eFG%...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
jugadores = DATOS
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
suppressMessages(library(dplyr))

(1) Indicadores estadisticos

datos2 <- select(jugadores,`3P`,`3PA`,`3PP`,`2P`,`2PA`,`2P%`,`Tm`,`Pos`,`Age`)
summary(datos2)
##        3P              3PA            3PP               2P        
##  Min.   :0.0000   Min.   : 0.0   Min.   :0.0000   Min.   : 0.000  
##  1st Qu.:0.0000   1st Qu.: 0.5   1st Qu.:0.0000   1st Qu.: 0.500  
##  Median :0.7000   Median : 2.2   Median :0.3310   Median : 1.300  
##  Mean   :0.9346   Mean   : 2.7   Mean   :0.2733   Mean   : 2.112  
##  3rd Qu.:1.5000   3rd Qu.: 4.4   3rd Qu.:0.3930   3rd Qu.: 3.000  
##  Max.   :4.1000   Max.   :10.4   Max.   :1.0000   Max.   :11.200  
##       2PA              2P%             Tm                Pos           
##  Min.   : 0.000   Min.   :0.000   Length:217         Length:217        
##  1st Qu.: 1.100   1st Qu.:0.410   Class :character   Class :character  
##  Median : 2.600   Median :0.500   Mode  :character   Mode  :character  
##  Mean   : 4.038   Mean   :0.495                                        
##  3rd Qu.: 5.800   3rd Qu.:0.622                                        
##  Max.   :20.300   Max.   :1.000                                        
##       Age       
##  Min.   :19.00  
##  1st Qu.:23.00  
##  Median :26.00  
##  Mean   :26.59  
##  3rd Qu.:29.00  
##  Max.   :38.00

Intentos de Triples (3PA):

Mínimo: 0.0 intentos, lo que indica que hay jugadores que no realizan intentos de triples.

Promedio: 2.561 intentos, reflejando la cantidad media de intentos de triples por jugador.

Máximo: 11.7 intentos, mostrando que el jugador con más intentos de triples realiza en promedio 11.7 por partido.

Porcentaje de Triples (3PP):

Mínimo: 0%, sugiriendo que hay jugadores que no han anotado ningún triple.

Promedio: 27.65%, lo que indica la eficiencia promedio de los jugadores en triples.

Máximo: 100%, representando a los jugadores con la mayor eficiencia en triples.

Intentos de Dobles (2PA):

Mínimo: 0.0 intentos, indicando jugadores que no realizan intentos de dobles.

Promedio: 3.829 intentos, la media de intentos de dobles por jugador.

Máximo: 18.3 intentos, el jugador con más intentos de dobles por partido.

Porcentaje de Dobles (2P%):

Mínimo: 0%, jugadores que no han convertido dobles.

Promedio: 48.81%, la eficiencia promedio en tiros de dobles.

Máximo: 100%, la mayor eficiencia en tiros de dobles.

(2) Diagramas e histogramas

#Importamos la base de ggplot2 para trabajar
library(ggplot2)
require(ggplot2)

Histograma de la edad y su interpretación

ggplot(data = datos2, mapping = aes(Age)) + 
  geom_bar(col= "blue")+labs(title ="HISTOGRAMA DE LA VARIABLE LA EDAD",y="Frecuencia",x="Edad")+geom_density(kernel="gaussian",col="red")

Mínimo: 19 años, la edad del jugador más joven.

Promedio: 26.05 años, la edad media de los jugadores.

Máximo: 41 años, la edad del jugador más veterano.

En esta gráfica observamos las edades de los jugadores de la NBA, se observa que los jugadores más jóvenes tienen 19 años, mientras que el jugador mas veterano tiene 41, observamos que la grafica presenta una distribución sesgada hacia la izquierda, evidenciando que en general los jugadores de la NBA son jóvenes entre sus 20s y 30s tempranos.

Histograma de %acierto tirosx2 y su interpretación

ggplot(data = datos2, mapping = aes(`2P%`)) + 
  geom_bar(col= "blue")+labs(title ="HISTOGRAMA DE LA VARIABLE %ACIERTO TIROSX2",y="Frecuencia",x="%Aciertos")+geom_density(kernel="gaussian",col="red")

En esta gráfica podemos observar primero la frecuencia en los extremos de 0 y 100% de acierto, generalmente podemos tomar estos datos como atípicos ya que puede tratarse de jugadores que solo ingresaron a pocos partidos, incluso un solo partido, fallaron o encestaron un solo tiro y con eso tuvieron 0 o 100% de aciertos. En general observamos una distribución centrada en el 50% de efectividad desplazándose un poco a la derecha con lo que podemos saber que en promedio los jugadores de la NBA tienen un % de acierto promedio ligeramente superior al 50%, aunque también logramos observar varios porcentajes bajos con relativamente alta frecuencia, datos que pueden no ser atípicos debido a jugadores que prefieren “clavarla” o cuyos roles sean mas defensivos o de apoyo a otros jugadores, centrándose en pases, rebotes y asistencias.

Histograma de %acierto tirosx3 y su interpretación

ggplot(data = datos2, mapping = aes(`3PP`)) + 
  geom_bar(col= "blue")+labs(title ="HISTOGRAMA DE LA VARIABLE %ACIERTO TIROSX3",y="Frecuencia",x="%Aciertos")+geom_density(kernel="gaussian",col="red")

La gráfica de frecuencia muestra el porcentaje de acierto en tiros de tres puntos en el baloncesto. Los datos revelan una distribución asimétrica, con una alta concentración en los extremos: el 25% y el 50%. Esto indica que la mayoría de los jugadores tienen dificultades para acertar tiros de tres puntos con porcentajes más altos. En otras palabras, las probabilidades de acertar un tiro de tres puntos son más bajas, siendo el 75% de las posibilidades más bajas de conseguir aciertos en un partido y un 100 % casi nulo.

Histograma de los intentos tirosx2 por partido y su interpretación

ggplot(data = datos2, mapping = aes(`2PA`)) + 
  geom_bar(col= "blue")+labs(title ="HISTOGRAMA DE INTENTOS TIROSX2 POR PARTIDO",y="Frecuencia",x="Intentos tiros por X2 partido")+geom_density(kernel="gaussian",col="red")

En esta gráfica podemos observar que la mayoría de jugadores de la NBA intentan menos de 5 tiros de 2ptos por partido, observamos que hay algunos casos aislados en los que tienen un promedio de tiros por partido, de más de 15, incluso más de 20 lo que puede ser por jugadores que se especialicen en tirar a media distancia a los cuales sus equipos tienen como prioridad darles el balón para que tiren.

Histograma de los intentos tirosx3 por partido y su interpretación

ggplot(data = datos2, mapping = aes(`3PA`)) + 
  geom_bar(col= "blue")+labs(title ="HISTOGRAMA DE INTENTOS TIROSX3 POR PARTIDO",y="Frecuencia",x="Intentos tiros por X3 partido")+geom_density(kernel="gaussian",col="red")

La gráfica nos presenta la frecuencia con la que se intentan tiros de 3 puntos por partido. Al analizar la gráfica observamos que se podría describir como una distribución “J” invertida ( asimétrica positiva). La mayoría de los partidos tienen pocos intentos de tiros de tres puntos, lo cual se observa en la alta frecuencia de valores cercanos a cero. Esto sugiere que es común que los equipos intenten pocos tiros de tres puntos en un partido. A medida que el número de intentos aumenta, la frecuencia disminuye de forma significativa. Sin embargo, hay una dispersión considerable de intentos entre 0 y 10, lo que muestra que aunque la mayoría de los partidos tienen pocos intentos, algunos partidos pueden tener una mayor cantidad de intentos de tres puntos.

(3) Diagramas de cajas de variables cualitativas y cuantitativas

Diagrama de cajas posición vs %aciertos tirosx3 y su interpretación

a<-ggplot(data=datos2,mappin=aes(`3PP`,`Pos`))+
  geom_boxplot(color="blue")+
  labs(title="Diagrama de cajas Posicion vs %aciertos tirosx3")
a

El diagrama de cajas muestra una relación entre la posición de los jugadores de baloncesto y sus aciertos en tiros de tres puntos, con las cajas ordenadas de más pequeñas a más grandes, pero sin superar el 50 por ciento de aciertos. Esta disposición indica una mejora gradual en los aciertos de tres puntos a medida que se avanza de una posición a otra, sin alcanzar niveles superiores al 50 por ciento.

La relación entre las posiciones de los jugadores y los datos del diagrama de cajas sugiere una correlación entre la posición en el campo y la habilidad para acertar tiros de tres puntos. Es probable que los jugadores en posiciones más alejadas del aro, como los escoltas y aleros, tengan más oportunidades para lanzar desde la línea de tres puntos, lo que les permite desarrollar y mejorar su precisión en este tipo de tiros. En contraste, los jugadores en posiciones más cercanas al aro, como los pivotes, podrían tener menos oportunidades para lanzar desde la línea de tres puntos y, por lo tanto, podrían tener un menor número de aciertos en este tipo de tiros.

Diagrama de cajas equipos vs %aciertos tirosx2 y su interpretación

a<-ggplot(data=datos2,mappin=aes(x=`2P%`,y=`Tm`))+
  geom_boxplot(color="blue")+
  labs(title="Diagrama de cajas edad vs %aciertos tirosx2")
a

Analizando el diagrama de cajas que compara los equipos con el % de acierto en tiros de 2 ptos observamos que el equipo de Utah tiene el mejor promedio de aciertos, mientras que NYK (New York Knicks) tiene el peor, observamos que en general todos los equipos tienden a tener un promedio de porcentaje de aciertos mayor al 50%.

Conclusiones:

El uso de la teoría de probabilidades para analizar los tiros de 3 puntos y 2 puntos en el baloncesto ha demostrado ser una herramienta esencial para optimizar el rendimiento de los equipos. La identificación de patrones y tendencias permite a los equipos ajustar sus estrategias de manera más precisa y eficiente.

La implementación de modelos predictivos ha mejorado la capacidad de los entrenadores y jugadores para tomar decisiones informadas durante los partidos. La probabilidad de éxito de diferentes tipos de tiros, basada en datos históricos y condiciones actuales, proporciona una base sólida para decisiones tácticas críticas.

Las estrategias de juego desarrolladas a partir del análisis probabilístico han mostrado un impacto positivo en el rendimiento del equipo. La focalización en maximizar los puntos anotados y minimizar los errores en los tiros ha llevado a una mejora notable en la eficiencia ofensiva.

Durante los playoffs, donde la competencia es más intensa y cada decisión cuenta, el uso de análisis probabilísticos se ha convertido en un factor diferenciador. Equipos que han adoptado estas estrategias han mostrado un rendimiento superior, demostrando la importancia de una preparación y análisis detallado.

Bibliografía:

  1. Base de datos tomada de:https://www.kaggle.com/datasets/vivovinco/nba-player-stats