Lien vers nos applications
- Shiny app NBA tool : https://xavierlai.shinyapps.io/nba_tool/.
- FlexDashboard : https://alexismorin.shinyapps.io/dashboard_projet/.
Présentation
NBA
La NBA est la ligue américaine de basket. Celle ci se décomposent en deux conférences (Ouest et Est). Au cours d’une saison régulière chaque équipe dispute 82 matchs. A la fin de celle-ci les 8 premières franchises de chaque conférence sont qualifiées dans un tournoi appelé Playoff. La finale NBA se dispute entre le gagnant du tableau à l’EST et le gagnant du tableau à l’OUEST.
Cette ligue engrange des millions de dollars et est donc un marché florissant. Ainsi, chaque franchise possède un budget conséquent qu’elle doit dispersé dans plusieurs domaines notamment celui du recrutement. Savoir repérer les bons joueurs est un art. En effet, un recrutement de joueurs avec gros contrats peut amener soit à une réussite sur court terme, soit à un disette de performance comme le connaissent les New-York Knicks depuis 10 ans. L’enjeu est de procéder à des recrutements intelligent pour ne pas trop dépenser tout en construisant une équipe capable de gagner le titre.
Figure 1 : Franchises en fonction de leur conférence
Base de données
Nous avions récolté trois bases de données sur http://www.nbaminer.com/ l’année dernière. Malheureusement, ce site à changé et les données NBA sont désormais payantes. Les bases peuvent être distinguées en deux groupes d’individus: les equipes et les joueurs. Dans la base Equipe nous avons beaucoup de données quantitative de toutes les équipes nba de la saison 1996 à 2017. Nous avons à peu près les mêmes variables pour tous les joueurs ayant joués dans la période énoncée. Nous avons fusionner les tables joueurs puis exporter la table pour faciliter les analyses. Voici un exemple de la table joueur basic stats:
## Player Team Season Games Minutes Points OReb Dreb Rebonds
## 1 Russell Westbrook Thunder 2016 5 38.90 37.40 1.80 9.80 11.60
## 2 Kobe Bryant Lakers 2005 80 40.96 35.40 0.89 4.43 5.31
## 3 LeBron James Cavaliers 2008 14 41.41 35.29 1.36 7.79 9.14
## 4 Gilbert Arenas Wizards 2005 6 47.40 34.00 1.17 4.33 5.50
## 5 Tracy McGrady Magic 2000 4 44.34 33.75 1.50 5.00 6.50
## 6 Dwyane Wade Heat 2009 5 41.96 33.20 1.20 4.40 5.60
Figure 2 : Aperçu des 11 premières variables de la base ‘player_basicstats’
Les données quantitatives sont calculées comme étant la moyenne de la variable en question au cours de la saison. Par exemple pour la première ligne, la variable Points corresponds à la moyenne de points par match de Russell Westbrook lors de la saison 2016-2017.
Application Web
L’application web est destinée aux managers générals et au coaching staff des franchises NBA, elle pourrait également intéresser les fédérations de basket des pays pour analyser les facteurs de réussite dans meilleur ligue au monde. L’application est composée de trois onglets :
Recherche de joueurs: cette partie permet à l’utilisateur d’explorer tous les joueurs récents en fonction d’un critère fourni. L’idée est que l’équipe déniche les joueurs en fonction de ses besoins. A titre d’exemple si une franchise veut s’améliorer en défense et cherche un joueur bon en contre, alors le graphique lui permettra de trouver le joueur le plus efficace des bons contreurs. Puis, si elle hésite entre plusieurs joueurs, elle a la possibilité de les comparer en fonction du critrère sur leur carrière respective globale.
- Prédiction:
Cet onglet incorpore un modèle linéaire gaussien qui explique et prédit le nombre de victoire d’une équipe au cours d’une saison. Les individus sont les 30 équipes lors des 10 dernières saisons régulières à l’exception de 2011 où il y a eu un lock out et donc moins de match.
\[Y_i = \beta_0 + \beta_1x_i,_1+\beta_2x_i,_2+\beta_3x_i,_3+\beta_4x_i,_4+\epsilon_i\] \[\text{où } \epsilon_i \sim \mathcal N(0,\sigma^2)\text{ iid et } i = 1,...,n \text{ avec }n=270\]
L’utilisateur pourra constater la performance du modèle et jouer avec les variables explicatives. En effet, il pourra lui même remplir le nouveau nouveau vecteur \[x_{n+1} = (x_{n+1,1}\quad x_{n+1,2}\quad x_{n+1,3}\quad x_{n+1,4}) \]
Il pourra donc avoir une idée concrète de l’impact des estimations des coefficients. Sinon il pourra choisir de remplir automatiquement le vecteur des nouvelles données par celles d’une équipe de son choix lors des 3 dernières saisons.
Carte : Cet onglet présentera une carte des USA avec les points correspondants aux franchises. De surcroît, la taille des points sera proportionnelle à la masse salarial payé par la franchise. Cela pour donner un échelle d’idée des franchises ne pouvant plus dépasser le plafond salarial et celles qui ont beaucoup d’argent pour recruter
FlexDashboard
L’objectif est ici de vulgariser les données pour avoir un petit aperçu de la complexité de nos bases de données.