````
Redazione del report da: Pesenti Dennis (matricola), Pizzini Giorgia (matricola), Persechino Italo (matricola), Imtiaz Sahar (193453)
DISCIPLINA DELLO SPORT E DATABASE
Da aggiungere…
Da aggiungere…
Il database in analisi raccoglie tutte le competizioni internazionali di Short Track Speed Skating maschile (solamente) sui 500 metri disputate tra il 2012 e il 2017.
dim(ds) è la dimensione del database:
[1] 5125 28
names(ds) sono i nomi delle variabili presenti nel database:
[1] "Season" "Series" "City" "Country"
{5} "Year" "Month" "Day" "Distance"
[9] "Round" "Group" "Num_Skater" "Name"
[13] "Nationality" "Rank_In_Group" "Start_Position" "Time"
[17] "Qualification" "rank_lap1" "time_lap1" "rank_lap2"
[21] "time_lap2" "rank_lap3" "time_lap3" "rank_lap4"
[25] "time_lap4" "rank_lap5" "time_lap5" "Time_Event"
SCELTA DELLE VARIABILI
L’attenzione alle pretazioni degli atleti ci fa pensare a due possibili variabili di risposta: il tempo e il posizionamento degli atleti al termine della gara. Per tale ragione sono state effettuate due analisi cambiando la variabile di risposta: nella prima analisi è stato considerato il tempo, con la variabile Time e nella seconda, il posizionamento, con la variabile Rank_In_Group.
Il dataset è stato pulito da eventuali dati NA per le due variabili considerate.
dim(ds) è la dimensione del database ripulito.
[1] 4792 28
Per analizzare l’influenza di compagni di squadra (atleti della stenna nazionalità), per ogni gara e per ogni atleta di gara, è stata creata un’apposita variabile TM (Team Mates).

Inizialmente la variabile è stata considerata come numerica, tuttavia, come si vede dalla tabella, la maggior parte delle gare (4590) viene disputata con atleti di diversa nazionalità, 196 con due atleti della stessa nazionalità e solo 6 con 3 atleti della stessa nazionalità.
Per questo motivo, è stato scelto di considerare la variabile TM (Team Mates) come categorica che ha due indicatori: YES (se è presente almeno un altro atleta della stessa nazione) e NO se non è presente. Tuttavia si nota come ancora che nella maggior parte delle gare ( 4590 contro 202) gli atleti gareggiano senza compagni di squadra.
E’ stato scelto di considerare questa variabile come categorica perchè di solito trovare atleti della stessa nazionalità in gare di speed skating non è molto comune. Nelle competizioni, infatti, a partire dalle eliminatorie si tende a distribuire gli atleti in modo da non far competere tra di loro atleti della stessa nazionalità.
Un’altra variabile interessante da considerare è Round che identifica le fasi della competizione. La variabile Round è una categorica ma nel dataset presenta troppi livelli (11).
I livelli della variabile Round sono stati raggruppati riducendone il numero da 11 a 5.
La posizione di partenza in una gara di short track è molto importante. Nel dataset è presente Start_Position, variabile numerica di interi da 1 a 6. Come si vede dalla tabella, le gare con 6 partenti sono molto rare (7 in totale) e riguardano principalmente gare dove sono stati effettuati dei ripescaggi. Per tale motivo sono state escluse dall’analisi.
Dato che i valori che assume la variabile sono relativamente pochi (da 1 a 5), abbiamo creato una variabile copia dove i valori vengono fattorizzati facendo diventare di fatto questa variabile categorica.
EDA
Da aggiungere…
Da aggiungere…
Da aggiungere…
Da aggiungere…
Da aggiungere…
Da aggiungere…
CONCLUSIONI
ANALISI SUI TEMPI
Da aggiungere…
Da aggiungere…
Da aggiungere…
Da aggiungere…
Da aggiungere…
BIBLIOGRAFIA
Di seguito, sono riportate le fonti testuali, audiovisive/digitali per la redazione del report e visual design.
Fonti Testuali
Agresti, A. & Kateri, M. Statistica per data scientists: con R e Python. Edizione italiana a cura di F. Corradi. Milano: EGEA, 2022.
Hadley Wickham, Mine Çetinkaya-Rundel, and Garrett Grolemund. R for Data Science. Published by O’Reily Media, 2023.
Fonti Audiovisive/Digitali
Kaggle. Data card: Short Track Speed Skating Database for Sports Data Analysis. Approfondimenti
Olympics. Short track. Approfondimenti e Video: sport explainer
NBC Olympics. Speed Skating 101: Rules. Approfondimenti
Wikipedia. Pattinaggio di velocità su ghiaccio. Sito web: wikipedia
Andrew Hext, Florentina Johanna Hettinga & Ciarán McInerney. Tactical positioning behaviors in short-track speed skating: A static and dynamic sequence analysis. Articolo per approfondimenti
Vox. The secret to winning a short track speed skating race. Video
Software per Visual Design
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. Sito web: R
Rstudio/Posit. The open-source data science for the Enterprise. Sito web: Posit
Tidyverse. TheTidyverse Ecosystem. Sito web: Tidyverse
Quarto. An open-source scientific and technical publishing system. Sito web: Quarto
Sass. CSS with superpowers. Sito web: Sass Bootstrap. Build fast, responsive sites with bootstrap. Sito web: Boostrap
Coolors. Calm harmonious palettes evoking clarity and openness. Sito web: Coolors
````