Το dataset περιλαμβάνει στατιστικά στοιχεία ομάδων της EuroLeague για την αγωνιστική περίοδο 2023-2024. Κάθε γραμμή αντιστοιχεί σε μία ομάδα, ενώ κάθε στήλη περιέχει έναν συγκεκριμένο δείκτη απόδοσης που σχετίζεται με την επίθεση, την άμυνα ή τη συνολική απόδοση της ομάδας.
Βελτιστοποίηση Απόδοσης: Οι ομάδες λειτουργούν ως οργανισμοί που πρέπει να κατανείμουν τους πόρους τους (παίκτες, budget) με τον πιο αποδοτικό τρόπο.
Λήψη Αποφάσεων: Η αναλυτική βοηθά τους προπονητές και τους managers να εντοπίζουν στρατηγικά πλεονεκτήματα, όπως η σχέση μεταξύ της ομαδικής συνεργασίας (assists) και της τελικής αποτελεσματικότητας.
Ανταγωνιστικό Πλεονέκτημα: Μέσω των δεδομένων, μια ομάδα μπορεί να αναγνωρίσει τις αδυναμίες των αντιπάλων της και να προσαρμόσει την τακτική της.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Μέσω της στατιστικής επεξεργασίας, επιδιώκουμε να απαντήσουμε στα εξής:
Σκοπός: Η εξέταση της σχέσης μεταξύ των Ασίστ (Assists) και των Συνολικών Πόντων (PTS). Στόχος είναι να διαπιστωθεί αν η ομαδική συνεργασία και η καλή κυκλοφορία της μπάλας μεταφράζονται άμεσα σε μεγαλύτερη επιθετική παραγωγικότητα.
Ερώτημα: Υπάρχει θετική συσχέτιση μεταξύ των Assists και των πόντων που σημειώνει μια ομάδα στη Euroleague;
# ScatterPlot
ggplot(euro_data, aes(x = AST, y = PTS.)) +
geom_point(color = "darkgreen", size = 3) +
labs(
title = "Relationship between Assists and Points Scored",
x = "Assists (AST)",
y = "Total Points Scored (PTS+)"
) +
theme_minimal()Αν εξετάσουμε τη διασπορά των σημείων στο παραπάνω γράφημα, παρατηρούμε τα εξής:
Συσχέτιση Δεδομένων:
Γενική Τάση: Παρατηρείται μια ξεκάθαρη θετική σχέση μεταξύ των μεταβλητών Assists και Points. Δηλαδή, όσο αυξάνεται ο αριθμός των ασίστ, τόσο τείνει να αυξάνεται και η επιθετική συγκομιδή της ομάδας.
Είναι σημαντικό να σημειωθεί ότι η συσχέτιση δεν είναι απόλυτη. Υπάρχουν αποκλίσεις όπου:
Ορισμένες ομάδες έχουν υψηλό αριθμό ασίστ αλλά σχετικά χαμηλό σκορ.
Άλλες ομάδες σκοράρουν αρκετά παρά τον χαμηλό αριθμό ασίστ.
Αυτό υποδηλώνει ότι το σκοράρισμα επηρεάζεται και από άλλους κρίσιμους παράγοντες, όπως:
Ποσοστό ευστοχίας (Field Goal Percentage)
Ευστοχία στα τρίποντα (3FG%)
Επιθετικά ριμπάουντ (OR) που προσφέρουν δεύτερες ευκαιρίες
Ρυθμός παιχνιδιού (Pace)
Συνολικά, η ανάλυση επιβεβαιώνει ότι η αύξηση των ασίστ σχετίζεται άμεσα με το αυξημένο σκοράρισμα. Η ομαδική συνεργασία αποτελεί καθοριστικό παράγοντα για την επιθετική απόδοση στη Euroleague.
Οι ασίστ στην πράξη μεταφράζονται σε:
Καλύτερη κυκλοφορία της μπάλας
Αποτελεσματική συνεργασία των παικτών
Δημιουργία ελεύθερων σουτ (open shots)
Συνεπώς, αυξάνονται οι πιθανότητες για ποιοτικές εκτελέσεις, οι οποίες οδηγούν σε περισσότερους πόντους και υψηλότερη επιθετική αποτελεσματικότητα.
Σκοπός: Η εξέταση της σχέσης μεταξύ των Λαθών (Turnovers) και των Πόντων που δέχεται μια ομάδα (Points Allowed). Στόχος είναι να διαπιστωθεί αν τα αυξημένα λάθη οδηγούν σε εύκολες κατοχές για τον αντίπαλο, αυξάνοντας το παθητικό της ομάδας.
Ερώτημα: Οι ομάδες που υποπίπτουν σε περισσότερα λάθη, δέχονται τελικά και περισσότερους πόντους;
# Δημιουργία νέας κατηγορικής μεταβλητής για τα Turnovers (Χώρισμα σε 3 επίπεδα)
euro_data$TOV_group <- cut(euro_data$TOV,
breaks = 3,
labels = c("Low", "Medium", "High"))
# Δημιουργία BoxPlot
# Σημείωση: Χρησιμοποιούμε το PTS..1 που αντιστοιχεί στη στήλη PTS-
ggplot(euro_data, aes(x = TOV_group, y = PTS..1)) +
geom_boxplot(fill = "orange", color = "darkred", alpha = 0.7) +
labs(
title = "Turnovers Level vs Points Allowed",
subtitle = "Euroleague Season 2023-2024",
x = "Επίπεδο Λαθών (Turnovers Level)",
y = "Πόντοι που Δέχθηκαν (Points Allowed)"
) +
theme_minimal()Αν εξετάσουμε τα επίπεδα των λαθών στο παραπάνω γράφημα, παρατηρούμε τα εξής:
Συσχέτιση Δεδομένων:
Οι ομάδες με λίγα λάθη (Low) δέχονται κατά μέσο όρο περίπου 85 πόντους.
Οι ομάδες με μεσαία λάθη (Medium) δέχονται κατά μέσο όρο περίπου 81 πόντους.
Οι ομάδες με πολλά λάθη (High) δέχονται κατά μέσο όρο περίπου 83 πόντους.
Γενική Τάση: Παραδόξως, οι ομάδες με τα λιγότερα λάθη τείνουν να δέχονται ελαφρώς περισσότερους πόντους σε σχέση με τις ομάδες της μεσαίας κατηγορίας. Αυτό δείχνει ότι δεν υπάρχει μια απλή, ευθεία σχέση μεταξύ λαθών και παθητικού.
Είναι σημαντικό να σημειωθεί ότι η συσχέτιση δεν είναι απόλυτη. Υπάρχουν αποκλίσεις όπου:
Ορισμένες ομάδες κάνουν αρκετά λάθη αλλά διατηρούν την άμυνά τους σε πολύ χαμηλά επίπεδα.
Άλλες ομάδες προστατεύουν τη μπάλα (λίγα λάθη) αλλά δέχονται πολλούς πόντους.
Αυτό υποδηλώνει ότι η αμυντική απόδοση επηρεάζεται και από άλλους κρίσιμους παράγοντες, όπως:
Ομαδική άμυνα (Defensive Cohesion)
Έλεγχος των ριμπάουντ (Rebounds)
Πίεση στην μπάλα (Ball Pressure)
Συνολική αμυντική τακτική (Defensive Strategy)
Συνολικά, η ανάλυση δείχνει ότι τα λάθη (turnovers) επηρεάζουν σε κάποιο βαθμό την αμυντική επίδοση, αλλά δεν αποτελούν τον μοναδικό ή τον καθοριστικό παράγοντα για τους πόντους που δέχεται μια ομάδα.
Η αμυντική απόδοση μιας ομάδας εξαρτάται από μια σειρά ενεργειών που μπορούν να “καλύψουν” τα λάθη:
Γρήγορες επιστροφές (Transition Defense)
Κλεψίματα και τάπες που σταματούν τον ρυθμό του αντιπάλου
Προστασία του καλαθιού (Rim Protection)
Συνεπώς, αν και τα λάθη στερούν επιθέσεις, μια καλά οργανωμένη άμυνα μπορεί να αποτρέψει τη μετατροπή τους σε πόντους για τον αντίπαλο.
Σκοπός: Η σύγκριση των πόντων που σκοράρει κάθε ομάδα (Επίθεση) με τους πόντους που δέχεται (Άμυνα). Με αυτόν τον τρόπο μπορούμε να εντοπίσουμε ποιες ομάδες είναι ισορροπημένες και ποιες βασίζονται αποκλειστικά σε μία από τις δύο πλευρές του παιχνιδιού.
Ερώτημα: Ποιες ομάδες έχουν την καλύτερη και ποιες τη χειρότερη επίθεση και άμυνα στη διοργάνωση;
# 1. Δημιουργία σύντομων ονομάτων ομάδων (Team Codes)
euro_data$TeamCode <- c(
"ASV", "MIL", "BAR", "BAS", "ALB", "FEN",
"EFE", "RMB", "MON", "BAY", "OLY", "PAN",
"PAR", "CRV", "MAC", "VAL", "VIR", "ZAL"
)
# 2. Μετατροπή δεδομένων σε "long" μορφή για τη σύγκριση
# Προσοχή: Χρησιμοποιούμε τα ονόματα PTS. (Επίθεση) και PTS..1 (Άμυνα)
euro_long <- tidyr::pivot_longer(
euro_data,
cols = c(PTS., PTS..1),
names_to = "Type",
values_to = "Points"
)
# 3. Δημιουργία Bar Chart
ggplot(euro_long, aes(x = reorder(TeamCode, -Points), y = Points, fill = Type)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_manual(values = c("PTS." = "#56B4E9", "PTS..1" = "#E69F00"),
labels = c("Επίθεση (PTS+)", "Άμυνα (PTS-)")) +
labs(
title = "Points Scored vs Points Allowed by Euroleague Teams",
subtitle = "Season 2023-2024 Comparison",
x = "Ομάδα (Team Code)",
y = "Πόντοι (Average Points)",
fill = "Δείκτης"
) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))Στο παραπάνω γράφημα, η σύγκριση γίνεται μέσω των δύο χρωμάτων:
Γαλάζιο (PTS+) - Επίθεση: Όσο πιο ψηλή είναι η γαλάζια μπάρα, τόσο πιο αποτελεσματική είναι η επίθεση της ομάδας.
Πορτοκαλί (PTS-) - Άμυνα: Όσο πιο ψηλή είναι η πορτοκαλί μπάρα, τόσο περισσότερους πόντους δέχεται η ομάδα (άρα τόσο πιο “ευάλωτη” είναι η άμυνά της).
Αναλύοντας τις κορυφές και τις βάσεις του διαγράμματος, προκύπτουν τα εξής:
Καλύτερη Επίθεση: RMB (Ρεάλ Μαδρίτης) Εμφανίζει την υψηλότερη γαλάζια μπάρα στη διοργάνωση.
Χειρότερη Επίθεση: VAL (Βαλένθια) Εμφανίζει τη χαμηλότερη γαλάζια μπάρα, υποδεικνύοντας δυσκολία στο σκοράρισμα.
Καλύτερη Άμυνα: OLY (Ολυμπιακός) Εμφανίζει την πιο χαμηλή πορτοκαλί μπάρα, γεγονός που σημαίνει ότι περιορίζει τους αντιπάλους του περισσότερο από κάθε άλλη ομάδα.
Χειρότερη Άμυνα: MAC (Μακάμπι) Εμφανίζει την υψηλότερη πορτοκαλί μπάρα, δεχόμενη τους περισσότερους πόντους ανά αγώνα.
Η ιδανική κατάσταση για μια ομάδα είναι η γαλάζια μπάρα να είναι αισθητά ψηλότερη από την πορτοκαλί.
Ομάδες όπου η πορτοκαλί μπάρα ξεπερνά τη γαλάζια, αντιμετωπίζουν στρατηγικό πρόβλημα, καθώς δέχονται περισσότερους πόντους από όσους παράγουν, κάτι που συνήθως οδηγεί σε χαμηλότερη θέση στη βαθμολογία.
Σκοπός: Η παρουσίαση της κατανομή των πόντων που σκοράρουν οι ομάδες της Euroleague. Μέσα από το διάγραμμα μπορούμε να δούμε σε ποια εύρη πόντων συγκεντρώνονται οι περισσότερες ομάδες και να κατανοήσουμε καλύτερα το επίπεδο της επιθετικής τους απόδοσης.
Ερώτημα: Σε ποιο εύρος πόντων σκοράρουν οι περισσότερες ομάδες της Euroleague;
# Δημιουργία Histogram για τους πόντους επίθεσης (PTS.)
ggplot(euro_data, aes(x = PTS.)) +
geom_histogram(binwidth = 2, fill = "orange", color = "black") +
labs(
title = "Distribution of Points Scored by Euroleague Teams",
subtitle = "Season 2023-2024",
x = "Points Scored (Average)",
y = "Number of Teams (Frequency)"
) +
theme_minimal()Από το διάγραμμα παρατηρούμε τα εξής στοιχεία για την επιθετική λειτουργία των ομάδων:
Κύρια Συγκέντρωση: Οι περισσότερες ομάδες βρίσκονται περίπου μεταξύ 80 και 83 πόντων. Αυτό σημαίνει ότι οι περισσότερες επιδόσεις στη διοργάνωση συγκεντρώνονται γύρω από αυτό το σημείο, που αποτελεί και το “benchmark” της λίγκας.
Ακραίες Επιδόσεις: Υπάρχουν επίσης λίγες ομάδες με χαμηλότερους πόντους (γύρω στους 75-78) και κάποιες με υψηλότερους (85-88), αλλά αυτές εμφανίζονται πιο σπάνια (είναι οι λεγόμενες “ουρές” της κατανομής).
Συμπέρασμα: Η κατανομή επιβεβαιώνει την εικόνα μιας πολύ ανταγωνιστικής διοργάνωσης, όπου η πλειοψηφία των ομάδων έχει παραπλήσια επιθετική παραγωγικότητα.
Στην ενότητα αυτή υπολογίζουμε τα βασικά μέτρα κεντρικής τάσης και διασποράς για τους κύριους δείκτες απόδοσης των ομάδων. Η ανάλυση αυτή μας επιτρέπει να κατανοήσουμε τον “μέσο όρο” της διοργάνωσης και το πόσο μεγάλη είναι η απόκλιση μεταξύ των ομάδων.
# Επιλογή των βασικών μεταβλητών για στατιστική ανάλυση
stats_data <- euro_data %>%
select(PTS., PTS..1, AST, TOV)
# Υπολογισμός Μέσου Όρου, Διαμέσου, Τυπικής Απόκλισης, Ελάχιστου και Μέγιστου
summary_stats <- data.frame(
Μέσος_Όρος = sapply(stats_data, mean, na.rm = TRUE),
Διάμεσος = sapply(stats_data, median, na.rm = TRUE),
Τυπ_Απόκλιση = sapply(stats_data, sd, na.rm = TRUE),
Ελάχιστο = sapply(stats_data, min, na.rm = TRUE),
Μέγιστο = sapply(stats_data, max, na.rm = TRUE)
)
# Υπολογισμό Εύρους (Range) και Διακύμανσης (Variance)
summary_stats$Εύρος = summary_stats$Μέγιστο - summary_stats$Ελάχιστο
summary_stats$Διακύμανση = summary_stats$Τυπ_Απόκλιση^2
# Προβολή του πίνακα στατιστικών
datatable(round(summary_stats, 2), options = list(dom = 't'),
caption = "Πίνακας Περιγραφικών Στατιστικών (PTS+, PTS-, AST, TOV)")Ισορροπία Πόντων: Ο Μέσος Όρος επίθεσης (81.44) και άμυνας (81.66) είναι σχεδόν ταυτόσημοι. Αυτό δείχνει μια εξαιρετικά ανταγωνιστική λίγκα όπου τα παιχνίδια κρίνονται στις λεπτομέρειες.
Ομοιομορφία: Η χαμηλή Τυπική Απόκλιση (3.67 και 3.43) δείχνει ότι οι περισσότερες ομάδες παίζουν στο ίδιο τέμπο. Δεν υπάρχουν “σάκοι του μποξ” ή ομάδες που σκοράρουν 100 πόντους σταθερά.
Το Χάσμα (Εύρος): Το εύρος των 12.8 μονάδων στην επίθεση είναι σημαντικό. Δείχνει ότι η απόσταση μεταξύ της καλύτερης επίθεσης (88.7) και της χειρότερης (75.9) είναι περίπου 5 κατοχές ανά αγώνα, μια διαφορά που καθορίζει την πρόκριση στα Playoffs.
Benchmark Ασσίστ: Ο Μέσος Όρος των 17.56 ασίστ αποτελεί το “χρυσό κανόνα” της διοργάνωσης. Ομάδες που προσεγγίζουν το Μέγιστο (20.6) θεωρούνται ελίτ στη δημιουργία, ενώ το Ελάχιστο (15.1) φανερώνει ομάδες με πιο ατομικό στυλ παιχνιδιού.
Συνοχή: Η πολύ μικρή Διακύμανση (2.53) υποδηλώνει ότι η “κουλτούρα της πάσας” είναι κοινή σε όλη τη διοργάνωση, με τις περισσότερες ομάδες να στοχεύουν στο ομαδικό μπάσκετ.
Επίπεδο Συγκέντρωσης: Με Μέσο Όρο τα 12.36 λάθη και πολύ μικρή Τυπική Απόκλιση (1.1), παρατηρούμε ότι το επίπεδο προσοχής είναι παρόμοιο σε όλες τις ομάδες.
Η Κρίσιμη Διαφορά: Μια ομάδα που βρίσκεται στο Μέγιστο των λαθών (15.1) χάνει 5 περισσότερες κατοχές από μια ομάδα στο Ελάχιστο (10.0). Σε κλειστές αναμετρήσεις, αυτές οι 5 κατοχές μεταφράζονται συνήθως σε ήττα.
Η Διάμεσος συμπίπτει σχεδόν απόλυτα με τον Μέσο Όρο σε όλες τις κατηγορίες, γεγονός που σημαίνει ότι τα δεδομένα ακολουθούν την κανονική κατανομή χωρίς ακραίες τιμές που να αλλοιώνουν την εικόνα.
Όσον αφορά την Επικρατούσα Τιμή (Mode), παρατηρούμε ότι στα περισσότερα στατιστικά δεν υπάρχει μία μοναδική τιμή που να επαναλαμβάνεται συχνά, καθώς τα δεδομένα είναι συνεχή. Ωστόσο, η συγκέντρωση των τιμών γύρω από τον μέσο όρο επιβεβαιώνει τη μεγάλη ομοιογένεια των ομάδων της Euroleague για τη σεζόν 2023-24.
Η διοργάνωση αποδεικνύεται μια λίγκα “των προπονητών”, όπου οι ομάδες είναι πολύ κοντά στα βασικά στατιστικά και η διαφορά γίνεται από την ποιότητα της εκτέλεσης και την αμυντική πειθαρχία.
Σε αυτή την ενότητα εξετάζουμε πώς επηρεάζει η μία μεταβλητή την άλλη. Χρησιμοποιούμε τον συντελεστή συσχέτισης του Pearson για να εντοπίσουμε τις πιο ισχυρές σχέσεις στο παιχνίδι.
## corrplot 0.95 loaded
# Επιλογή των αριθμητικών μεταβλητών που θέλουμε να αναλύσουμε
corr_data <- euro_data %>%
select(PTS., PTS..1, AST, TOV, OR, DR)
# Υπολογισμός μήτρας συσχέτισης
cor_matrix <- cor(corr_data, use = "complete.obs")
# Οπτικοποίηση με Corrplot
corrplot(cor_matrix, method = "color",
type = "upper",
addCoef.col = "black",
tl.col = "black",
diag = FALSE,
title = "Συσχετίσεις Μεταβλητών Euroleague",
mar = c(0,0,2,0))Με βάση τον πίνακα συσχετίσεων, εντοπίζουμε τις παρακάτω κρίσιμες σχέσεις που καθορίζουν τη στρατηγική των ομάδων:
Η ανάλυση δείχνει ότι αν ένας προπονητής θέλει να βελτιώσει άμεσα την ομάδα του, πρέπει να εστιάσει σε δύο άξονες:
Μείωση των Λαθών (TOV): Είναι ο παράγοντας που επηρεάζει περισσότερο από κάθε άλλον το σκοράρισμα αρνητικά (-0.59).
Ενίσχυση της Δημιουργίας (AST): Η καλή κυκλοφορία (0.55) είναι η “απάντηση” για μια επιτυχημένη επίθεση.
Εντύπωση προκαλεί η σχέση PTS. με PTS..1 (0.31), η οποία δείχνει ότι οι ομάδες με πολύ καλή επίθεση τείνουν να δέχονται και περισσότερους πόντους, πιθανώς λόγω του υψηλού ρυθμού (Pace) των αγώνων τους.