Το dataset περιέχει στοιχεία πωλήσεων της Adidas, συμπεριλαμβανομένων των τιμών ανά μονάδα, των πωληθέντων μονάδων, του συνολικού κέρδους και της μεθόδου πώλησης. Επιλέχθηκε γιατί παρέχει ευκαιρία για ανάλυση βασικών επιχειρηματικών KPIs.
Πηγή Dataset: Το Dataset λήφθηκε από το Kaggle.
Τα δεδομένα πωλήσεων της Adidas μπορούν να είναι χρήσιμα σε συνδυασμό με την επιχειρηματική αναλυτική για διάφορους σκοπούς, όπως η ανάλυση των τάσεων των πωλήσεων, ο εντοπισμός επιτυχημένων προϊόντων ή εκστρατειών μάρκετινγκ, η ανάπτυξη στρατηγικών για μελλοντικές πωλήσεις και γενικότερα εύστοχες εκπτώσεις σε σχέση με τις τάσεις. Μπορεί επίσης να χρησιμοποιηθεί για τη σύγκριση των πωλήσεων της Adidas με αυτές των ανταγωνιστών ή για την ανάλυση της αποτελεσματικότητας διαφορετικών καναλιών μάρκετινγκ ή πωλήσεων
1)Υπάρχουν εποχιακές τάσεις στις πωλήσεις συγκεκριμένων προϊόντων;
2)Ποιος τύπος προϊόντος αποδίδει καλύτερα σε κέρδος και ποιος σε αριθμό πωλήσεων;
3)Πώς διαφοροποιούνται οι προτιμήσεις προϊόντων μεταξύ διαφορετικών γεωγραφικών περιοχών;
4)Ποιοι λιανοπωλητές έχουν το υψηλότερο περιθώριο κέρδους και ποιοι το χαμηλότερο και πώς μπορούμε να το βελτιώσουμε αυτό;
5)Ποιες κατηγορίες προϊόντων τείνουν να πωλούνται μαζί; Μπορούμε να προτείνουμε σχετικές προωθητικές ενέργειες;
library(readr)
library(dplyr)
library(ggplot2)
# Φόρτωση του αρχείου
datasaless <- read_csv("data_sales (1).csv")
# Καθαρισμός και μετατροπή αριθμητικών στηλών
numeric_columns <- c("Price per Unit", "Units Sold", "Total Sales", "Operating Profit")
datasaless <- datasaless %>%
mutate(across(all_of(numeric_columns), ~ as.numeric(gsub("[^0-9.-]", "", .))))
Retailer: Το όνομα του λιανοπωλητή(Κατηγορική)
Retailer ID: Μοναδικός κωδικός λιανοπωλητή(Αριθμητική)
Invoice Date: Ημερομηνία τιμολογίου(Ημερομηνία)
Region: Περιοχή(Κατηγορική)
State: Πολιτεία(Κατηγορική)
City: Πόλη(Κατηγορική) Product: Κατηγορία προϊόντος(Κατηγορική)
Price per Unit: Τιμή ανά μονάδα(Αριθμητική)
Units Sold: Ποσότητα πωληθέντων μονάδων(Αριθμητική)
Total Sales: Συνολικές πωλήσεις(Αριθμητική)
Operating Profit: Λειτουργικό κέρδος(Αριθμητική)
Sales Method: Τρόπος πώλησης: Online, Outlet Adidas, ή κατάστημα Adidas(Κατηγορική)
summary(datasaless %>% select(c("Price per Unit", "Units Sold", "Total Sales", "Operating Profit")))
## Price per Unit Units Sold Total Sales Operating Profit
## Min. : 7.00 Min. : 0.0 Min. : 0 Min. : 0
## 1st Qu.: 35.00 1st Qu.: 106.0 1st Qu.: 425 1st Qu.: 192
## Median : 45.00 Median : 176.0 Median : 957 Median : 437
## Mean : 45.21 Mean : 256.8 Mean : 9316 Mean : 3439
## 3rd Qu.: 55.00 3rd Qu.: 350.0 3rd Qu.:15000 3rd Qu.: 5200
## Max. :110.00 Max. :1275.0 Max. :82500 Max. :39000
## NA's :2
correlations <- cor(datasaless %>% select(all_of(numeric_columns)), use = "complete.obs")
correlations
## Price per Unit Units Sold Total Sales Operating Profit
## Price per Unit 1.0000000 0.2656518 0.4354269 0.3943661
## Units Sold 0.2656518 1.0000000 0.9134002 0.8925229
## Total Sales 0.4354269 0.9134002 1.0000000 0.9565981
## Operating Profit 0.3943661 0.8925229 0.9565981 1.0000000
ggplot(datasaless, aes(x=`Price per Unit`)) +
geom_histogram(binwidth = 5, fill = "skyblue", color = "black", alpha = 0.7) +
labs(title = "Ιστόγραμμα: Κατανομή Τιμών ανά Μονάδα", x = "Price per Unit", y = "Συχνότητα Εμφάνισης")
Σχόλιο: Οι περισσότερες τιμές συγκεντρώνονται στην περιοχή μεταξύ 30 και 60, που σημαίνει ότι η πλειοψηφία των προϊόντων πωλείται σε αυτή την τιμή. Υπάρχουν λίγες τιμές κάτω από 20 ή πάνω από 90, γεγονός που υποδηλώνει ότι οι ακραίες τιμές είναι σχετικά σπάνιες.
ggplot(datasaless, aes(x=`Units Sold`, y=`Total Sales`)) +
geom_point(color = "red", alpha = 0.8) +
labs(title = "Διάγραμμα Διασποράς: Units Sold vs Total Sales", x = "Units sold", y = "Total Sales")
Σχόλιο: Τα σημεία σχηματίζουν ένα μοτίβο αύξησης, γεγονός που υποδεικνύει ότι η αύξηση στις πωλήσεις προκύπτει κυρίως από την αύξηση των μονάδων που πωλούνται. Παρατηρούνται κάποια διακριτά επίπεδα τιμών, πιθανώς λόγω συγκεκριμένων σταθερών τιμών μονάδας. ### Boxplot Μέθοδων Πώλησης
ggplot(datasaless, aes(x=`Sales Method`, y=`Price per Unit`, fill=`Sales Method`)) +
geom_boxplot() +
labs(title = "Boxplot τιμών ανά Μονάδα για κάθε Μέθοδο Πώλησης", x = "Sales Method", y = "Price per Unit")
Σχόλιο: Οι μέθοδοι In-store και Online έχουν παρόμοια κατανομή τιμών, αλλά η μέθοδος Outlet φαίνεται να έχει χαμηλότερες τιμές κατά μέσο όρο. Οι διαφορετικές μέθοδοι πώλησης επηρεάζουν την τιμή, με την κατηγορία Outlet να έχει γενικά χαμηλότερες τιμές και την κατηγορία Online να περιλαμβάνει περισσότερες ακραίες τιμές.
ggplot(datasaless, aes(x = `Sales Method`, fill = `Sales Method` )) +
geom_bar(color = "black", alpha = 0.8) +
labs(title = "Ραβδόγραμμα: Μέθοδοι Πώλησης", x = "Sales Method", y = "Συχνότητα Εμφάνισης")
Σχόλιο: Η πλειοψηφία των πωλήσεων πραγματοποιείται μέσω της online μεθόδου, ακολουθούμενη από τα Outlet και τέλος τις In-store αγορές.Αυτό υποδηλώνει ότι το ηλεκτρονικό εμπόριο αποτελεί τον κύριο δίαυλο εσόδων της επιχείρησης, ενώ οι φυσικές αγορές έχουν μικρότερη συνεισφορά.
Η ανάλυση των δεδομένων έδειξε ότι η αύξηση των πωλήσεων συνδέεται άμεσα με την αύξηση των εσόδων και των κερδών, γεγονός που καθιστά κρίσιμη τη στρατηγική ενίσχυσης των πωλήσεων μέσω προωθήσεων και στοχευμένων προσφορών. Η τιμή ανά μονάδα έχει μέτρια επίδραση στις συνολικές πωλήσεις, υποδεικνύοντας ότι μια έξυπνη τιμολογιακή πολιτική μπορεί να μεγιστοποιήσει τα κέρδη χωρίς να μειώσει τη ζήτηση.Επιπλέον, η εστίαση σε προϊόντα με υψηλή απόδοση μπορεί να ενισχύσει την κερδοφορία. Τα ευρήματα αυτά προσφέρουν πολύτιμες πληροφορίες για τη λήψη επιχειρηματικών αποφάσεων σε επίπεδο μάρκετινγκ, αποθεμάτων και στρατηγικής ανάπτυξης.