1.Περιγραφή Dataset

Το dataset περιέχει στοιχεία πωλήσεων της Adidas, συμπεριλαμβανομένων των τιμών ανά μονάδα, των πωληθέντων μονάδων, του συνολικού κέρδους και της μεθόδου πώλησης. Επιλέχθηκε γιατί παρέχει ευκαιρία για ανάλυση βασικών επιχειρηματικών KPIs.

Πηγή Dataset: Το Dataset λήφθηκε από το Kaggle.

2.Επιχειρηματική Αναλυτική

Τα δεδομένα πωλήσεων της Adidas μπορούν να είναι χρήσιμα σε συνδυασμό με την επιχειρηματική αναλυτική για διάφορους σκοπούς, όπως η ανάλυση των τάσεων των πωλήσεων, ο εντοπισμός επιτυχημένων προϊόντων ή εκστρατειών μάρκετινγκ, η ανάπτυξη στρατηγικών για μελλοντικές πωλήσεις και γενικότερα εύστοχες εκπτώσεις σε σχέση με τις τάσεις. Μπορεί επίσης να χρησιμοποιηθεί για τη σύγκριση των πωλήσεων της Adidas με αυτές των ανταγωνιστών ή για την ανάλυση της αποτελεσματικότητας διαφορετικών καναλιών μάρκετινγκ ή πωλήσεων

3.Επιχειρηματικά Ερωτήματα

1)Υπάρχουν εποχιακές τάσεις στις πωλήσεις συγκεκριμένων προϊόντων;

2)Ποιος τύπος προϊόντος αποδίδει καλύτερα σε κέρδος και ποιος σε αριθμό πωλήσεων;

3)Πώς διαφοροποιούνται οι προτιμήσεις προϊόντων μεταξύ διαφορετικών γεωγραφικών περιοχών;

4)Ποιοι λιανοπωλητές έχουν το υψηλότερο περιθώριο κέρδους και ποιοι το χαμηλότερο και πώς μπορούμε να το βελτιώσουμε αυτό;

5)Ποιες κατηγορίες προϊόντων τείνουν να πωλούνται μαζί; Μπορούμε να προτείνουμε σχετικές προωθητικές ενέργειες;

4.Φόρτωση Δεδομένων

library(readr)
library(dplyr)
library(ggplot2)

# Φόρτωση του αρχείου
datasaless <- read_csv("data_sales (1).csv")



# Καθαρισμός και μετατροπή αριθμητικών στηλών

numeric_columns <- c("Price per Unit", "Units Sold", "Total Sales", "Operating Profit")
datasaless <- datasaless %>% 
  mutate(across(all_of(numeric_columns), ~ as.numeric(gsub("[^0-9.-]", "", .))))

5.Περιγραφή Μεταβλητών

Retailer:  Το όνομα του λιανοπωλητή(Κατηγορική)
Retailer ID: Μοναδικός κωδικός λιανοπωλητή(Αριθμητική)
Invoice Date: Ημερομηνία τιμολογίου(Ημερομηνία)
Region: Περιοχή(Κατηγορική)
State: Πολιτεία(Κατηγορική)
City: Πόλη(Κατηγορική) Product: Κατηγορία προϊόντος(Κατηγορική)
Price per Unit: Τιμή ανά μονάδα(Αριθμητική)
Units Sold: Ποσότητα πωληθέντων μονάδων(Αριθμητική)
Total Sales: Συνολικές πωλήσεις(Αριθμητική)
Operating Profit: Λειτουργικό κέρδος(Αριθμητική)
Sales Method: Τρόπος πώλησης: Online, Outlet Adidas, ή κατάστημα Adidas(Κατηγορική)

6.Περιγραφικά Στατιστικά

summary(datasaless %>% select(c("Price per Unit", "Units Sold", "Total Sales", "Operating Profit")))
##  Price per Unit     Units Sold      Total Sales    Operating Profit
##  Min.   :  7.00   Min.   :   0.0   Min.   :    0   Min.   :    0   
##  1st Qu.: 35.00   1st Qu.: 106.0   1st Qu.:  425   1st Qu.:  192   
##  Median : 45.00   Median : 176.0   Median :  957   Median :  437   
##  Mean   : 45.21   Mean   : 256.8   Mean   : 9316   Mean   : 3439   
##  3rd Qu.: 55.00   3rd Qu.: 350.0   3rd Qu.:15000   3rd Qu.: 5200   
##  Max.   :110.00   Max.   :1275.0   Max.   :82500   Max.   :39000   
##  NA's   :2

7.Ανάλυση Συσχετίσεων

correlations <- cor(datasaless %>% select(all_of(numeric_columns)), use = "complete.obs")
correlations
##                  Price per Unit Units Sold Total Sales Operating Profit
## Price per Unit        1.0000000  0.2656518   0.4354269        0.3943661
## Units Sold            0.2656518  1.0000000   0.9134002        0.8925229
## Total Sales           0.4354269  0.9134002   1.0000000        0.9565981
## Operating Profit      0.3943661  0.8925229   0.9565981        1.0000000

8.Οπτικοποίηση Δεδομένων

α.Histogram της Τιμής ανά Μονάδα

ggplot(datasaless, aes(x=`Price per Unit`)) +
  geom_histogram(binwidth = 5, fill = "skyblue", color = "black", alpha = 0.7) +
  labs(title = "Ιστόγραμμα: Κατανομή Τιμών ανά Μονάδα", x = "Price per Unit", y = "Συχνότητα Εμφάνισης")

Σχόλιο: Οι περισσότερες τιμές συγκεντρώνονται στην περιοχή μεταξύ 30 και 60, που σημαίνει ότι η πλειοψηφία των προϊόντων πωλείται σε αυτή την τιμή. Υπάρχουν λίγες τιμές κάτω από 20 ή πάνω από 90, γεγονός που υποδηλώνει ότι οι ακραίες τιμές είναι σχετικά σπάνιες.

β.Scatter Plot Πωλήσεων ενός προϊόντος σε σχέση με τις συνολικές πωλήσεις

ggplot(datasaless, aes(x=`Units Sold`, y=`Total Sales`)) +
  geom_point(color = "red", alpha = 0.8) +
  labs(title = "Διάγραμμα Διασποράς: Units Sold vs Total Sales", x = "Units sold", y = "Total Sales")

Σχόλιο: Τα σημεία σχηματίζουν ένα μοτίβο αύξησης, γεγονός που υποδεικνύει ότι η αύξηση στις πωλήσεις προκύπτει κυρίως από την αύξηση των μονάδων που πωλούνται. Παρατηρούνται κάποια διακριτά επίπεδα τιμών, πιθανώς λόγω συγκεκριμένων σταθερών τιμών μονάδας. ### Boxplot Μέθοδων Πώλησης

γ.Boxplot τιμών ανά Μονάδα για κάθε Μέθοδο Πώλησης

ggplot(datasaless, aes(x=`Sales Method`, y=`Price per Unit`, fill=`Sales Method`)) +
  geom_boxplot() +
  labs(title = "Boxplot τιμών ανά Μονάδα για κάθε Μέθοδο Πώλησης", x = "Sales Method", y = "Price per Unit")

Σχόλιο: Οι μέθοδοι In-store και Online έχουν παρόμοια κατανομή τιμών, αλλά η μέθοδος Outlet φαίνεται να έχει χαμηλότερες τιμές κατά μέσο όρο. Οι διαφορετικές μέθοδοι πώλησης επηρεάζουν την τιμή, με την κατηγορία Outlet να έχει γενικά χαμηλότερες τιμές και την κατηγορία Online να περιλαμβάνει περισσότερες ακραίες τιμές.

δ.Ραβδόγραμμα Συχνότητας Μεθόδων Πώλησης

ggplot(datasaless, aes(x = `Sales Method`, fill = `Sales Method` )) +
  geom_bar(color = "black", alpha = 0.8) +
  labs(title = "Ραβδόγραμμα: Μέθοδοι Πώλησης", x = "Sales Method", y = "Συχνότητα Εμφάνισης")

Σχόλιο: Η πλειοψηφία των πωλήσεων πραγματοποιείται μέσω της online μεθόδου, ακολουθούμενη από τα Outlet και τέλος τις In-store αγορές.Αυτό υποδηλώνει ότι το ηλεκτρονικό εμπόριο αποτελεί τον κύριο δίαυλο εσόδων της επιχείρησης, ενώ οι φυσικές αγορές έχουν μικρότερη συνεισφορά.

Συμπεράσματα

Η ανάλυση των δεδομένων έδειξε ότι η αύξηση των πωλήσεων συνδέεται άμεσα με την αύξηση των εσόδων και των κερδών, γεγονός που καθιστά κρίσιμη τη στρατηγική ενίσχυσης των πωλήσεων μέσω προωθήσεων και στοχευμένων προσφορών. Η τιμή ανά μονάδα έχει μέτρια επίδραση στις συνολικές πωλήσεις, υποδεικνύοντας ότι μια έξυπνη τιμολογιακή πολιτική μπορεί να μεγιστοποιήσει τα κέρδη χωρίς να μειώσει τη ζήτηση.Επιπλέον, η εστίαση σε προϊόντα με υψηλή απόδοση μπορεί να ενισχύσει την κερδοφορία. Τα ευρήματα αυτά προσφέρουν πολύτιμες πληροφορίες για τη λήψη επιχειρηματικών αποφάσεων σε επίπεδο μάρκετινγκ, αποθεμάτων και στρατηγικής ανάπτυξης.