Το παρόν dataset απεικονίζει τις πωλήσεις ηλεκτρονικών παιχνιδιών που έχουν ξεπεράσει τα εκατό χιλιάδες αντίτυπα παγκοσμίως. Το dataset αυτό καταγράφεται το 2013 και λαμβάνουν μέρος ευρέως διαδεδομένες εταιρείες όπως η Nintendo, Electronic Arts(EA), Activision κ.α. Ακόμη, αναφέρεται και στην χρονιά έκδοσης των παιχνιδιών, σε ποια πλατφόρμα έχει εκδοθεί αρχικά, σε τι κατηγορία παιχνιδιών ανήκει και τις πωλήσεις που πραγματοποίησαν σε Βόρεια Αμερική, Ευρώπη, Ιαπωνία και στον υπόλοιπο κόσμο σε εκατομμύρια.
Ο κύριος λόγος επιλογής του επιμέρους συνόλου δεδομένων είναι η γνωστοποίηση των εταιρειών για το ποιά κατηγορία video games είναι η πιο κερδοφόρα, έτσι ώστε να να δημιουργήσουν μελλοντικές ιδέες που θα τους ωφελήσουν με ένα πλεονεκτικό προβάδισμα από τους υπόλοιπους ανταγωνιστές.
-Ποιά κατηγορία ηλεκτρονικών παιχνιδιών έχει μεγαλύτερη φήμη τα τελευταία χρόνια;
-Ποιές εταιρείες κατά πάσα πιθανότητα θα χρεοκοπήσουν ή θα αυξηθούν τα κέρδη τους;
-Ποιοί είναι οι κίνδυνοι που αντιμετωπίζονται όσον αφορά τις πωλήσεις σε κάθε ήπειρο ή σε όλη την υφήλιο;
-Ποιά παιχνίδια έχουν την πιο πολλή ζήτηση από τους καταναλωτές;
1.Rank(Numeric): Βαθμός παιχνιδιού στις συνολικές πωλήσεις κατα φθίνουσα σειρά.
2.Name(Character): Όνομα ηλεκτρονικού παιχνιδιού.
3.Platform(Categorical): Σε ποιά πλατφόρμα παιχνιδιών εκδόθηκε πρώτα.
4.Year(Numeric): Σε ποιά χρονολογία το παιχνίδι βγήκε στην αγορά.
5.Genre(Categorical): Η κατηγορία που το παιχνίδι βασίζεται πάνω της (είτε είναι δράσης, είτε περιπέτειας, είτε στρατηγικής κτλ.).
6.Publisher(Categorical): Η εταιρεία που έκδωσε το ηλεκτρονικό παιχνίδι.
7.NA_Sales(Numeric): Οι πωλήσεις του παιχνιδιού στην Βόρεια Αμερική σε εκατομμύρια.
8.EU_Sales(Numeric): Οι πωλήσεις του παιχνιδιού στην Ευρώπη σε εκατομμύρια.
9.JP_Sales(Numeric): Οι πωλήσεις του παιχνιδιού στην Ιαπωνία σε εκατομμύρια.
10.Other_Sales(Numeric): Οι πωλήσεις του παιχνιδιού στον υπόλοιπο κόσμο σε εκατομμύρια.
11.Global_Sales(Numeric): Οι συνολικές πωλήσεις του παιχνιδιού που διαδραματίστηκαν παγκόσμια.
*Στο παρόν dataset δεν υπάρχουν διπλότυπες εγγραφές χάρις την βοήθεια του OpenRefine.
summary(vgsales2)
## Rank Name Platform Year
## Min. : 1.0 Length:622 Length:622 Length:622
## 1st Qu.: 168.5 Class :character Class :character Class :character
## Median : 433.0 Mode :character Mode :character Mode :character
## Mean : 1214.3
## 3rd Qu.: 1179.0
## Max. :14912.0
## Genre Publisher NA_Sales EU_Sales
## Length:622 Length:622 Min. : 0.000 Min. : 0.000
## Class :character Class :character 1st Qu.: 0.630 1st Qu.: 0.320
## Mode :character Mode :character Median : 1.520 Median : 0.875
## Mean : 2.279 Mean : 1.412
## 3rd Qu.: 2.670 3rd Qu.: 1.870
## Max. :41.490 Max. :29.020
## JP_Sales Other_Sales Global_Sales
## Min. : 0.0000 Min. : 0.0000 Min. : 0.020
## 1st Qu.: 0.0000 1st Qu.: 0.0900 1st Qu.: 1.573
## Median : 0.0600 Median : 0.2250 Median : 3.165
## Mean : 0.5919 Mean : 0.4471 Mean : 4.728
## 3rd Qu.: 0.5400 3rd Qu.: 0.5500 3rd Qu.: 5.405
## Max. :10.2200 Max. :10.5700 Max. :82.740
#Mean
NA_Salesm <- mean(vgsales2$NA_Sales)
EU_Salesm <- mean(vgsales2$EU_Sales)
JP_Salesm <- mean(vgsales2$JP_Sales)
Other_Salesm <- mean(vgsales2$Other_Sales)
Global_Salesm <-mean(vgsales2$Global_Sales)
cat("Μέσος Όρος πωλήσεων Βόρειας Αμερικής: ", NA_Salesm )
## Μέσος Όρος πωλήσεων Βόρειας Αμερικής: 2.278939
cat("Μέσος Όρος πωλήσεων Ευρώπης: ", EU_Salesm)
## Μέσος Όρος πωλήσεων Ευρώπης: 1.41172
cat("Μέσος Όρος πωλήσεων Ιαπωνίας: ", JP_Salesm)
## Μέσος Όρος πωλήσεων Ιαπωνίας: 0.591881
cat("Μέσος Όρος πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salesm)
## Μέσος Όρος πωλήσεων στον υπόλοιπο κόσμο: 0.44709
cat("Μέσος Όρος συνολικών πωλήσεων παγκοσμίως: ", Global_Salesm)
## Μέσος Όρος συνολικών πωλήσεων παγκοσμίως: 4.727653
#Median
NA_Salesmd <-median(vgsales2$NA_Sales)
EU_Salesmd <-median(vgsales2$EU_Sales)
JP_Salesmd <-median(vgsales2$JP_Sales)
Other_Salesmd <-median(vgsales2$Other_Sales)
Global_Salesmd <-median(vgsales2$Global_Sales)
cat("Διάμεσος πωλήσεων Βόρειας Αμερικής: ", NA_Salesmd)
## Διάμεσος πωλήσεων Βόρειας Αμερικής: 1.52
cat("Διάμεσος πωλήσεων Ευρώπης: ", EU_Salesmd)
## Διάμεσος πωλήσεων Ευρώπης: 0.875
cat("Διάμεσος πωλήσεων Ιαπωνίας: ", JP_Salesmd)
## Διάμεσος πωλήσεων Ιαπωνίας: 0.06
cat("Διάμεσος πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salesmd)
## Διάμεσος πωλήσεων στον υπόλοιπο κόσμο: 0.225
cat("Διάμεσος συνολικών πωλήσεων παγκοσμίως: ", Global_Salesmd)
## Διάμεσος συνολικών πωλήσεων παγκοσμίως: 3.165
#Mode
NA_Salesfr <- sort(vgsales2$NA_Sales, decreasing = FALSE) [1]
EU_Salesfr <- sort(vgsales2$EU_Sales, decreasing = FALSE) [1]
JP_Salesfr <- sort(vgsales2$JP_Sales, decreasing = FALSE) [1]
Other_Salesfr <- sort(vgsales2$Other_Sales, decreasing = FALSE) [1]
Global_Salesfr <- sort(vgsales2$Global_Sales, decreasing = FALSE) [1]
cat("Επικρατούσα τιμή πωλήσεων Βόρειας Αμερικής: ", NA_Salesfr)
## Επικρατούσα τιμή πωλήσεων Βόρειας Αμερικής: 0
cat("Επικρατούσα τιμή πωλήσεων Ευρώπης: ", EU_Salesfr)
## Επικρατούσα τιμή πωλήσεων Ευρώπης: 0
cat("Επικρατούσα τιμή πωλήσεων Ιαπωνίας: ", JP_Salesfr)
## Επικρατούσα τιμή πωλήσεων Ιαπωνίας: 0
cat("Επικρατούσα τιμή πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salesfr)
## Επικρατούσα τιμή πωλήσεων στον υπόλοιπο κόσμο: 0
cat("Επικρατούσα τιμή συνολικών πωλήσεων παγκοσμίως: ", Global_Salesfr)
## Επικρατούσα τιμή συνολικών πωλήσεων παγκοσμίως: 0.02
#Standard Deviation
NA_Salessd <- sd(vgsales2$NA_Sales)
EU_Salessd <- sd(vgsales2$EU_Sales)
JP_Salessd <- sd(vgsales2$JP_Sales)
Other_Salessd <- sd(vgsales2$Other_Sales)
Global_Salessd <- sd(vgsales2$Global_Sales)
cat("Τυπική απόκλιση πωλήσεων Βόρειας Αμερικής: ", NA_Salessd)
## Τυπική απόκλιση πωλήσεων Βόρειας Αμερικής: 3.265958
cat("Τυπική απόκλιση πωλήσεων Ευρώπης: ", EU_Salessd)
## Τυπική απόκλιση πωλήσεων Ευρώπης: 2.0014
cat("Τυπική απόκλιση πωλήσεων Ιαπωνίας: ", JP_Salessd)
## Τυπική απόκλιση πωλήσεων Ιαπωνίας: 1.198177
cat("Τυπική απόκλιση πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salessd)
## Τυπική απόκλιση πωλήσεων στον υπόλοιπο κόσμο: 0.7832695
cat("Τυπική απόκλιση συνολικών πωλήσεων παγκοσμίως: ", Global_Salessd)
## Τυπική απόκλιση συνολικών πωλήσεων παγκοσμίως: 6.092559
#Variance
NA_Salesv <- var(vgsales2$NA_Sales)
EU_Salesv <- var(vgsales2$EU_Sales)
JP_Salesv <- var(vgsales2$JP_Sales)
Other_Salesv <- var(vgsales2$Other_Sales)
Global_Salesv <- var(vgsales2$Global_Sales)
cat("Διακύμανση πωλήσεων Βόρειας Αμερικής: ", NA_Salesv)
## Διακύμανση πωλήσεων Βόρειας Αμερικής: 10.66648
cat("Διακύμανση πωλήσεων Ευρώπης: ", EU_Salesv)
## Διακύμανση πωλήσεων Ευρώπης: 4.005601
cat("Διακύμανση πωλήσεων Ιαπωνίας: ", JP_Salesv)
## Διακύμανση πωλήσεων Ιαπωνίας: 1.435628
cat("Διακύμανση πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salesv)
## Διακύμανση πωλήσεων στον υπόλοιπο κόσμο: 0.6135112
cat("Διακύμανση συνολικών πωλήσεων παγκοσμίως: ",Global_Salesv)
## Διακύμανση συνολικών πωλήσεων παγκοσμίως: 37.11928
#Range
NA_Salesra <- range(vgsales2$NA_Sales)
EU_Salesra <- range(vgsales2$EU_Sales)
JP_Salesra <-range(vgsales2$JP_Sales)
Other_Salesra <- range(vgsales2$Other_Sales)
GLobal_Salesra <- range(vgsales2$Global_Sales)
cat("Εύρος πωλήσεων Βόρειας Αμερικής: ", NA_Salesra)
## Εύρος πωλήσεων Βόρειας Αμερικής: 0 41.49
cat("Εύρος πωλήσεων Ευρώπης: ", EU_Salesra)
## Εύρος πωλήσεων Ευρώπης: 0 29.02
cat("Εύρος πωλήσεων Ιαπωνίας: ", JP_Salesra)
## Εύρος πωλήσεων Ιαπωνίας: 0 10.22
cat("Εύρος πωλήσεων στον υπόλοιπο κόσμο: ", Other_Salesra)
## Εύρος πωλήσεων στον υπόλοιπο κόσμο: 0 10.57
cat("Εύρος συνολικών πωλήσεων παγκοσμίως: ",GLobal_Salesra)
## Εύρος συνολικών πωλήσεων παγκοσμίως: 0.02 82.74
Στο συγκεκριμένο διάγραμμα παρατηρούμε το εξής:
Η μέγιστη τιμή των πωλήσεων της Βόρειας Αμερικής είναι μεγαλύτερη από εκείνη της Ευρώπης.
Στο εύρος τιμών μεταξύ 0 και 10 είναι οι περισσότερες τιμές κατανεμημένες.
Η διασπορά των πωλήσεων στην Ευρώπη είναι μεγαλύτερη από εκείνη της Βόρειας Αμερικής.
Απο το παραπάνω διάγραμμα παρατηρείται ότι:
Τα περισσότερα outliers φαίνονται να είναι στην κατηγορία παιχνιδιών action, platform και role-playing πράγμα που καθιστά εκείνες τις κατηγορίες να έχουν περισσότερη ζήτηση.
Η κατηγορία sports επίσης κατέχει αρκετά outliers και το ενα από αυτά είναι στην υψηλοτερη τιμή παγκοσμίως στα 82 περίπου εκατομμύρια πωλήσεις.
Η χαμηλότερη τιμή βρίσκεται στην κατηγορία του simulation συμπεραίνωντας την αποφυγή αγοράς των παιχνιδιών με αυτή την κατηγορία από τους καταναλωτές.
Η διάμεσος των περισσότερων κατηγοριών είναι σταθερή.
Η κατηγορία με την μεγαλύτερη διασπορά είναι τα sports δηλαδή οι πωλήσεις που πραγματοποιεί αυτή παγκοσμίως κυμαίνονται να μεταβάλλονται ανάλογα.
Από το ιστόγραμμα φαίνεται:
Το μεγαλύτερο ποσοστό των τιμών πωλήσεων στην Ευρώπη είναι απο 0 εώς 3-3.5 εκατομμύρια.
Μετά από αυτό δεν σημειώνεται καμία αξιόλογη τιμή με τις περισσότερες να είναι πολύ ελάχιστες.
Κλείνοντας, το τελευταίο διάγραμμα μας αναδεικνύει:
Την πιο δημοφιλής πλατφόρμα όπου χρησιμοποιούσαν και αγώραζαν οι καταναλωτές τα ηλεκτρονικά παιχνίδια εκείνη την εποχή (2013) η οποία δεν είναι άλλη από την PS2.
Ακολουθούν λίγο πιό κάτω από την PS2 οι πλατφόρμες PS3 και Xbox360 οι οποίες είχαν και τον μεγαλύτερο ανταγωνισμό τότε.
Μετά τις δύο αυτές πλατφόρμες ακολουθούν 3 ακόμη πολύ δημοφιλές που ήταν και αυτές αξέχαστες είναι η Wii, η DS και το PS.
Τέλος, οι υπόλοιπες πλατφόρμες βιντεοπαιχνιδιών ήτανε πολύ χαμηλά στην αγορά τότε. ’Ομως, αυτό δεν σημαίνει ότι κάποιες από αυτές, όπως παραδείγματος χάρειν η πλατφόρμα PS4 και Xbox One είχαν τo ενδεχόμενο να μείνουν χαμηλά στην τάση της αγοράς. Αυτό αποδεικνύει ότι η κάθε πλατφόρμα μπορεί να προορίζεται για την πρωτία όταν χρησιμοποιεί τις κατάλληλες τεχνικές επιχειρηματικής αναλυτικής.