το λινκ για το ντατασετ μπορειτε να το βρειτε παραπανω
Το dataset περιλαμβάνει πληροφορίες για κινητά τηλέφωνα και τα τεχνικά τους χαρακτηριστικά, με στόχο την κατηγοριοποίησή τους σε επίπεδα τιμής (Low, Medium, High, Very High).
Κάθε εγγραφή αντιστοιχεί σε μία συσκευή και περιλαμβάνει χαρακτηριστικά όπως:
Συνολικά, το dataset περιλαμβάνει 2000 παρατηρήσεις και 21 μεταβλητές, αριθμητικές και κατηγορικές.
| Όνομα Μεταβλητής | Τύπος | Περιγραφή |
|---|---|---|
| id | Αριθμητική | Μοναδικό ID κάθε καταχώρησης |
| battery_power | Αριθμητική | Χωρητικότητα μπαταρίας σε mAh |
| clock_speed | Αριθμητική | Ταχύτητα επεξεργαστή σε GHz |
| internal_memory | Αριθμητική | Εσωτερική μνήμη σε GB |
| paxos | Αριθμητική | Πάχος συσκευής σε cm |
| varos | Αριθμητική | Βάρος συσκευής σε γραμμάρια |
| n_cores | Αριθμητική | Αριθμός πυρήνων επεξεργαστή |
| front_cam | Αριθμητική | Ανάλυση εμπρόσθιας κάμερας (σε MP) |
| prim_cam | Αριθμητική | Ανάλυση κύριας κάμερας (σε MP) |
| px_height | Αριθμητική | Ύψος οθόνης σε pixels |
| px_width | Αριθμητική | Πλάτος οθόνης σε pixels |
| ram | Αριθμητική | Μνήμη RAM σε MB |
| ipsos | Αριθμητική | Ύψος συσκευής (φυσικό μέγεθος) σε cm |
| platos | Αριθμητική | Πλάτος συσκευής (φυσικό μέγεθος) σε cm |
| bluetooth | Κατηγορική | Υποστήριξη Bluetooth (Yes/No) |
| dual_sim | Κατηγορική | Υποστήριξη Διπλής SIM (Yes/No) |
| four_g | Κατηγορική | Υποστήριξη 4G (Yes/No) |
| three_g | Κατηγορική | Υποστήριξη 3G (Yes/No) |
| touch_screen | Κατηγορική | Οθόνη αφής (Yes/No) |
| wifi | Κατηγορική | Υποστήριξη Wi-Fi (Yes/No) |
| price_range | Κατηγορική | Κατηγορία τιμής (Low, Medium, High, Very High) |
| min(ram) | max(ram) | mean | median | mode | std_deviation | var | range |
|---|---|---|---|---|---|---|---|
| 256 | 3998 | 2124.213 | 2146.5 | 1229 | 1084.732 | 1176644 | 3742 |
| min(talk_time) | max(talk_time) | mean | median | mode | std_deviation | var | range |
|---|---|---|---|---|---|---|---|
| 2 | 20 | 11.011 | 11 | 7 | 5.463955 | 29.85481 | 18 |
library(ggplot2)
ggplot(df, aes(x = ram, y = battery_power)) +
geom_point(color = "darkblue", alpha = 0.4) +
labs(
title = "Correlation between RAM and Battery Power",
x = "RAM (MB)",
y = "Battery Power (mAh)"
) +
theme_minimal()
Το διάγραμμα δεν δείχνει κάποιο σαφές μοτίβο ή τάση. Οι τιμές είναι διάσπαρτες, κάτι που υποδηλώνει πως η RAM και η μπαταρία δεν σχετίζονται άμεσα. Υπάρχουν κινητά με πολλή RAM και μικρή μπαταρία, και το αντίστροφο.
df$dual_sim <- as.factor(df$dual_sim)
ggplot(df, aes(x = dual_sim, fill = dual_sim)) +
geom_bar() +
labs(
title = "Distribution of Devices With and Without Dual SIM",
x = "Dual SIM Technology Support",
y = "Number of Devices"
) +
theme_minimal()
Στο παρόν dataset δεν υπάρχει μεγάλη ανομοιομορφία μεταξύ συσκευών με dual_sim και χωρίς
ggplot(df, aes(x = px_height)) +
geom_histogram(binwidth = 20, fill = "steelblue", color = "black") +
labs(
title = "Distribution of Screen Height (px)",
x = "Screen Height (pixels)",
y = "Frequency"
) +
theme_minimal()
Όσο αυξάνεται το ύψος της οθόνης τόσα λιγότερα κινητά βρίσκουμε στο dataset
ggplot(df, aes(x = factor(price_range), y = ram, fill = factor(price_range))) +
geom_boxplot() +
labs(
title = "RAM Distribution by Price Category",
x = "Price Category",
y = "RAM (MB)"
) +
theme_minimal()
Όσο αυξάνεται η Ram τόσες περισσότερες συσκευές είναι σε κατηγορίες με πιο ακριβή τιμή
Το συγκεκριμένο dataset είναι ιδανικό για επιχειρηματική αναλυτική, καθώς περιέχει τεχνικά και λειτουργικά χαρακτηριστικά κινητών τηλεφώνων μαζί με την κατηγορία τιμής τους. Μέσα από την ανάλυση, μπορούμε να αναγνωρίσουμε μοτίβα που σχετίζουν χαρακτηριστικά όπως RAM, κάμερα ή μπαταρία με την τιμολόγηση.
ΛΙΣΤΑ