Lanskap seluler yang selalu berubah adalah ruang yang menantang untuk dinavigasi. . Persentase seluler melalui desktop hanya meningkat. Android menguasai sekitar 53,2% pasar smartphone, sedangkan iOS 43%. Untuk membuat lebih banyak orang mengunduh aplikasi Anda, Anda perlu memastikan bahwa mereka dapat dengan mudah menemukan aplikasi Anda. Analisis aplikasi seluler adalah cara yang bagus untuk memahami strategi yang ada untuk mendorong pertumbuhan dan retensi pengguna di masa mendatang.
Dengan jutaan aplikasi yang ada saat ini, kumpulan data berikut telah menjadi sangat penting untuk mendapatkan aplikasi trending teratas di toko aplikasi iOS. Kumpulan data ini berisi lebih dari 7000 detail aplikasi seluler Apple iOS. Data diekstraksi dari iTunes Search API di situs web Apple Inc. Software R dan dataset iOS App Store 2017 yang disediakan oleh Kaggle digunakan untuk penelitian ini.
Data-data dari ios Apple Store memiliki potensi yang besar untuk dijadikan pedoman dalam kesuksesan pembuatan bisnis berbasis aplikasi. Pada dokumen ini dibuat beberapa contoh visualisasi dari data-data iOS App Store yang mudah-mudahan dapat memberikan sedikit gambaran manfaat visualisasi dalam bisnis.
Adapun juga tersedia visualisasi interaktif singkat sebagai berikut: (https://danielwijoyo.shinyapps.io/iOS_App_Store_2017_Dashboard_Analysis/)
Sebelum data di buat menjadi sebuah plot/grafik dan diinterpetasi, maka terlebih dahulu kita melakukan proses pengecekan dan penyesuaian terhadap jenis data sehingga siap untuk diolah.
# Melakukan pemanggilan package library yang akan digunakan untuk mengolah data
library(lubridate)##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
library(ggplot2)Melakukan proses import dataset ios Apple Store kedalam proses analisa
# Import Data
appstore <- read.csv("AppleStore.csv")
# Mengecek nama untuk tiap kolom yang akan digunakan sebagai variabel penelitian
names(appstore)## [1] "X" "id" "track_name" "size_bytes"
## [5] "currency" "price" "rating_count_tot" "rating_count_ver"
## [9] "user_rating" "user_rating_ver" "ver" "cont_rating"
## [13] "prime_genre" "sup_devices.num" "ipadSc_urls.num" "lang.num"
## [17] "vpp_lic"
Dimana penjelasan untuk masing-masing data, sebagai berikut:
Dalam penelitian ini kita bertujuan untuk menganalisis aplikasi terpopuler pada versi ios apps store tahun 2017, oleh karena itu kita akan melakukan eliminasi pada beberapa variabel indikator yang tidak dibutuhkan serta melihat struktur dari tiap data yang akan dipakai.
# Eliminasi indikator yang tidak dibutuhkan
appstore <- appstore[,-c(1, 2, 5, 7, 8, 9, 11, 15, 17)]
# Mengecek struktur data yang digunakan
str(appstore)## 'data.frame': 7197 obs. of 8 variables:
## $ track_name : chr "PAC-MAN Premium" "Evernote - stay organized" "WeatherBug - Local Weather, Radar, Maps, Alerts" "eBay: Best App to Buy, Sell, Save! Online Shopping" ...
## $ size_bytes : num 1.01e+08 1.59e+08 1.01e+08 1.29e+08 9.28e+07 ...
## $ price : num 3.99 0 0 0 0 0.99 0 0 9.99 3.99 ...
## $ user_rating_ver: num 4.5 3.5 4.5 4.5 5 4 4.5 4.5 5 4 ...
## $ cont_rating : chr "4+" "4+" "4+" "12+" ...
## $ prime_genre : chr "Games" "Productivity" "Weather" "Shopping" ...
## $ sup_devices.num: int 38 37 37 37 37 47 37 37 37 38 ...
## $ lang.num : int 10 23 3 9 45 1 19 1 1 10 ...
Dari struktur data yang akan digunakan di diatas, terlihat bahwa struktur data sudah sesuai sehingga tidak diperlukan perabaikan perubahan format lebih lanjut.
Dari beberapa aplikasi di dalam data base tersebut, ternyata ada beberapa aplikasi yang terduplikasi, mengingat beberapa parameter lainnya berisi nilai-nilai yang cukup identis.
# Mengecek duplikasi dengan membuat data frame baru yang berisi nama aplikasi serta total duplikasinya
appstore_dplct <- as.data.frame(table(appstore$track_name))
# Melihat 1 contoh aplikasi yang pertama kali muncul dan terduplikasi lebih dari 2 kali
subset(appstore_dplct, appstore_dplct$Freq > 2)[1,]## Var1 Freq
## NA <NA> NA
Dikarenakan tidak ada data nama aplikasi (track_name) yang terduplikasi, maka tidak diperlukan pengubahan lebih lanjut.
Dari proses sebelumnya kita dapat melihat bahwa ada beberapa aplikasi yang tidak memiliki nilai rating atau NaN. Demi menghindari ambiguitas saat kita melakukan analisis, aplikasi-aplikasi yang memiliki NaN atau Na akan kita eliminasi baik itu dari kolom rating ataupun kolom-kolom lainnya.
# Mendeteksi NaN pada data frame appstore
colSums(is.na(appstore))## track_name size_bytes price user_rating_ver cont_rating
## 0 0 0 0 0
## prime_genre sup_devices.num lang.num
## 0 0 0
Jika kita menggunakan fungsi is.na, tidak terdeteksi NaN pada dataframe appstore sehingga pengubahan lebih lanjut tidak diperlukan.
Agar nantinya kita bisa menentukan termasuk aplikasi yang berukuran besar atau tidak, kita perlu merubah faktor pada kolom size ke bentuk numerik. Akan tetapi kita tidak bisa melakukan ini secara langsung karena level-level pada factor size tidak berformat angka, dan juga tidak berurutan.
Untuk itu pertama kita harus mengkonversi tiap-tiap level pada size ke format angka.
# Kita bisa konversi terlebih dahulu dari bytes ke ukuran Mega Bytes (anggap 1 MB ~ 1000000 Bytes)
appstore$size_mb <- appstore$size_bytes/1000000
summary(appstore$size_mb)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.59 46.92 97.15 199.13 181.93 4025.97
Agar lebih mudah pengklasifikasian aplikasi berdasarkan “Size”-nya, maka dibuat kolom baru yang berisi 3 kategori size, yaitu: “Small Size App” : 0 MB - 100 MB “Medium Size App” : 100 MB - 300 MB “Big Size App” : > 300 MB
# Pembuatan kolom baru
appstore$SizeCatg <- as.character(appstore$size_mb)
# Proses pengklasifikasian aplikasi berdasarkan size
for (i in 1:length(appstore$SizeCatg)) {
if (appstore[i,"size_mb"] < 100) {
appstore[i,"SizeCatg"] <- "Small Size App"
}
else if (appstore[i,"size_mb"] >= 100 & appstore[i,"size_mb"] < 300) {
appstore[i,"SizeCatg"] <- "Medium Size App"
}
else if (appstore[i,"size_mb"] >= 300 & appstore[i,"size_mb"] <= 5000) {
appstore[i,"SizeCatg"] <- "Big Size App"
}
}
# Mengemblakikan klasifikasi ke format factor
appstore$SizeCatg <- as.factor(appstore$SizeCatg)
# Total masing-masing kategori size aplikasi
summary(appstore$SizeCatg)## Big Size App Medium Size App Small Size App
## 989 2506 3702
Selain menggunakan harga aplikasi (price) sebagai ukuran skala numerik, kita juga dapat menggunakannya sebagai data kategorial untuk ukuran perbandingan dengan variabel parameter lainnya.
Agar lebih mudah pengklasifikasian aplikasi berdasarkan “harga”-nya, maka dibuat kolom baru yang berisi 3 kategori size, yaitu: “Gratis” : 0 USD (\() “Berbayar Murah” : 0.1 USD - 10 USD (\)) “Berbayar Sedang” : 10 USD - 50 USD (\() “Berbayar Mahal” : > 50 USD (\))
# Pembuatan kolom baru
appstore$PriceCatg <- as.character(appstore$price)
# Proses pengklasifikasian aplikasi berdasarkan size
for (i in 1:length(appstore$PriceCatg)) {
if (appstore[i,"price"] < 0.1) {
appstore[i,"PriceCatg"] <- "Gratis"
}
else if (appstore[i,"price"] >= 0.1 & appstore[i,"price"] < 10) {
appstore[i,"PriceCatg"] <- "Berbayar Murah"
}
else if (appstore[i,"price"] >= 10 & appstore[i,"price"] <= 50) {
appstore[i,"PriceCatg"] <- "Berbayar Sedang"
}
else if (appstore[i,"price"] > 50) {
appstore[i,"PriceCatg"] <- "Berbayar Mahal"
}
}
# Mengemblakikan klasifikasi ke format factor
appstore$PriceCatg <- as.factor(appstore$PriceCatg)
# Total masing-masing kategori size aplikasi
summary(appstore$PriceCatg)## Berbayar Mahal Berbayar Murah Berbayar Sedang Gratis
## 7 3044 90 4056
Dalam data frame yang kita miliki, variabel yang bertipe factor dapat memiliki kelas yang berupa data kosong, atau Na/NaN. Untuk itu kita bisa mengecek kembali satu-satu, atau langsung kembali assign format factor agar kelas-kelas dalam faktor itu terupdate.
summary(appstore$SizeCatg) # Level Factor## Big Size App Medium Size App Small Size App
## 989 2506 3702
989+2506+3702 # Agregasi Total Aplikasi## [1] 7197
Deskripsi: Dari dataset iOS App Store 2017 terdapat 7.197 aplikasi seluler (mobile apps) yang terdaftar, dimana jumlah aplikasi dengan ukuran kecil (<100 MB) memiliki jumlah terbesar dengan 3.702 aplikasi terdaftar sedangkan aplikasi dengan ukuran besar (>300 MB) memiliki jumlah terkecil dengan 989 aplikasi terdaftar.
appstore$prime_genre <- factor(appstore$prime_genre)
summary(appstore$prime_genre)## Book Business Catalogs Education
## 112 57 10 453
## Entertainment Finance Food & Drink Games
## 535 104 63 3862
## Health & Fitness Lifestyle Medical Music
## 180 144 23 138
## Navigation News Photo & Video Productivity
## 46 75 349 178
## Reference Shopping Social Networking Sports
## 64 122 167 114
## Travel Utilities Weather
## 81 248 72
Deskripsi: Dari dataset iOS App Store 2017, kategori aplikasi genre Games memiliki jumlah terbanyak dengan 3.862 aplikasi terdaftar.
Menggunakan dua jenis data. Jenis data level factor (PriceCatg) digunakan sebagai analisis harga kategorial sedangkan jenis data number (price) digunakan dalam analisis skala numerik.
#Level Factor
appstore$PriceCatg <- as.factor(appstore$PriceCatg)
summary(appstore$PriceCatg)## Berbayar Mahal Berbayar Murah Berbayar Sedang Gratis
## 7 3044 90 4056
# Numerik
summary(appstore$price)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 0.000 1.726 1.990 299.990
Deskripsi: Dari dataset iOS App Store 2017, diketahui bahwa mayoritas aplikasi merupakan aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar (Level Factor) sedangkan harga aplikasi termahal adalah $299.9 USD (numeric).
appstore$cont_rating <- factor(appstore$cont_rating)
summary(appstore$cont_rating)## 12+ 17+ 4+ 9+
## 1155 622 4433 987
Deskripsi: Dari dataset iOS App Store 2017, diketahui bahwa jumlah aplikasi didominasi oleh segmentasi aplikasi ramah untuk anak balita (anak dibawah lima tahun) dengan 4.433 aplikasi terdaftar. Sedangkan aplikasi untuk segmentasi dewasa (diatas 17 tahun) memiliki jumlah terkecil dengan 622 aplikasi terdafar.
Untuk data rating pengguna, dua jenis data akan digunakan secara terpisah dimana rating pengguna dengan jenis number data digunakan sebagai skala nilai sedangkan data yang berjenis level factor digunakan untuk analisis kategorial.
appstore$user_rating_ver_factor <- factor(appstore$user_rating_ver)
summary(appstore$user_rating_ver_factor) #ukuran skala factor## 0 1 1.5 2 2.5 3 3.5 4 4.5 5
## 1443 125 74 136 176 304 533 1237 2205 964
summary(appstore$user_rating_ver) # ukuran skala numerik## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.500 4.000 3.254 4.500 5.000
Deskripsi: dari data rating pengguna, diketahui bahwa mayoritas pengguna iOS App Store pada 2017 memberikan penilaian 4.5/5 (skala number) dan apabila di ambil sample data tengahnya maka para user kebanyakan memberikan penilaian 4/5 untuk aplikasi terdaftar.
appstore$lang.num <- factor(appstore$lang.num)
summary(appstore$lang.num)## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
## 41 3767 675 217 154 207 143 133 145 138 168 266 179 130 89 86
## 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
## 114 46 71 30 21 35 32 24 16 14 22 7 8 20 28 53
## 32 33 34 35 36 37 39 40 41 42 43 45 46 47 50 54
## 17 30 13 2 4 2 2 1 2 3 2 9 4 1 1 2
## 55 56 58 59 63 68 69 74 75
## 2 1 12 1 1 1 3 1 1
Deskripsi: Diketahui dari data bahwa mayoritas aplikasi yang terdaftar di iOS App Store hanya menyediakan satu dukungan bahasa dengan jumlah 3.767 aplikas terdaftar. Dimana pada sample yang ditemukan bahasa yang digunakan ialah bahasa Inggris sebagai bahasa resmi internasional.
appstore$sup_devices.num <- factor(appstore$sup_devices.num)
summary(appstore$sup_devices.num)## 9 11 12 13 15 16 23 24 25 26 33 35 36 37 38 39
## 1 3 1 7 2 8 1 270 67 42 2 24 7 3263 1912 40
## 40 43 45 47
## 1142 371 8 26
Deskripsi: Diketahui dari data bahwa mayoritas aplikasi yang terdaftar di iOS App Store 2017 memberikan dukungan lintas perangkat sampai dengan 36 perangkat yang berbeda dengan jumlah 3.263 aplikasi terdaftar.
Analisa plot dan insights yang dilakukan dalam dataset iOS App Store versi 2017 dapat dibagi menjadi tiga bagian besar. Pertama, yaitu analisa berdasarkan kategori ukuran aplikasi. Kedua, yaitu analisa berdasarkan penilaian rating pengguna. Ketiga, yaitu analisa berdasarkan kategori genre aplikasi. Pada bagian terakhir, sebuah kesimpulan insight akan diberikan untuk merangkum temuan dalam penelitian ini.
Tujuan: Dalam hal ini kita ingin menganalisis hubungan besaran ukuran aplikasi terhadap penilaian pengguna.
ggplot(data = appstore, aes(x = SizeCatg,y = user_rating_ver))+
geom_boxplot(aes(color = SizeCatg))+
scale_color_manual(values = c("red","blue","green"))+
labs(title="Persebaran Harga Berdasarkan Ukuran Aplikasi",subtitle = "Pada Versi App Store Tahun 2017",x="Kategori Ukuran Aplikasi", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")Temuan Data:
Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 3.5 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.
Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 3.0 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.
Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 1.0 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.
Insight:
Dari temuan diatas kita mengetahui bahwa semakin besar ukuran aplikasi maka penilaian rating yang diberikan pengguna akan terkonsentrasi untuk memberikan penilaian yang baik (terkonsetrasi pada rentang 3.5 s.d 4.5)
Di sisi lain, semakin kecil ukuran aplikasi, maka penilaian rating yang diberikan pengguna akan semakin tersebar dimana rating yang diberikan akan sangat beragam (tersebar pada rentang 1.0 s.d 4.5)
Dengan memperhatikan jenis kategori ukuran aplikasi, ditemukan bahwa hampir semua aplikasi dari ketiga kategori ukuran aplikasi memberikan penilaian rating pengguna sebesar 4.0/5.0. Hal ini menunjukan bahwa mayoritas aplikasi yang terdaftar dipandang baik oleh pengguna App Store, meskipun terdapat beberapa outlier dimana mendapatkan nilai yang lebih rendah daripada keseluruhan rentang penilaian grup.
Tujuan: Dalam hal ini kita ingin menganalisis hubungan besaran ukuran aplikasi dan harga yang ditawarkan kepada pengguna.
# Harga Aplikasi Berdasarkan Ukuran File
ggplot(data = appstore, aes(x = SizeCatg,y = price))+
geom_boxplot(aes(color = SizeCatg))+
scale_color_manual(values = c("red","blue","green"))+
labs(title="Persebaran Harga Berdasarkan Ukuran Aplikasi",subtitle = "Pada Versi App Store Tahun 2017",x="Kategori Ukuran Aplikasi", y="Harga Aplikasi (dalam satuan $USD)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")summary(appstore$PriceCatg)## Berbayar Mahal Berbayar Murah Berbayar Sedang Gratis
## 7 3044 90 4056
Insight:
Dari data diatas diketahui bahwa mayoritas aplikasi terdaftar adalah aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar.
Di kategori aplikasi berbayar, terdapat 3.044 aplikasi berbayar murah (<10 USD), 90 aplikasi berbayar sedang (10 USD - 50 USD) dan 7 aplikasi berbayar mahal (>50 USD).
Tujuan: Dalam hal ini kita ingin menganalisis nilai rating dari pengguna dan segmentasi aplikasi berdasarkan kelompok umur berdasarkan ukuran aplikasi.
ggplot(data = appstore, aes(x = cont_rating,y = user_rating_ver))+
geom_boxplot(aes(color = SizeCatg))+
scale_color_manual(values = c("red","blue","green"))+
labs(title="Persebaran User Pada Versi App Store 2017",subtitle = "Berdasarkan Konten Usia Rating dan Ukuran Aplikasi",x="Konten Usia Rating", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")Insight:
Penilaian rating dari pengguna secara konsisten mencatatkan rekam jejak yang baik untuk ukuran aplikasi besar (>300MB) untuk setiap kategori konten usia aplikasi dengan besaran rentang penilaian lebih besar dari 3.5 dalam skala 5.0.
Penilaian rating dari pengguna untuk kategori ukuran aplikasi kecil (<100MB) dan sedang (100-300MB) menampilkan rekam jejak penilaian yang sangat beragam untuaplikasi dengan kelompok umur remaja (+12) dan dewasa (+17), namun di sisi lain menunjukan hasil penilaian rating yang cukup bagus untuk kelompok umur anak (+4 dan +9).
ggplot(data = appstore, aes(x = PriceCatg,y = user_rating_ver))+
geom_boxplot(aes(color = SizeCatg))+
scale_color_manual(values = c("red","blue","green"))+
labs(title="Persebaran User Pada Versi App Store 2017",subtitle = "Berdasarkan Konten Usia Rating dan Ukuran Aplikasi",x="Kategori Harga Aplikasi", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")Insight:
Dari hasil diatas kita dapat melihat bahwa aplikasi di kategori berbayar murah (<10 USD) dalam semua ukuran aplikasi (besar,sedang,kecil) memiliki penilaian rating terbaik dari pengguna, dimana rating penilaian terkonsentrasi pada rentang 3.0 s.d 4.5 dari skala 5.0.
Akan tetapi hal yang sama tidak dapat dikatakan untuk kategori ukuran aplikasi dan kategori harga lainnya dikarenakan baik untuk aplikasi yang gratis maupun berbayar sedang dan mahal memiliki respon feedback penilaian yang cukup beragam dalam rentang penilaiannya.
Tujuan: Dalam hal ini kita ingin mengetahui perolehan jumlah aplikasi dalam masing-masing kategori genre aplikasi sehingga hal ini dapat memudahkan analisis mita selnjutnya dalam melakukan identifikasi target segmentasi usia pengguna dan infrastruktur dukungan sistem aplikasi secara keseluruhan.
temp1 <- as.data.frame(table(appstore$prime_genre))
g1 <- ggplot(temp1, mapping = aes(x=reorder(Var1,Freq), y=Freq, fill=Freq))+
geom_col()+
scale_fill_gradient(low = "yellow",high = "blue" )+
coord_flip()+
geom_text(aes(label = temp1$Freq),nudge_y = 60,col = "#040b5b")+
geom_hline(yintercept = mean(temp1$Freq), linetype = 5, col = "red")+
labs(title="Jumlah Aplikasi ios App Store Berdasarkan Kategori",subtitle = "Aplikasi berkategori Games merupakan yang terbanyak beredar di App Store",x="Genre Aplikasi", y="Jumlah Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")+
theme(legend.position = "right",panel.grid.major.y = element_blank())
g1## Warning: Use of `temp1$Freq` is discouraged. Use `Freq` instead.
Temuan:
Grafik di atas menggambarkan sebaran jumlah aplikasi yang beredar pada ios Apps Store berdasarkan kategorinya. Semakin banyak suatu aplikasi muncul dalam suatu kategori semakin ungu warna yang ditunjukkan, sedangkan semakin sedikit akan semakin kuning. Ternyata aplikasi berkategori “GAMES” yang banyak beredar di ios Apps Store dengan jumlah aplikasi mencapai 3862, sedangkan aplikasi kecantikan “CATALOG” merupakan yang paling sedikit dengan jumlah 10 aplikasi. Garis merah pada grafik menunjukkan rata-rata jumlah aplikasi untuk setiap kategorinya, yaitu sejumlah (+/-) 300.
Insight:
Aplikasi kategori games memiliki jumlah 6x lipat dari kategori Entertainment di peingkat kedua dengan jumlah 500an aplikasi terdaftar.
Tiga aplikasi dengann jumlah terbanyak dan melebihi rata-rata di App Store adalah aplikasi dengan kategori genre “Games”, “Entertainment” dan “Education”.
Tujuan: Setelah mengidentifikasi perolehan jumlah aplikasi dari masing-masing genre, selanjutnya kita akan melakukan identifikasi penilaian rating berdasarkan segmentasi usia pengguna.
ggp <- ggplot(appstore, aes(cont_rating, prime_genre)) + # Create heatmap with ggplot2
geom_tile(aes(fill = user_rating_ver_factor))+
labs(title="Persebaran User Rating ",subtitle = "Berdasarkan Kategori Konten & Genre Aplikasi",x="Konten Rating Usia User", y="Genre Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")
ggp # Print heatmapTemuan:
Dengan mengambil tiga kategori teratas dalam hal jumlah sebagai sample, maka:
Games : Penilaian rating aplikasi kategori games untuk rentang usia 4+ adalah 5 dan 4.5 untuk rentang usia 12+
Entertainment : Penilaian rating aplikasi kategori entertaintment untuk rentang usia 12+ dan 17+ adalah 4.5 dan 4.0 untuk rentang usia 9+
Education : Penilaian rating aplikasi kategori education untuk rentang usia 12+ dan 9+ adalah 4.5
Insight:
Segmentasi kelompok umur anak (4+, 9+) dan remaja (+12) paling menyukai aplikasi pendidikan dan permainan, dimana agregasi penilaian rating untuk kedua grup tersebut adalah 4.5 dalam skala 5
Segmentasi kelompok umur remaja (+12) dan dewasa (+17) paling menyukai aplikasi hiburan, dimana agregasi penilaian rating untuk kedua tersebut adalah 4 dalam skala 5
Tujuan: Menganalisis tren secara keseluruhan mengenai persebaran jumlah perangkat yang didukung oleh suatu aplikasi.
ggp <- ggplot(appstore, aes(SizeCatg, prime_genre)) + # Create heatmap with ggplot2
geom_tile(aes(fill = sup_devices.num))+
labs(title="Persebaran Support Device ",subtitle = "Berdasarkan Genre dan Ukuran Aplikasi",x="Kategori Ukuran Aplikasi", y="Genre Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")
ggp # Print heatmapInsight
Dengan mengamati persebaran data heatmap diatas, secara keseluruhan hampir semua kategori aplikasi dalam berbagai ukuran mendukung setidaknya 37 perangkat lain.
Dari dataset iOS App Store 2017 terdapat 7.197 aplikasi seluler (mobile apps) yang terdaftar, dimana jumlah aplikasi dengan ukuran kecil (<100 MB) memiliki jumlah terbesar dengan 3.702 aplikasi terdaftar sedangkan aplikasi dengan ukuran besar (>300 MB) memiliki jumlah terkecil dengan 989 aplikasi terdaftar.
Kita mengetahui bahwa semakin besar ukuran aplikasi maka penilaian rating yang diberikan pengguna akan terkonsentrasi untuk memberikan penilaian yang baik (terkonsetrasi pada rentang 3.5 s.d 4.5)
Dengan memperhatikan jenis kategori ukuran aplikasi, ditemukan bahwa hampir semua aplikasi dari ketiga kategori ukuran aplikasi memberikan penilaian rating pengguna sebesar 4.0/5.0. Hal ini menunjukan bahwa mayoritas aplikasi yang terdaftar dipandang baik oleh pengguna App Store, meskipun terdapat beberapa outlier dimana mendapatkan nilai yang lebih rendah daripada keseluruhan rentang penilaian grup.
Dari data diatas diketahui bahwa mayoritas aplikasi terdaftar adalah aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar.
Di kategori aplikasi berbayar, terdapat 3.044 aplikasi berbayar murah (<10 USD), 90 aplikasi berbayar sedang (10 USD - 50 USD) dan 7 aplikasi berbayar mahal (>50 USD).
Penilaian rating dari pengguna secara konsisten mencatatkan rekam jejak yang baik untuk ukuran aplikasi besar (>300MB) untuk setiap kategori konten usia aplikasi dengan besaran rentang penilaian lebih besar dari 3.5 dalam skala 5.0.
Penilaian rating dari pengguna untuk kategori ukuran aplikasi kecil (<100MB) dan sedang (100-300MB) menampilkan rekam jejak penilaian yang sangat beragam untuaplikasi dengan kelompok umur remaja (+12) dan dewasa (+17), namun di sisi lain menunjukan hasil penilaian rating yang cukup bagus untuk kelompok umur anak (+4 dan +9).
Dari hasil diatas kita dapat melihat bahwa aplikasi di kategori berbayar murah (<10 USD) dalam semua ukuran aplikasi (besar,sedang,kecil) memiliki penilaian rating terbaik dari pengguna, dimana rating penilaian terkonsentrasi pada rentang 3.0 s.d 4.5 dari skala 5.0.
Akan tetapi hal yang sama tidak dapat dikatakan untuk kategori ukuran aplikasi dan kategori harga lainnya dikarenakan baik untuk aplikasi yang gratis maupun berbayar sedang dan mahal memiliki respon feedback penilaian yang cukup beragam dalam rentang penilaiannya.
Aplikasi kategori games memiliki jumlah 6x lipat dari kategori Entertainment di peingkat kedua dengan jumlah 500an aplikasi terdaftar.
Tiga aplikasi dengann jumlah terbanyak dan melebihi rata-rata di App Store adalah aplikasi dengan kategori genre “Games”, “Entertainment” dan “Education”.
Segmentasi kelompok umur anak (4+, 9+) dan remaja (+12) paling menyukai aplikasi pendidikan dan permainan, dimana agregasi penilaian rating untuk kedua grup tersebut adalah 4.5 dalam skala 5
Segmentasi kelompok umur remaja (+12) dan dewasa (+17) paling menyukai aplikasi hiburan, dimana agregasi penilaian rating untuk kedua tersebut adalah 4 dalam skala 5
Dengan mengamati persebaran data heatmap dari berbagai kategori genre aplikasi, secara keseluruhan hampir semua kategori aplikasi dalam berbagai ukuran mendukung setidaknya sampai 37 perangkat lain.
Setelah melakukan proses plotting, analisa dan mengumpulkan beragam insight, maka diharapkan hasil ini dapat digunakan sebaik mungkin bagi setiap pihak yang membutuhkan, baik bagi pengembang, developer, user, pengusaha maupun regulator dan segenap shareholder yang berkepentingan.
Adapun keterbatasan yang dihadapi oleh penulis ialah mencari data yang relevan dan terbaru, sehingga pada saat penelitian “Statistik Aplikasi Seluler Pada Apple iOS App Store” hanya dapat menggunakan database tahun 2017 yang telah tersedia dari Kaggle.
Penulis merekomendasikan untuk penelitian selanjutnya dapat melakukan proses data scrapping secara manual untuk mengumpulkan data di web sehingga dapat memperoleh database tahun terbaru yang diinginkan.
[Dataset: Kaggle]
(https://www.kaggle.com/datasets/ramamet4/app-store-apple-data-set-10k-apps)