1 Latar Belakang

Lanskap seluler yang selalu berubah adalah ruang yang menantang untuk dinavigasi. . Persentase seluler melalui desktop hanya meningkat. Android menguasai sekitar 53,2% pasar smartphone, sedangkan iOS 43%. Untuk membuat lebih banyak orang mengunduh aplikasi Anda, Anda perlu memastikan bahwa mereka dapat dengan mudah menemukan aplikasi Anda. Analisis aplikasi seluler adalah cara yang bagus untuk memahami strategi yang ada untuk mendorong pertumbuhan dan retensi pengguna di masa mendatang.

Dengan jutaan aplikasi yang ada saat ini, kumpulan data berikut telah menjadi sangat penting untuk mendapatkan aplikasi trending teratas di toko aplikasi iOS. Kumpulan data ini berisi lebih dari 7000 detail aplikasi seluler Apple iOS. Data diekstraksi dari iTunes Search API di situs web Apple Inc. Software R dan dataset iOS App Store 2017 yang disediakan oleh Kaggle digunakan untuk penelitian ini.

Data-data dari ios Apple Store memiliki potensi yang besar untuk dijadikan pedoman dalam kesuksesan pembuatan bisnis berbasis aplikasi. Pada dokumen ini dibuat beberapa contoh visualisasi dari data-data iOS App Store yang mudah-mudahan dapat memberikan sedikit gambaran manfaat visualisasi dalam bisnis.

Adapun juga tersedia visualisasi interaktif singkat sebagai berikut: (https://danielwijoyo.shinyapps.io/iOS_App_Store_2017_Dashboard_Analysis/)

2 Pra-Pengolahan Data

Sebelum data di buat menjadi sebuah plot/grafik dan diinterpetasi, maka terlebih dahulu kita melakukan proses pengecekan dan penyesuaian terhadap jenis data sehingga siap untuk diolah.

2.1 Pengecekan Library

# Melakukan pemanggilan package library yang akan digunakan untuk mengolah data

library(lubridate)
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(ggplot2)

2.2 Memasukan Data

Melakukan proses import dataset ios Apple Store kedalam proses analisa

# Import Data
appstore <- read.csv("AppleStore.csv")

# Mengecek nama untuk tiap kolom yang akan digunakan sebagai variabel penelitian
names(appstore)
##  [1] "X"                "id"               "track_name"       "size_bytes"      
##  [5] "currency"         "price"            "rating_count_tot" "rating_count_ver"
##  [9] "user_rating"      "user_rating_ver"  "ver"              "cont_rating"     
## [13] "prime_genre"      "sup_devices.num"  "ipadSc_urls.num"  "lang.num"        
## [17] "vpp_lic"

Dimana penjelasan untuk masing-masing data, sebagai berikut:

  1. Number data
  2. “id” : App ID
  3. track_name”: App Name
  4. size_bytes”: Size (in Bytes)
  5. “currency”: Currency Type
  6. price”: Price amount
  7. “ratingcounttot”: User Rating counts (for all version)
  8. “ratingcountver”: User Rating counts (for current version)
  9. “user_rating” : Average User Rating value (for all version)
  10. userratingver”: Average User Rating value (for current version)
  11. “ver” : Latest version code
  12. cont_rating”: Content Rating
  13. prime_genre”: Primary Genre
  14. sup_devices.num”: Number of supporting devices
  15. “ipadSc_urls.num”: Number of screenshots showed for display
  16. lang.num”: Number of supported languages
  17. “vpp_lic”: Vpp Device Based Licensing Enabled

Dalam penelitian ini kita bertujuan untuk menganalisis aplikasi terpopuler pada versi ios apps store tahun 2017, oleh karena itu kita akan melakukan eliminasi pada beberapa variabel indikator yang tidak dibutuhkan serta melihat struktur dari tiap data yang akan dipakai.

# Eliminasi indikator yang tidak dibutuhkan
appstore <- appstore[,-c(1, 2, 5, 7, 8, 9, 11, 15, 17)]

# Mengecek struktur data yang digunakan
str(appstore)
## 'data.frame':    7197 obs. of  8 variables:
##  $ track_name     : chr  "PAC-MAN Premium" "Evernote - stay organized" "WeatherBug - Local Weather, Radar, Maps, Alerts" "eBay: Best App to Buy, Sell, Save! Online Shopping" ...
##  $ size_bytes     : num  1.01e+08 1.59e+08 1.01e+08 1.29e+08 9.28e+07 ...
##  $ price          : num  3.99 0 0 0 0 0.99 0 0 9.99 3.99 ...
##  $ user_rating_ver: num  4.5 3.5 4.5 4.5 5 4 4.5 4.5 5 4 ...
##  $ cont_rating    : chr  "4+" "4+" "4+" "12+" ...
##  $ prime_genre    : chr  "Games" "Productivity" "Weather" "Shopping" ...
##  $ sup_devices.num: int  38 37 37 37 37 47 37 37 37 38 ...
##  $ lang.num       : int  10 23 3 9 45 1 19 1 1 10 ...

Dari struktur data yang akan digunakan di diatas, terlihat bahwa struktur data sudah sesuai sehingga tidak diperlukan perabaikan perubahan format lebih lanjut.

2.3 Eliminasi nama-nama aplikasi yang terduplikat

Dari beberapa aplikasi di dalam data base tersebut, ternyata ada beberapa aplikasi yang terduplikasi, mengingat beberapa parameter lainnya berisi nilai-nilai yang cukup identis.

# Mengecek duplikasi dengan membuat data frame baru yang berisi nama aplikasi serta total duplikasinya
appstore_dplct <- as.data.frame(table(appstore$track_name))

# Melihat 1 contoh aplikasi yang pertama kali muncul dan terduplikasi lebih dari 2 kali
subset(appstore_dplct, appstore_dplct$Freq > 2)[1,]
##    Var1 Freq
## NA <NA>   NA

Dikarenakan tidak ada data nama aplikasi (track_name) yang terduplikasi, maka tidak diperlukan pengubahan lebih lanjut.

2.4 Eliminasi aplikasi yang memiliki nilai NA (Not Available)

Dari proses sebelumnya kita dapat melihat bahwa ada beberapa aplikasi yang tidak memiliki nilai rating atau NaN. Demi menghindari ambiguitas saat kita melakukan analisis, aplikasi-aplikasi yang memiliki NaN atau Na akan kita eliminasi baik itu dari kolom rating ataupun kolom-kolom lainnya.

# Mendeteksi NaN pada data frame appstore
colSums(is.na(appstore))
##      track_name      size_bytes           price user_rating_ver     cont_rating 
##               0               0               0               0               0 
##     prime_genre sup_devices.num        lang.num 
##               0               0               0

Jika kita menggunakan fungsi is.na, tidak terdeteksi NaN pada dataframe appstore sehingga pengubahan lebih lanjut tidak diperlukan.

2.5 Mengembangkan Variabel Kolom “Size”

Agar nantinya kita bisa menentukan termasuk aplikasi yang berukuran besar atau tidak, kita perlu merubah faktor pada kolom size ke bentuk numerik. Akan tetapi kita tidak bisa melakukan ini secara langsung karena level-level pada factor size tidak berformat angka, dan juga tidak berurutan.

Untuk itu pertama kita harus mengkonversi tiap-tiap level pada size ke format angka.

# Kita bisa konversi terlebih dahulu dari bytes ke ukuran Mega Bytes (anggap 1 MB ~ 1000000 Bytes)

appstore$size_mb <- appstore$size_bytes/1000000
summary(appstore$size_mb)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.59   46.92   97.15  199.13  181.93 4025.97

Agar lebih mudah pengklasifikasian aplikasi berdasarkan “Size”-nya, maka dibuat kolom baru yang berisi 3 kategori size, yaitu: “Small Size App” : 0 MB - 100 MB “Medium Size App” : 100 MB - 300 MB “Big Size App” : > 300 MB

# Pembuatan kolom baru 
appstore$SizeCatg <- as.character(appstore$size_mb)

# Proses pengklasifikasian aplikasi berdasarkan size
for (i in 1:length(appstore$SizeCatg)) {
  if (appstore[i,"size_mb"] < 100) {
    appstore[i,"SizeCatg"] <- "Small Size App"
  }
  else if (appstore[i,"size_mb"] >= 100 & appstore[i,"size_mb"] < 300) {
    appstore[i,"SizeCatg"] <- "Medium Size App"
  }
  else if (appstore[i,"size_mb"] >= 300 & appstore[i,"size_mb"] <= 5000) {
    appstore[i,"SizeCatg"] <- "Big Size App"
  }
}

# Mengemblakikan klasifikasi ke format factor
appstore$SizeCatg <- as.factor(appstore$SizeCatg)

# Total masing-masing kategori size aplikasi
summary(appstore$SizeCatg)
##    Big Size App Medium Size App  Small Size App 
##             989            2506            3702

2.6 Mengembangkan Variabel Kolom “Price”

Selain menggunakan harga aplikasi (price) sebagai ukuran skala numerik, kita juga dapat menggunakannya sebagai data kategorial untuk ukuran perbandingan dengan variabel parameter lainnya.

Agar lebih mudah pengklasifikasian aplikasi berdasarkan “harga”-nya, maka dibuat kolom baru yang berisi 3 kategori size, yaitu: “Gratis” : 0 USD (\() “Berbayar Murah” : 0.1 USD - 10 USD (\)) “Berbayar Sedang” : 10 USD - 50 USD (\() “Berbayar Mahal” : > 50 USD (\))

# Pembuatan kolom baru 
appstore$PriceCatg <- as.character(appstore$price)

# Proses pengklasifikasian aplikasi berdasarkan size
for (i in 1:length(appstore$PriceCatg)) {
  if (appstore[i,"price"] < 0.1) {
    appstore[i,"PriceCatg"] <- "Gratis"
  }
  else if (appstore[i,"price"] >= 0.1 & appstore[i,"price"] < 10) {
    appstore[i,"PriceCatg"] <- "Berbayar Murah"
  }
  else if (appstore[i,"price"] >= 10 & appstore[i,"price"] <= 50) {
    appstore[i,"PriceCatg"] <- "Berbayar Sedang"
  }
  else if (appstore[i,"price"] > 50) {
    appstore[i,"PriceCatg"] <- "Berbayar Mahal"
  }
  
}

# Mengemblakikan klasifikasi ke format factor
appstore$PriceCatg <- as.factor(appstore$PriceCatg)

# Total masing-masing kategori size aplikasi
summary(appstore$PriceCatg)
##  Berbayar Mahal  Berbayar Murah Berbayar Sedang          Gratis 
##               7            3044              90            4056

3 Final Pre-Check: Summary Data & Pengaturan Kelas Factor Kategori

Dalam data frame yang kita miliki, variabel yang bertipe factor dapat memiliki kelas yang berupa data kosong, atau Na/NaN. Untuk itu kita bisa mengecek kembali satu-satu, atau langsung kembali assign format factor agar kelas-kelas dalam faktor itu terupdate.

3.1 Level Factor: Kategori Ukuran Aplikasi

summary(appstore$SizeCatg) # Level Factor
##    Big Size App Medium Size App  Small Size App 
##             989            2506            3702
989+2506+3702 # Agregasi Total Aplikasi
## [1] 7197

Deskripsi: Dari dataset iOS App Store 2017 terdapat 7.197 aplikasi seluler (mobile apps) yang terdaftar, dimana jumlah aplikasi dengan ukuran kecil (<100 MB) memiliki jumlah terbesar dengan 3.702 aplikasi terdaftar sedangkan aplikasi dengan ukuran besar (>300 MB) memiliki jumlah terkecil dengan 989 aplikasi terdaftar.

3.2 Level Factor: Kategori Genre Aplikasi

appstore$prime_genre <- factor(appstore$prime_genre)
summary(appstore$prime_genre)
##              Book          Business          Catalogs         Education 
##               112                57                10               453 
##     Entertainment           Finance      Food & Drink             Games 
##               535               104                63              3862 
##  Health & Fitness         Lifestyle           Medical             Music 
##               180               144                23               138 
##        Navigation              News     Photo & Video      Productivity 
##                46                75               349               178 
##         Reference          Shopping Social Networking            Sports 
##                64               122               167               114 
##            Travel         Utilities           Weather 
##                81               248                72

Deskripsi: Dari dataset iOS App Store 2017, kategori aplikasi genre Games memiliki jumlah terbanyak dengan 3.862 aplikasi terdaftar.

3.3 Level Factor & Number Data: Harga Aplikasi

Menggunakan dua jenis data. Jenis data level factor (PriceCatg) digunakan sebagai analisis harga kategorial sedangkan jenis data number (price) digunakan dalam analisis skala numerik.

#Level Factor
appstore$PriceCatg <- as.factor(appstore$PriceCatg)
summary(appstore$PriceCatg)
##  Berbayar Mahal  Berbayar Murah Berbayar Sedang          Gratis 
##               7            3044              90            4056
# Numerik
summary(appstore$price)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   0.000   1.726   1.990 299.990

Deskripsi: Dari dataset iOS App Store 2017, diketahui bahwa mayoritas aplikasi merupakan aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar (Level Factor) sedangkan harga aplikasi termahal adalah $299.9 USD (numeric).

3.4 Level Factor: Rating Untuk Konten Usia

appstore$cont_rating <- factor(appstore$cont_rating)
summary(appstore$cont_rating)
##  12+  17+   4+   9+ 
## 1155  622 4433  987

Deskripsi: Dari dataset iOS App Store 2017, diketahui bahwa jumlah aplikasi didominasi oleh segmentasi aplikasi ramah untuk anak balita (anak dibawah lima tahun) dengan 4.433 aplikasi terdaftar. Sedangkan aplikasi untuk segmentasi dewasa (diatas 17 tahun) memiliki jumlah terkecil dengan 622 aplikasi terdafar.

3.5 Level Factor & Number Data: Rating Pengguna iOS App Store Versi 2017

Untuk data rating pengguna, dua jenis data akan digunakan secara terpisah dimana rating pengguna dengan jenis number data digunakan sebagai skala nilai sedangkan data yang berjenis level factor digunakan untuk analisis kategorial.

appstore$user_rating_ver_factor <- factor(appstore$user_rating_ver)

summary(appstore$user_rating_ver_factor) #ukuran skala factor
##    0    1  1.5    2  2.5    3  3.5    4  4.5    5 
## 1443  125   74  136  176  304  533 1237 2205  964
summary(appstore$user_rating_ver) # ukuran skala numerik
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.500   4.000   3.254   4.500   5.000

Deskripsi: dari data rating pengguna, diketahui bahwa mayoritas pengguna iOS App Store pada 2017 memberikan penilaian 4.5/5 (skala number) dan apabila di ambil sample data tengahnya maka para user kebanyakan memberikan penilaian 4/5 untuk aplikasi terdaftar.

3.6 Level Factor: Jumlah Aplikasi Yang Didukung Bahasa Beragam

appstore$lang.num <- factor(appstore$lang.num)

summary(appstore$lang.num)
##    0    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15 
##   41 3767  675  217  154  207  143  133  145  138  168  266  179  130   89   86 
##   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31 
##  114   46   71   30   21   35   32   24   16   14   22    7    8   20   28   53 
##   32   33   34   35   36   37   39   40   41   42   43   45   46   47   50   54 
##   17   30   13    2    4    2    2    1    2    3    2    9    4    1    1    2 
##   55   56   58   59   63   68   69   74   75 
##    2    1   12    1    1    1    3    1    1

Deskripsi: Diketahui dari data bahwa mayoritas aplikasi yang terdaftar di iOS App Store hanya menyediakan satu dukungan bahasa dengan jumlah 3.767 aplikas terdaftar. Dimana pada sample yang ditemukan bahasa yang digunakan ialah bahasa Inggris sebagai bahasa resmi internasional.

3.7 Level Factor: Jumlah Dukungan Perangkat Aplikasi

appstore$sup_devices.num <- factor(appstore$sup_devices.num)
summary(appstore$sup_devices.num)
##    9   11   12   13   15   16   23   24   25   26   33   35   36   37   38   39 
##    1    3    1    7    2    8    1  270   67   42    2   24    7 3263 1912   40 
##   40   43   45   47 
## 1142  371    8   26

Deskripsi: Diketahui dari data bahwa mayoritas aplikasi yang terdaftar di iOS App Store 2017 memberikan dukungan lintas perangkat sampai dengan 36 perangkat yang berbeda dengan jumlah 3.263 aplikasi terdaftar.

4 Data Plotting & Insights

Analisa plot dan insights yang dilakukan dalam dataset iOS App Store versi 2017 dapat dibagi menjadi tiga bagian besar. Pertama, yaitu analisa berdasarkan kategori ukuran aplikasi. Kedua, yaitu analisa berdasarkan penilaian rating pengguna. Ketiga, yaitu analisa berdasarkan kategori genre aplikasi. Pada bagian terakhir, sebuah kesimpulan insight akan diberikan untuk merangkum temuan dalam penelitian ini.

4.1 Analisis Data Berdasarkan Kategori Ukuran Aplikasi

4.1.1 Kategori Ukuran Aplikasi & Penilaian Rating Pengguna

Tujuan: Dalam hal ini kita ingin menganalisis hubungan besaran ukuran aplikasi terhadap penilaian pengguna.

ggplot(data = appstore, aes(x = SizeCatg,y = user_rating_ver))+
  geom_boxplot(aes(color = SizeCatg))+
  scale_color_manual(values = c("red","blue","green"))+
  labs(title="Persebaran Harga Berdasarkan Ukuran Aplikasi",subtitle = "Pada Versi App Store Tahun 2017",x="Kategori Ukuran Aplikasi", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")

Temuan Data:

  1. Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 3.5 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.

  2. Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 3.0 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.

  3. Ukuran aplikasi yang besar menunjukan konsentrasi penilaian rating dari pengguna terpusat pada rentang penilaian 1.0 s.d 4.5 dengan rata-rata pengguna memberikan penilaian rating 4.0 dari skala maksimal 5.

Insight:

  1. Dari temuan diatas kita mengetahui bahwa semakin besar ukuran aplikasi maka penilaian rating yang diberikan pengguna akan terkonsentrasi untuk memberikan penilaian yang baik (terkonsetrasi pada rentang 3.5 s.d 4.5)

  2. Di sisi lain, semakin kecil ukuran aplikasi, maka penilaian rating yang diberikan pengguna akan semakin tersebar dimana rating yang diberikan akan sangat beragam (tersebar pada rentang 1.0 s.d 4.5)

  3. Dengan memperhatikan jenis kategori ukuran aplikasi, ditemukan bahwa hampir semua aplikasi dari ketiga kategori ukuran aplikasi memberikan penilaian rating pengguna sebesar 4.0/5.0. Hal ini menunjukan bahwa mayoritas aplikasi yang terdaftar dipandang baik oleh pengguna App Store, meskipun terdapat beberapa outlier dimana mendapatkan nilai yang lebih rendah daripada keseluruhan rentang penilaian grup.

4.1.2 Kategori Ukuran & Harga Aplikasi

Tujuan: Dalam hal ini kita ingin menganalisis hubungan besaran ukuran aplikasi dan harga yang ditawarkan kepada pengguna.

# Harga Aplikasi Berdasarkan Ukuran File

ggplot(data = appstore, aes(x = SizeCatg,y = price))+
  geom_boxplot(aes(color = SizeCatg))+
  scale_color_manual(values = c("red","blue","green"))+
  labs(title="Persebaran Harga Berdasarkan Ukuran Aplikasi",subtitle = "Pada Versi App Store Tahun 2017",x="Kategori Ukuran Aplikasi", y="Harga Aplikasi (dalam satuan $USD)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")

summary(appstore$PriceCatg)
##  Berbayar Mahal  Berbayar Murah Berbayar Sedang          Gratis 
##               7            3044              90            4056

Insight:

  1. Dari data diatas diketahui bahwa mayoritas aplikasi terdaftar adalah aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar.

  2. Di kategori aplikasi berbayar, terdapat 3.044 aplikasi berbayar murah (<10 USD), 90 aplikasi berbayar sedang (10 USD - 50 USD) dan 7 aplikasi berbayar mahal (>50 USD).

4.2 Analisis Data Berdasarkan User Rating

4.2.1 Penilaian Rating Pengguna dan Kategori Konten Usia berdasarkan Ukuran Aplikasi

Tujuan: Dalam hal ini kita ingin menganalisis nilai rating dari pengguna dan segmentasi aplikasi berdasarkan kelompok umur berdasarkan ukuran aplikasi.

ggplot(data = appstore, aes(x = cont_rating,y = user_rating_ver))+
  geom_boxplot(aes(color = SizeCatg))+
  scale_color_manual(values = c("red","blue","green"))+
  labs(title="Persebaran User Pada Versi App Store 2017",subtitle = "Berdasarkan Konten Usia Rating dan Ukuran Aplikasi",x="Konten Usia Rating", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")

Insight:

  1. Penilaian rating dari pengguna secara konsisten mencatatkan rekam jejak yang baik untuk ukuran aplikasi besar (>300MB) untuk setiap kategori konten usia aplikasi dengan besaran rentang penilaian lebih besar dari 3.5 dalam skala 5.0.

  2. Penilaian rating dari pengguna untuk kategori ukuran aplikasi kecil (<100MB) dan sedang (100-300MB) menampilkan rekam jejak penilaian yang sangat beragam untuaplikasi dengan kelompok umur remaja (+12) dan dewasa (+17), namun di sisi lain menunjukan hasil penilaian rating yang cukup bagus untuk kelompok umur anak (+4 dan +9).

4.2.2 Penilaian Rating Pengguna dan Kategori Harga berdasarkan Ukuran Aplikasi

ggplot(data = appstore, aes(x = PriceCatg,y = user_rating_ver))+
  geom_boxplot(aes(color = SizeCatg))+
  scale_color_manual(values = c("red","blue","green"))+
  labs(title="Persebaran User Pada Versi App Store 2017",subtitle = "Berdasarkan Konten Usia Rating dan Ukuran Aplikasi",x="Kategori Harga Aplikasi", y="User Rating (Max = 5)", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")

Insight:

Dari hasil diatas kita dapat melihat bahwa aplikasi di kategori berbayar murah (<10 USD) dalam semua ukuran aplikasi (besar,sedang,kecil) memiliki penilaian rating terbaik dari pengguna, dimana rating penilaian terkonsentrasi pada rentang 3.0 s.d 4.5 dari skala 5.0.

Akan tetapi hal yang sama tidak dapat dikatakan untuk kategori ukuran aplikasi dan kategori harga lainnya dikarenakan baik untuk aplikasi yang gratis maupun berbayar sedang dan mahal memiliki respon feedback penilaian yang cukup beragam dalam rentang penilaiannya.

4.3 Analisis Data Berdasarkan Kategori Genre Aplikasi

4.3.1 Jumlah Aplikasi Berdasarkan Kategori Genre

Tujuan: Dalam hal ini kita ingin mengetahui perolehan jumlah aplikasi dalam masing-masing kategori genre aplikasi sehingga hal ini dapat memudahkan analisis mita selnjutnya dalam melakukan identifikasi target segmentasi usia pengguna dan infrastruktur dukungan sistem aplikasi secara keseluruhan.

temp1 <- as.data.frame(table(appstore$prime_genre))

g1 <- ggplot(temp1, mapping = aes(x=reorder(Var1,Freq), y=Freq, fill=Freq))+
  geom_col()+
  scale_fill_gradient(low = "yellow",high = "blue" )+
  coord_flip()+
  geom_text(aes(label = temp1$Freq),nudge_y = 60,col = "#040b5b")+
  geom_hline(yintercept = mean(temp1$Freq), linetype = 5, col = "red")+
  labs(title="Jumlah Aplikasi ios App Store Berdasarkan Kategori",subtitle = "Aplikasi berkategori Games merupakan yang terbanyak beredar di App Store",x="Genre Aplikasi", y="Jumlah Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")+
  theme(legend.position = "right",panel.grid.major.y = element_blank())
  
g1
## Warning: Use of `temp1$Freq` is discouraged. Use `Freq` instead.

Temuan:

Grafik di atas menggambarkan sebaran jumlah aplikasi yang beredar pada ios Apps Store berdasarkan kategorinya. Semakin banyak suatu aplikasi muncul dalam suatu kategori semakin ungu warna yang ditunjukkan, sedangkan semakin sedikit akan semakin kuning. Ternyata aplikasi berkategori “GAMES” yang banyak beredar di ios Apps Store dengan jumlah aplikasi mencapai 3862, sedangkan aplikasi kecantikan “CATALOG” merupakan yang paling sedikit dengan jumlah 10 aplikasi. Garis merah pada grafik menunjukkan rata-rata jumlah aplikasi untuk setiap kategorinya, yaitu sejumlah (+/-) 300.

Insight:

  1. Aplikasi kategori games memiliki jumlah 6x lipat dari kategori Entertainment di peingkat kedua dengan jumlah 500an aplikasi terdaftar.

  2. Tiga aplikasi dengann jumlah terbanyak dan melebihi rata-rata di App Store adalah aplikasi dengan kategori genre “Games”, “Entertainment” dan “Education”.

4.3.2 Analisis Kategori Genre Aplikasi Terhadap Penilaian Rating Dari Kelompok Usia

Tujuan: Setelah mengidentifikasi perolehan jumlah aplikasi dari masing-masing genre, selanjutnya kita akan melakukan identifikasi penilaian rating berdasarkan segmentasi usia pengguna.

ggp <- ggplot(appstore, aes(cont_rating, prime_genre)) +                           # Create heatmap with ggplot2
  geom_tile(aes(fill = user_rating_ver_factor))+
  labs(title="Persebaran User Rating ",subtitle = "Berdasarkan Kategori Konten & Genre Aplikasi",x="Konten Rating Usia User", y="Genre Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")
ggp                                                               # Print heatmap

Temuan:

Dengan mengambil tiga kategori teratas dalam hal jumlah sebagai sample, maka:

Games : Penilaian rating aplikasi kategori games untuk rentang usia 4+ adalah 5 dan 4.5 untuk rentang usia 12+

Entertainment : Penilaian rating aplikasi kategori entertaintment untuk rentang usia 12+ dan 17+ adalah 4.5 dan 4.0 untuk rentang usia 9+

Education : Penilaian rating aplikasi kategori education untuk rentang usia 12+ dan 9+ adalah 4.5

Insight:

Segmentasi kelompok umur anak (4+, 9+) dan remaja (+12) paling menyukai aplikasi pendidikan dan permainan, dimana agregasi penilaian rating untuk kedua grup tersebut adalah 4.5 dalam skala 5

Segmentasi kelompok umur remaja (+12) dan dewasa (+17) paling menyukai aplikasi hiburan, dimana agregasi penilaian rating untuk kedua tersebut adalah 4 dalam skala 5

4.3.3 Analisis Data Genre Aplikasi Berdasarkan Jumlah Device Yang Didukung dan Ukuran Aplikasi

Tujuan: Menganalisis tren secara keseluruhan mengenai persebaran jumlah perangkat yang didukung oleh suatu aplikasi.

ggp <- ggplot(appstore, aes(SizeCatg, prime_genre)) +                           # Create heatmap with ggplot2
  geom_tile(aes(fill = sup_devices.num))+
  labs(title="Persebaran Support Device ",subtitle = "Berdasarkan Genre dan Ukuran Aplikasi",x="Kategori Ukuran Aplikasi", y="Genre Aplikasi", caption = "Source : App Store 2017 dataset-Kaggle, diolah penulis")
ggp                                                               # Print heatmap

Insight

Dengan mengamati persebaran data heatmap diatas, secara keseluruhan hampir semua kategori aplikasi dalam berbagai ukuran mendukung setidaknya 37 perangkat lain.

5 Rangkuman Insight

5.1 Insight Ukuran Aplikasi

  1. Dari dataset iOS App Store 2017 terdapat 7.197 aplikasi seluler (mobile apps) yang terdaftar, dimana jumlah aplikasi dengan ukuran kecil (<100 MB) memiliki jumlah terbesar dengan 3.702 aplikasi terdaftar sedangkan aplikasi dengan ukuran besar (>300 MB) memiliki jumlah terkecil dengan 989 aplikasi terdaftar.

  2. Kita mengetahui bahwa semakin besar ukuran aplikasi maka penilaian rating yang diberikan pengguna akan terkonsentrasi untuk memberikan penilaian yang baik (terkonsetrasi pada rentang 3.5 s.d 4.5)

  3. Dengan memperhatikan jenis kategori ukuran aplikasi, ditemukan bahwa hampir semua aplikasi dari ketiga kategori ukuran aplikasi memberikan penilaian rating pengguna sebesar 4.0/5.0. Hal ini menunjukan bahwa mayoritas aplikasi yang terdaftar dipandang baik oleh pengguna App Store, meskipun terdapat beberapa outlier dimana mendapatkan nilai yang lebih rendah daripada keseluruhan rentang penilaian grup.

5.2 Insight Harga Aplikasi

  1. Dari data diatas diketahui bahwa mayoritas aplikasi terdaftar adalah aplikasi gratis dengan jumlah 4.056 aplikasi terdaftar.

  2. Di kategori aplikasi berbayar, terdapat 3.044 aplikasi berbayar murah (<10 USD), 90 aplikasi berbayar sedang (10 USD - 50 USD) dan 7 aplikasi berbayar mahal (>50 USD).

5.3 Insight Penilaian Rating

  1. Penilaian rating dari pengguna secara konsisten mencatatkan rekam jejak yang baik untuk ukuran aplikasi besar (>300MB) untuk setiap kategori konten usia aplikasi dengan besaran rentang penilaian lebih besar dari 3.5 dalam skala 5.0.

  2. Penilaian rating dari pengguna untuk kategori ukuran aplikasi kecil (<100MB) dan sedang (100-300MB) menampilkan rekam jejak penilaian yang sangat beragam untuaplikasi dengan kelompok umur remaja (+12) dan dewasa (+17), namun di sisi lain menunjukan hasil penilaian rating yang cukup bagus untuk kelompok umur anak (+4 dan +9).

  3. Dari hasil diatas kita dapat melihat bahwa aplikasi di kategori berbayar murah (<10 USD) dalam semua ukuran aplikasi (besar,sedang,kecil) memiliki penilaian rating terbaik dari pengguna, dimana rating penilaian terkonsentrasi pada rentang 3.0 s.d 4.5 dari skala 5.0.

Akan tetapi hal yang sama tidak dapat dikatakan untuk kategori ukuran aplikasi dan kategori harga lainnya dikarenakan baik untuk aplikasi yang gratis maupun berbayar sedang dan mahal memiliki respon feedback penilaian yang cukup beragam dalam rentang penilaiannya.

5.4 Insight Kategori Genre Aplikasi

  1. Aplikasi kategori games memiliki jumlah 6x lipat dari kategori Entertainment di peingkat kedua dengan jumlah 500an aplikasi terdaftar.

  2. Tiga aplikasi dengann jumlah terbanyak dan melebihi rata-rata di App Store adalah aplikasi dengan kategori genre “Games”, “Entertainment” dan “Education”.

  3. Segmentasi kelompok umur anak (4+, 9+) dan remaja (+12) paling menyukai aplikasi pendidikan dan permainan, dimana agregasi penilaian rating untuk kedua grup tersebut adalah 4.5 dalam skala 5

  4. Segmentasi kelompok umur remaja (+12) dan dewasa (+17) paling menyukai aplikasi hiburan, dimana agregasi penilaian rating untuk kedua tersebut adalah 4 dalam skala 5

  5. Dengan mengamati persebaran data heatmap dari berbagai kategori genre aplikasi, secara keseluruhan hampir semua kategori aplikasi dalam berbagai ukuran mendukung setidaknya sampai 37 perangkat lain.

6 Kesimpulan

Setelah melakukan proses plotting, analisa dan mengumpulkan beragam insight, maka diharapkan hasil ini dapat digunakan sebaik mungkin bagi setiap pihak yang membutuhkan, baik bagi pengembang, developer, user, pengusaha maupun regulator dan segenap shareholder yang berkepentingan.

Adapun keterbatasan yang dihadapi oleh penulis ialah mencari data yang relevan dan terbaru, sehingga pada saat penelitian “Statistik Aplikasi Seluler Pada Apple iOS App Store” hanya dapat menggunakan database tahun 2017 yang telah tersedia dari Kaggle.

Penulis merekomendasikan untuk penelitian selanjutnya dapat melakukan proses data scrapping secara manual untuk mengumpulkan data di web sehingga dapat memperoleh database tahun terbaru yang diinginkan.