df_customer <- read.csv("df_customer.csv")
head(df_customer)
## X ID_Pelanggan Jenis_Kelamin Tempat_Tinggal Penghasilan Total_Belanja
## 1 1 ID00031 Laki-laki Desa 2227350 2563031
## 2 2 ID00079 Perempuan Kota 9047608 8369550
## 3 3 ID00051 Perempuan Kota 9735540 8053033
## 4 4 ID00014 Laki-laki Kota 13510126 9799876
## 5 5 ID00067 Perempuan Desa 7773498 6982081
## 6 6 ID00042 Laki-laki Desa 6666740 4782002
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
nrow(df_customer)
## [1] 300
length(unique(df_customer$ID_Pelanggan))
## [1] 94
sort(table(df_customer$ID_Pelanggan), decreasing = TRUE)[1:3]
##
## ID00007 ID00025 ID00089
## 9 7 7
aggregate(Penghasilan ~ Jenis_Kelamin, data = df_customer, mean)
## Jenis_Kelamin Penghasilan
## 1 Laki-laki 8880902
## 2 Perempuan 8505199
aggregate(Total_Belanja ~ Jenis_Kelamin, data = df_customer, mean)
## Jenis_Kelamin Total_Belanja
## 1 Laki-laki 6034728
## 2 Perempuan 7114786
aggregate(Penghasilan ~ Tempat_Tinggal, data = df_customer, mean)
## Tempat_Tinggal Penghasilan
## 1 Desa 6249122
## 2 Kota 9878685
aggregate(Total_Belanja ~ Tempat_Tinggal, data = df_customer, mean)
## Tempat_Tinggal Total_Belanja
## 1 Desa 5022231
## 2 Kota 7520118
df_customer[order(-df_customer$Total_Belanja), c("ID_Pelanggan", "Total_Belanja")] |>head(5)
## ID_Pelanggan Total_Belanja
## 76 ID00034 11626302
## 175 ID00011 11527638
## 228 ID00057 11031197
## 287 ID00093 10984825
## 33 ID00007 10846012
table(df_customer$Jenis_Kelamin)
##
## Laki-laki Perempuan
## 121 179
df_customer$Kategori_Penghasilan <- cut(df_customer$Penghasilan, breaks = c(-Inf, 5000000, 10000000, Inf), labels = c("Rendah", "Menengah", "Tinggi"))
table(df_customer$Kategori_Penghasilan)
##
## Rendah Menengah Tinggi
## 27 175 98
pelanggan_tersering <- df_customer %>%
filter(Total_Belanja > 5000000) %>%
count(ID_Pelanggan, sort = TRUE) %>%
slice_head(n=6)
pelanggan_tersering
## ID_Pelanggan n
## 1 ID00007 7
## 2 ID00025 7
## 3 ID00026 6
## 4 ID00089 6
## 5 ID00053 5
## 6 ID00079 5
colnames(df_customer)
## [1] "X" "ID_Pelanggan" "Jenis_Kelamin"
## [4] "Tempat_Tinggal" "Penghasilan" "Total_Belanja"
## [7] "Kategori_Penghasilan"
purchase_frequency <- df_customer %>%
group_by(ID_Pelanggan) %>%
summarise(frequency = n())
df_customer <- df_customer %>%
left_join(purchase_frequency, by = "ID_Pelanggan")
purchase_frequency
## # A tibble: 94 × 2
## ID_Pelanggan frequency
## <chr> <int>
## 1 ID00001 2
## 2 ID00002 3
## 3 ID00004 2
## 4 ID00005 2
## 5 ID00006 4
## 6 ID00007 9
## 7 ID00008 3
## 8 ID00009 5
## 9 ID00010 2
## 10 ID00011 2
## # ℹ 84 more rows
dim(df_customer)
## [1] 300 8
length(df_customer$purchase_frequency)
## [1] 0
jumlah_belanja_perempuan_kota <- df_customer %>%
filter(Jenis_Kelamin == "Perempuan" & Tempat_Tinggal == "Kota") %>%
count(ID_Pelanggan) %>%
filter(n>5) %>%
summarise(jumlah = n())
jumlah_belanja_perempuan_kota
## jumlah
## 1 0
pelanggan_tersering_pendapatan <- df_customer[df_customer$Penghasilan > 5000000,]
pelanggan_tersering_pendapatan <- sort(table(pelanggan_tersering_pendapatan$ID_Pelanggan), decreasing = TRUE)
head(pelanggan_tersering_pendapatan, 1)
##
## ID00007
## 9
Jenis_Kelamin_desa <- df_customer %>%
filter(Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)%>%
pull(Jenis_Kelamin)%>%
unique()
print("jenis kelamin yang berbelanja lebih dari 5000000 di desa")
## [1] "jenis kelamin yang berbelanja lebih dari 5000000 di desa"
print(Jenis_Kelamin_desa)
## [1] "Perempuan" "Laki-laki"
pendapatan_orang_desa <- df_customer %>%
filter(Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)
print(summary(pendapatan_orang_desa$Penghasilan))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3157783 5944288 6856664 7031482 8124839 11664452
print(pendapatan_orang_desa[, c("ID_Pelanggan","Tempat_Tinggal", "Penghasilan")])
## ID_Pelanggan Tempat_Tinggal Penghasilan
## 1 ID00067 Desa 7773498
## 2 ID00014 Desa 6776730
## 3 ID00027 Desa 8108645
## 4 ID00089 Desa 9032981
## 5 ID00034 Desa 5616450
## 6 ID00013 Desa 4481204
## 7 ID00091 Desa 6128487
## 8 ID00038 Desa 5947963
## 9 ID00041 Desa 9231091
## 10 ID00047 Desa 5940612
## 11 ID00095 Desa 8032910
## 12 ID00031 Desa 7822419
## 13 ID00022 Desa 9331982
## 14 ID00096 Desa 7082568
## 15 ID00074 Desa 9657061
## 16 ID00094 Desa 7651846
## 17 ID00016 Desa 5575699
## 18 ID00055 Desa 8635642
## 19 ID00075 Desa 5809025
## 20 ID00090 Desa 6005712
## 21 ID00098 Desa 4849165
## 22 ID00048 Desa 4626369
## 23 ID00088 Desa 5455465
## 24 ID00067 Desa 6467267
## 25 ID00049 Desa 3157783
## 26 ID00055 Desa 6093467
## 27 ID00008 Desa 6193172
## 28 ID00072 Desa 9024791
## 29 ID00058 Desa 9310352
## 30 ID00026 Desa 8141032
## 31 ID00052 Desa 6499451
## 32 ID00026 Desa 10832415
## 33 ID00090 Desa 11664452
## 34 ID00073 Desa 6455085
## 35 ID00014 Desa 6571179
## 36 ID00006 Desa 9498495
## 37 ID00091 Desa 5671820
## 38 ID00094 Desa 3726214
## 39 ID00031 Desa 6533837
## 40 ID00093 Desa 6856664
## 41 ID00057 Desa 7212261
## 42 ID00089 Desa 6928182
## 43 ID00066 Desa 3373098
## 44 ID00008 Desa 6940985
## 45 ID00063 Desa 6915574
## 46 ID00097 Desa 7028460
## 47 ID00013 Desa 9810087