df_customer <- read.csv("df_customer.csv")
head(df_customer)
##   X ID_Pelanggan Jenis_Kelamin Tempat_Tinggal Penghasilan Total_Belanja
## 1 1      ID00031     Laki-laki           Desa     2227350       2563031
## 2 2      ID00079     Perempuan           Kota     9047608       8369550
## 3 3      ID00051     Perempuan           Kota     9735540       8053033
## 4 4      ID00014     Laki-laki           Kota    13510126       9799876
## 5 5      ID00067     Perempuan           Desa     7773498       6982081
## 6 6      ID00042     Laki-laki           Desa     6666740       4782002
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
nrow(df_customer)
## [1] 300
length(unique(df_customer$ID_Pelanggan))
## [1] 94
sort(table(df_customer$ID_Pelanggan), decreasing = TRUE)[1:3]
## 
## ID00007 ID00025 ID00089 
##       9       7       7
aggregate(Penghasilan ~ Jenis_Kelamin, data = df_customer, mean)
##   Jenis_Kelamin Penghasilan
## 1     Laki-laki     8880902
## 2     Perempuan     8505199
aggregate(Total_Belanja ~ Jenis_Kelamin, data = df_customer, mean)
##   Jenis_Kelamin Total_Belanja
## 1     Laki-laki       6034728
## 2     Perempuan       7114786
aggregate(Penghasilan ~ Tempat_Tinggal, data = df_customer, mean)
##   Tempat_Tinggal Penghasilan
## 1           Desa     6249122
## 2           Kota     9878685
aggregate(Total_Belanja ~ Tempat_Tinggal, data = df_customer, mean)
##   Tempat_Tinggal Total_Belanja
## 1           Desa       5022231
## 2           Kota       7520118
df_customer[order(-df_customer$Total_Belanja), c("ID_Pelanggan", "Total_Belanja")] |>head(5)
##     ID_Pelanggan Total_Belanja
## 76       ID00034      11626302
## 175      ID00011      11527638
## 228      ID00057      11031197
## 287      ID00093      10984825
## 33       ID00007      10846012
table(df_customer$Jenis_Kelamin)
## 
## Laki-laki Perempuan 
##       121       179
df_customer$Kategori_Penghasilan <- cut(df_customer$Penghasilan, breaks = c(-Inf, 5000000, 10000000, Inf), labels = c("Rendah", "Menengah", "Tinggi"))
table(df_customer$Kategori_Penghasilan)
## 
##   Rendah Menengah   Tinggi 
##       27      175       98
pelanggan_tersering <- df_customer %>%
  filter(Total_Belanja > 5000000) %>%
  count(ID_Pelanggan, sort = TRUE) %>%
  slice_head(n=6)
pelanggan_tersering
##   ID_Pelanggan n
## 1      ID00007 7
## 2      ID00025 7
## 3      ID00026 6
## 4      ID00089 6
## 5      ID00053 5
## 6      ID00079 5
colnames(df_customer)
## [1] "X"                    "ID_Pelanggan"         "Jenis_Kelamin"       
## [4] "Tempat_Tinggal"       "Penghasilan"          "Total_Belanja"       
## [7] "Kategori_Penghasilan"
purchase_frequency <- df_customer %>%
  group_by(ID_Pelanggan) %>%
  summarise(frequency = n())

df_customer <- df_customer %>%
  left_join(purchase_frequency, by = "ID_Pelanggan")
purchase_frequency
## # A tibble: 94 × 2
##    ID_Pelanggan frequency
##    <chr>            <int>
##  1 ID00001              2
##  2 ID00002              3
##  3 ID00004              2
##  4 ID00005              2
##  5 ID00006              4
##  6 ID00007              9
##  7 ID00008              3
##  8 ID00009              5
##  9 ID00010              2
## 10 ID00011              2
## # ℹ 84 more rows
dim(df_customer)
## [1] 300   8
length(df_customer$purchase_frequency)
## [1] 0
jumlah_belanja_perempuan_kota <- df_customer %>%
  filter(Jenis_Kelamin == "Perempuan" & Tempat_Tinggal == "Kota") %>%
  count(ID_Pelanggan) %>%
  filter(n>5) %>%
  summarise(jumlah = n())
jumlah_belanja_perempuan_kota
##   jumlah
## 1      0
pelanggan_tersering_pendapatan <- df_customer[df_customer$Penghasilan > 5000000,]
pelanggan_tersering_pendapatan <- sort(table(pelanggan_tersering_pendapatan$ID_Pelanggan), decreasing = TRUE)
head(pelanggan_tersering_pendapatan, 1)
## 
## ID00007 
##       9
Jenis_Kelamin_desa <- df_customer %>%
  filter(Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)%>%
  pull(Jenis_Kelamin)%>%
  unique()
print("jenis kelamin yang berbelanja lebih dari 5000000 di desa")
## [1] "jenis kelamin yang berbelanja lebih dari 5000000 di desa"
print(Jenis_Kelamin_desa)
## [1] "Perempuan" "Laki-laki"
pendapatan_orang_desa <- df_customer %>%
  filter(Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)
print(summary(pendapatan_orang_desa$Penghasilan))
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  3157783  5944288  6856664  7031482  8124839 11664452
      print(pendapatan_orang_desa[, c("ID_Pelanggan","Tempat_Tinggal", "Penghasilan")])
##    ID_Pelanggan Tempat_Tinggal Penghasilan
## 1       ID00067           Desa     7773498
## 2       ID00014           Desa     6776730
## 3       ID00027           Desa     8108645
## 4       ID00089           Desa     9032981
## 5       ID00034           Desa     5616450
## 6       ID00013           Desa     4481204
## 7       ID00091           Desa     6128487
## 8       ID00038           Desa     5947963
## 9       ID00041           Desa     9231091
## 10      ID00047           Desa     5940612
## 11      ID00095           Desa     8032910
## 12      ID00031           Desa     7822419
## 13      ID00022           Desa     9331982
## 14      ID00096           Desa     7082568
## 15      ID00074           Desa     9657061
## 16      ID00094           Desa     7651846
## 17      ID00016           Desa     5575699
## 18      ID00055           Desa     8635642
## 19      ID00075           Desa     5809025
## 20      ID00090           Desa     6005712
## 21      ID00098           Desa     4849165
## 22      ID00048           Desa     4626369
## 23      ID00088           Desa     5455465
## 24      ID00067           Desa     6467267
## 25      ID00049           Desa     3157783
## 26      ID00055           Desa     6093467
## 27      ID00008           Desa     6193172
## 28      ID00072           Desa     9024791
## 29      ID00058           Desa     9310352
## 30      ID00026           Desa     8141032
## 31      ID00052           Desa     6499451
## 32      ID00026           Desa    10832415
## 33      ID00090           Desa    11664452
## 34      ID00073           Desa     6455085
## 35      ID00014           Desa     6571179
## 36      ID00006           Desa     9498495
## 37      ID00091           Desa     5671820
## 38      ID00094           Desa     3726214
## 39      ID00031           Desa     6533837
## 40      ID00093           Desa     6856664
## 41      ID00057           Desa     7212261
## 42      ID00089           Desa     6928182
## 43      ID00066           Desa     3373098
## 44      ID00008           Desa     6940985
## 45      ID00063           Desa     6915574
## 46      ID00097           Desa     7028460
## 47      ID00013           Desa     9810087