df_customer <- read.csv("df_customer.csv")
head(df_customer)
##   X ID_Pelanggan Jenis_Kelamin Tempat_Tinggal Penghasilan Total_Belanja
## 1 1      ID00031     Laki-laki           Desa     2227350       2563031
## 2 2      ID00079     Perempuan           Kota     9047608       8369550
## 3 3      ID00051     Perempuan           Kota     9735540       8053033
## 4 4      ID00014     Laki-laki           Kota    13510126       9799876
## 5 5      ID00067     Perempuan           Desa     7773498       6982081
## 6 6      ID00042     Laki-laki           Desa     6666740       4782002

Jumlah total transaksi dalam data.

nrow(df_customer)
## [1] 300

Jumlah pelanggan unik dalam dataset.

length(unique(df_customer$ID_Pelanggan))
## [1] 94

Pelanggan yang paling sering berbelanja.

sort(table(df_customer$ID_Pelanggan), decreasing = TRUE)[1:3]
## 
## ID00007 ID00025 ID00089 
##       9       7       7

Rata-rata penghasilan pelanggan berdasarkan jenis kelamin

aggregate(Penghasilan ~ Jenis_Kelamin, data = df_customer, mean )
##   Jenis_Kelamin Penghasilan
## 1     Laki-laki     8880902
## 2     Perempuan     8505199

Rata-rata total belanja pelanggan berdasarkan jenis kelamin.

aggregate(Total_Belanja ~Jenis_Kelamin, data = df_customer, mean)
##   Jenis_Kelamin Total_Belanja
## 1     Laki-laki       6034728
## 2     Perempuan       7114786

Rata-rata penghasilan pelanggan berdasarkan tempat tinggal (Kota vs Desa).

aggregate(Penghasilan ~ Tempat_Tinggal, data = df_customer, mean)
##   Tempat_Tinggal Penghasilan
## 1           Desa     6249122
## 2           Kota     9878685

Rata-rata total belanja pelanggan berdasarkan tempat tinggal.

aggregate(Total_Belanja ~ Tempat_Tinggal, data = df_customer, mean)
##   Tempat_Tinggal Total_Belanja
## 1           Desa       5022231
## 2           Kota       7520118

Lima pelanggan dengan total belanja tertinggi

df_customer[order(-df_customer$Total_Belanja), c("ID_Pelanggan", "Total_Belanja")] |> head(6) 
##     ID_Pelanggan Total_Belanja
## 76       ID00034      11626302
## 175      ID00011      11527638
## 228      ID00057      11031197
## 287      ID00093      10984825
## 33       ID00007      10846012
## 208      ID00023      10739381

Distribusi jumlah transaksi berdasarkan jenis kelamin.

table(df_customer$Jenis_Kelamin)
## 
## Laki-laki Perempuan 
##       121       179

Buat kategori penghasilan

df_customer$Kategori_Penghasilan <- cut(df_customer$Penghasilan, breaks = c(-Inf, 5000000, 10000000, Inf), labels = c("Rendah", "Menengah", "Tinggi")) 
table(df_customer$Kategori_Penghasilan)
## 
##   Rendah Menengah   Tinggi 
##       27      175       98

Frekuensi

freq <- as.data.frame(table(df_customer$ID_Pelanggan))
freq
##       Var1 Freq
## 1  ID00001    2
## 2  ID00002    3
## 3  ID00004    2
## 4  ID00005    2
## 5  ID00006    4
## 6  ID00007    9
## 7  ID00008    3
## 8  ID00009    5
## 9  ID00010    2
## 10 ID00011    2
## 11 ID00012    1
## 12 ID00013    3
## 13 ID00014    5
## 14 ID00015    1
## 15 ID00016    4
## 16 ID00017    4
## 17 ID00018    1
## 18 ID00020    2
## 19 ID00021    2
## 20 ID00022    2
## 21 ID00023    5
## 22 ID00024    5
## 23 ID00025    7
## 24 ID00026    6
## 25 ID00027    4
## 26 ID00029    2
## 27 ID00030    3
## 28 ID00031    5
## 29 ID00032    6
## 30 ID00033    3
## 31 ID00034    2
## 32 ID00035    3
## 33 ID00036    4
## 34 ID00037    3
## 35 ID00038    2
## 36 ID00039    3
## 37 ID00040    4
## 38 ID00041    3
## 39 ID00042    5
## 40 ID00043    2
## 41 ID00044    1
## 42 ID00045    3
## 43 ID00046    4
## 44 ID00047    1
## 45 ID00048    3
## 46 ID00049    3
## 47 ID00050    3
## 48 ID00051    2
## 49 ID00052    3
## 50 ID00053    5
## 51 ID00054    5
## 52 ID00055    3
## 53 ID00056    1
## 54 ID00057    4
## 55 ID00058    2
## 56 ID00059    1
## 57 ID00060    3
## 58 ID00061    2
## 59 ID00062    1
## 60 ID00063    5
## 61 ID00064    2
## 62 ID00066    2
## 63 ID00067    4
## 64 ID00068    1
## 65 ID00069    3
## 66 ID00070    2
## 67 ID00071    4
## 68 ID00072    5
## 69 ID00073    1
## 70 ID00074    5
## 71 ID00075    2
## 72 ID00076    3
## 73 ID00077    3
## 74 ID00078    1
## 75 ID00079    5
## 76 ID00081    3
## 77 ID00082    4
## 78 ID00083    3
## 79 ID00084    5
## 80 ID00085    4
## 81 ID00086    3
## 82 ID00087    4
## 83 ID00088    1
## 84 ID00089    7
## 85 ID00090    5
## 86 ID00091    4
## 87 ID00092    2
## 88 ID00093    7
## 89 ID00094    4
## 90 ID00095    1
## 91 ID00096    2
## 92 ID00097    3
## 93 ID00098    2
## 94 ID00099    2

Tugas no 1

q1 <- df_customer[df_customer$Total_Belanja > 5000000,]
q1 <- sort(table(q1$ID_Pelanggan), decreasing = TRUE)
head(q1)
## 
## ID00007 ID00025 ID00026 ID00089 ID00053 ID00079 
##       7       7       6       6       5       5
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
q11 <- df_customer %>%
  filter(Total_Belanja > 5000000) %>%
  count(ID_Pelanggan, sort = TRUE) %>%
  slice_head(n=6)
q11
##   ID_Pelanggan n
## 1      ID00007 7
## 2      ID00025 7
## 3      ID00026 6
## 4      ID00089 6
## 5      ID00053 5
## 6      ID00079 5

Tugas no 2

q2 <- subset(df_customer, Jenis_Kelamin == "Perempuan" & Tempat_Tinggal == "Kota")
q2_count <- table(q2$ID_Pelanggan)
q2_count <- data.frame(q2_count)
q2_count
##       Var1 Freq
## 1  ID00001    1
## 2  ID00002    3
## 3  ID00004    2
## 4  ID00005    1
## 5  ID00006    2
## 6  ID00007    5
## 7  ID00009    1
## 8  ID00010    1
## 9  ID00011    1
## 10 ID00012    1
## 11 ID00013    1
## 12 ID00016    1
## 13 ID00017    1
## 14 ID00021    1
## 15 ID00023    3
## 16 ID00024    3
## 17 ID00025    4
## 18 ID00026    4
## 19 ID00030    2
## 20 ID00031    2
## 21 ID00032    3
## 22 ID00034    1
## 23 ID00035    1
## 24 ID00036    3
## 25 ID00037    3
## 26 ID00038    1
## 27 ID00039    2
## 28 ID00040    2
## 29 ID00041    1
## 30 ID00042    2
## 31 ID00043    1
## 32 ID00044    1
## 33 ID00045    3
## 34 ID00046    3
## 35 ID00048    1
## 36 ID00050    2
## 37 ID00051    2
## 38 ID00053    4
## 39 ID00054    2
## 40 ID00056    1
## 41 ID00057    2
## 42 ID00058    1
## 43 ID00060    2
## 44 ID00063    3
## 45 ID00066    1
## 46 ID00067    1
## 47 ID00069    2
## 48 ID00070    1
## 49 ID00071    2
## 50 ID00072    1
## 51 ID00074    1
## 52 ID00075    1
## 53 ID00076    2
## 54 ID00079    2
## 55 ID00082    1
## 56 ID00083    1
## 57 ID00084    1
## 58 ID00085    3
## 59 ID00086    1
## 60 ID00087    3
## 61 ID00089    1
## 62 ID00090    2
## 63 ID00091    2
## 64 ID00092    1
## 65 ID00093    1
## 66 ID00096    1
## 67 ID00099    1
q22 <- df_customer %>%
  filter(Jenis_Kelamin == "Perempuan", Tempat_Tinggal == "Kota") %>%
  count(ID_Pelanggan) %>%
  filter(n > 5) %>%
  summarise(jumlah = n())
q22
##   jumlah
## 1      0

Tugas No 3

q3 <- df_customer[df_customer$Penghasilan > 5000000, ]
q3 <- sort(table(q3$ID_Pelanggan), decreasing = TRUE)
head(q3, 1)
## 
## ID00007 
##       9
q33 <- df_customer %>%
  filter(Penghasilan > 5000000) %>%
  count(ID_Pelanggan, sort = TRUE) %>%
  slice_head(n = 1)
q33
##   ID_Pelanggan n
## 1      ID00007 9

Tugas No 4

q4 <- subset(df_customer, Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)
table(q4$Jenis_Kelamin)
## 
## Laki-laki Perempuan 
##        10        37
q44 <- df_customer %>%
  filter(Tempat_Tinggal == "Desa", Total_Belanja > 5000000) %>%
  count(Jenis_Kelamin)
q44
##   Jenis_Kelamin  n
## 1     Laki-laki 10
## 2     Perempuan 37

Tugas No 5

q5 <- subset(df_customer, Tempat_Tinggal == "Desa" & Total_Belanja > 5000000)
head(q5[, c("ID_Pelanggan", "Penghasilan")], 5)
##    ID_Pelanggan Penghasilan
## 5       ID00067     7773498
## 9       ID00014     6776730
## 43      ID00027     8108645
## 46      ID00089     9032981
## 47      ID00034     5616450
q55 <- df_customer %>%
  filter(Tempat_Tinggal == "Desa", Total_Belanja > 5000000) %>%
  select(ID_Pelanggan, Penghasilan) %>%
  head(5)
q55
##   ID_Pelanggan Penghasilan
## 1      ID00067     7773498
## 2      ID00014     6776730
## 3      ID00027     8108645
## 4      ID00089     9032981
## 5      ID00034     5616450