Email             :
Instagram     : https://www.instagram.com/naaufald
RPubs            : https://rpubs.com/naaufaldd/
Address         : ARA Center, Matana University Tower
                         Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.



1 Latihan mengganti Missing Value

berikut adalah cara mengganti nilai missing value yang hilang menggunakan mean atau median

1.1 mengimpor data

library(readr)  # Untuk membaca file CSV
library(dplyr)  # Untuk melakukan transformasi data

1.2 mengekstraksi data

data_penjualan <- read_csv("raw_data/data_penjualan.csv",show_col_types = FALSE)
data_produk <- read_csv("raw_data/data_produk.csv", show_col_types = FALSE)
data_toko <- read_csv("raw_data/data_toko.csv", show_col_types = FALSE)

1.3 transformasi data

data_transformed <- data_penjualan %>%
  left_join(data_produk, by = "id_produk") %>%
  left_join(data_toko, by = "id_toko") %>%
  mutate(total_penjualan = jumlah_terjual * harga_produk)
data_transformed
## # A tibble: 100 × 10
##    id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko nama_produk  
##           <dbl> <date>                <dbl>          <dbl>   <dbl> <chr>        
##  1            1 2024-03-01              101             10       1 Tas Ransel   
##  2            2 2024-03-01              102             20       2 Baju Kaos    
##  3            3 2024-03-02              103              5       5 Sepatu Sneak…
##  4            4 2024-03-02              104             15       3 Baju Kemeja  
##  5            5 2024-03-03              105              8       1 Topi Trucker 
##  6            6 2024-03-03              106             NA       2 Sandal Jepit 
##  7            7 2024-03-04              107              9       1 Jaket Denim  
##  8            8 2024-03-04              108             18       2 Celana Jeans 
##  9            9 2024-03-05              109              6       5 Kacamata Hit…
## 10           10 2024-03-05              110             25       4 Dompet Kulit 
## # ℹ 90 more rows
## # ℹ 4 more variables: harga_produk <dbl>, nama_toko <chr>, lokasi <chr>,
## #   total_penjualan <dbl>

1.4 menyimpan data ke file csv

write_csv(data_transformed, "fix_data/data_penjualan_bersih.csv")

1.5 check missing value

data_penjualan_bersih <- read_csv("fix_data/data_penjualan_bersih.csv", show_col_types = FALSE)
missing_rows <- data_penjualan_bersih %>%
  filter_all(any_vars(is.na(.)))
print(missing_rows)
## # A tibble: 5 × 10
##   id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko nama_produk   
##          <dbl> <date>                <dbl>          <dbl>   <dbl> <chr>         
## 1            6 2024-03-03              106             NA       2 Sandal Jepit  
## 2           12 2024-03-06              112             10       2 Sweater Rajut 
## 3           28 2024-03-14              128             NA       2 Kemeja Lengan…
## 4           39 2024-03-20              139             15       1 Topi Fedora   
## 5           60 2024-03-30              160             NA       2 Kaos Polo     
## # ℹ 4 more variables: harga_produk <dbl>, nama_toko <chr>, lokasi <chr>,
## #   total_penjualan <dbl>

1.6 mengganti nilai missing values dengan mean

miss <- missing_rows%>%
  mutate_all(~ifelse(is.na(.), mean(., na.rm = TRUE), .))
miss <- miss %>%
  mutate(across(where(is.numeric), ~round(., digits = 2)))
miss
## # A tibble: 5 × 10
##   id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko nama_produk   
##          <dbl>             <dbl>     <dbl>          <dbl>   <dbl> <chr>         
## 1            6             19785       106           12.5       2 Sandal Jepit  
## 2           12             19788       112           10         2 Sweater Rajut 
## 3           28             19796       128           12.5       2 Kemeja Lengan…
## 4           39             19802       139           15         1 Topi Fedora   
## 5           60             19812       160           12.5       2 Kaos Polo     
## # ℹ 4 more variables: harga_produk <dbl>, nama_toko <chr>, lokasi <chr>,
## #   total_penjualan <dbl>

1.7 mengganti missing values dengan nilai median

miss <- missing_rows%>%
  mutate_all(~ifelse(is.na(.), median(., na.rm = TRUE), .))
miss <- miss %>%
  mutate(across(where(is.numeric), ~round(., digits = 2)))
miss
## # A tibble: 5 × 10
##   id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko nama_produk   
##          <dbl>             <dbl>     <dbl>          <dbl>   <dbl> <chr>         
## 1            6             19785       106           12.5       2 Sandal Jepit  
## 2           12             19788       112           10         2 Sweater Rajut 
## 3           28             19796       128           12.5       2 Kemeja Lengan…
## 4           39             19802       139           15         1 Topi Fedora   
## 5           60             19812       160           12.5       2 Kaos Polo     
## # ℹ 4 more variables: harga_produk <dbl>, nama_toko <chr>, lokasi <chr>,
## #   total_penjualan <dbl>

1.8 apabila diterapkan ke dalam tabel

data_penjualan_bersih <- read_csv("fix_data/data_penjualan_bersih.csv", show_col_types = FALSE)
missing_rows <- data_penjualan_bersih %>%
  filter_all(any_vars(is.na(.)))
miss <- data_penjualan_bersih%>%
  mutate_all(~ifelse(is.na(.), median(., na.rm = TRUE), .))
miss <- miss %>%
  mutate(across(where(is.numeric), ~round(., digits = 0)))
miss
## # A tibble: 100 × 10
##    id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko nama_produk  
##           <dbl>             <dbl>     <dbl>          <dbl>   <dbl> <chr>        
##  1            1             19783       101             10       1 Tas Ransel   
##  2            2             19783       102             20       2 Baju Kaos    
##  3            3             19784       103              5       5 Sepatu Sneak…
##  4            4             19784       104             15       3 Baju Kemeja  
##  5            5             19785       105              8       1 Topi Trucker 
##  6            6             19785       106             10       2 Sandal Jepit 
##  7            7             19786       107              9       1 Jaket Denim  
##  8            8             19786       108             18       2 Celana Jeans 
##  9            9             19787       109              6       5 Kacamata Hit…
## 10           10             19787       110             25       4 Dompet Kulit 
## # ℹ 90 more rows
## # ℹ 4 more variables: harga_produk <dbl>, nama_toko <chr>, lokasi <chr>,
## #   total_penjualan <dbl>

2 Kasus 2

berikut saya akan melakukan implementasi ETL pada dataset yang telah diberikan.

2.1 membuat dataset fiktif dengan beberapa nilai yang hilang

data_penjualan1 <- data.frame(
  id_penjualan = 1:100,
  tanggal_penjualan = sample(seq(as.Date('2024-01-01'), as.Date('2024-12-31'), by = "day"), 100, replace=TRUE)
)
data_penjualan1
##     id_penjualan tanggal_penjualan
## 1              1        2024-02-26
## 2              2        2024-11-30
## 3              3        2024-06-03
## 4              4        2024-03-10
## 5              5        2024-03-02
## 6              6        2024-08-16
## 7              7        2024-11-05
## 8              8        2024-10-03
## 9              9        2024-12-04
## 10            10        2024-02-15
## 11            11        2024-11-27
## 12            12        2024-12-09
## 13            13        2024-10-01
## 14            14        2024-01-15
## 15            15        2024-01-10
## 16            16        2024-03-10
## 17            17        2024-12-11
## 18            18        2024-02-08
## 19            19        2024-01-03
## 20            20        2024-03-17
## 21            21        2024-09-10
## 22            22        2024-10-18
## 23            23        2024-04-19
## 24            24        2024-09-30
## 25            25        2024-12-20
## 26            26        2024-09-08
## 27            27        2024-08-11
## 28            28        2024-05-02
## 29            29        2024-05-13
## 30            30        2024-06-16
## 31            31        2024-06-26
## 32            32        2024-05-22
## 33            33        2024-05-19
## 34            34        2024-04-29
## 35            35        2024-07-26
## 36            36        2024-07-04
## 37            37        2024-07-17
## 38            38        2024-04-07
## 39            39        2024-08-23
## 40            40        2024-02-09
## 41            41        2024-01-08
## 42            42        2024-02-24
## 43            43        2024-09-05
## 44            44        2024-06-12
## 45            45        2024-09-30
## 46            46        2024-11-08
## 47            47        2024-04-27
## 48            48        2024-05-14
## 49            49        2024-02-24
## 50            50        2024-12-06
## 51            51        2024-11-09
## 52            52        2024-08-23
## 53            53        2024-08-18
## 54            54        2024-03-29
## 55            55        2024-12-15
## 56            56        2024-04-21
## 57            57        2024-09-25
## 58            58        2024-07-14
## 59            59        2024-09-06
## 60            60        2024-05-08
## 61            61        2024-07-05
## 62            62        2024-03-22
## 63            63        2024-01-06
## 64            64        2024-12-15
## 65            65        2024-08-26
## 66            66        2024-10-25
## 67            67        2024-10-19
## 68            68        2024-08-21
## 69            69        2024-10-15
## 70            70        2024-11-22
## 71            71        2024-01-25
## 72            72        2024-02-16
## 73            73        2024-07-07
## 74            74        2024-11-26
## 75            75        2024-08-14
## 76            76        2024-08-29
## 77            77        2024-06-28
## 78            78        2024-08-14
## 79            79        2024-02-21
## 80            80        2024-08-03
## 81            81        2024-12-25
## 82            82        2024-08-06
## 83            83        2024-12-27
## 84            84        2024-04-26
## 85            85        2024-10-08
## 86            86        2024-07-21
## 87            87        2024-01-20
## 88            88        2024-12-30
## 89            89        2024-12-13
## 90            90        2024-04-03
## 91            91        2024-10-25
## 92            92        2024-07-20
## 93            93        2024-07-23
## 94            94        2024-02-16
## 95            95        2024-05-18
## 96            96        2024-09-30
## 97            97        2024-01-12
## 98            98        2024-03-01
## 99            99        2024-05-08
## 100          100        2024-05-03

2.2 membuat dataset fiktif dengan beberapa nilai yang hilang

data_produk2 <- data.frame(
  id_produk = 1:50,
  nama_produk = paste("Produk", 1:50),
  harga_produk = sample(c(50:200, NA), 50, replace=TRUE)
)
data_produk2
##    id_produk nama_produk harga_produk
## 1          1    Produk 1           75
## 2          2    Produk 2          140
## 3          3    Produk 3          100
## 4          4    Produk 4          182
## 5          5    Produk 5          190
## 6          6    Produk 6          167
## 7          7    Produk 7          155
## 8          8    Produk 8           95
## 9          9    Produk 9           50
## 10        10   Produk 10          156
## 11        11   Produk 11          144
## 12        12   Produk 12           83
## 13        13   Produk 13          184
## 14        14   Produk 14          144
## 15        15   Produk 15          195
## 16        16   Produk 16          102
## 17        17   Produk 17          170
## 18        18   Produk 18          141
## 19        19   Produk 19          180
## 20        20   Produk 20           69
## 21        21   Produk 21           57
## 22        22   Produk 22          166
## 23        23   Produk 23          108
## 24        24   Produk 24           57
## 25        25   Produk 25          119
## 26        26   Produk 26          161
## 27        27   Produk 27           62
## 28        28   Produk 28          192
## 29        29   Produk 29           58
## 30        30   Produk 30          171
## 31        31   Produk 31           68
## 32        32   Produk 32           73
## 33        33   Produk 33           65
## 34        34   Produk 34           60
## 35        35   Produk 35          189
## 36        36   Produk 36           83
## 37        37   Produk 37           60
## 38        38   Produk 38          166
## 39        39   Produk 39          188
## 40        40   Produk 40          177
## 41        41   Produk 41          131
## 42        42   Produk 42          192
## 43        43   Produk 43          159
## 44        44   Produk 44          194
## 45        45   Produk 45           82
## 46        46   Produk 46           60
## 47        47   Produk 47          150
## 48        48   Produk 48          140
## 49        49   Produk 49          200
## 50        50   Produk 50          102

2.3 membuat dataset fiktif dengan beberapa nilai yang hilang

data_pelanggan3 <- data.frame(
  id_pelanggan = 1:50,
  nama_pelanggan = paste("Pelanggan", 1:50),
  alamat = paste("Alamat", 1:50),
  nomor_telepon = sample(c(100000:99999, NA), 50, replace=TRUE)
)
data_pelanggan3
##    id_pelanggan nama_pelanggan    alamat nomor_telepon
## 1             1    Pelanggan 1  Alamat 1            NA
## 2             2    Pelanggan 2  Alamat 2            NA
## 3             3    Pelanggan 3  Alamat 3            NA
## 4             4    Pelanggan 4  Alamat 4            NA
## 5             5    Pelanggan 5  Alamat 5         99999
## 6             6    Pelanggan 6  Alamat 6         99999
## 7             7    Pelanggan 7  Alamat 7        100000
## 8             8    Pelanggan 8  Alamat 8         99999
## 9             9    Pelanggan 9  Alamat 9            NA
## 10           10   Pelanggan 10 Alamat 10        100000
## 11           11   Pelanggan 11 Alamat 11            NA
## 12           12   Pelanggan 12 Alamat 12        100000
## 13           13   Pelanggan 13 Alamat 13        100000
## 14           14   Pelanggan 14 Alamat 14            NA
## 15           15   Pelanggan 15 Alamat 15            NA
## 16           16   Pelanggan 16 Alamat 16            NA
## 17           17   Pelanggan 17 Alamat 17         99999
## 18           18   Pelanggan 18 Alamat 18            NA
## 19           19   Pelanggan 19 Alamat 19        100000
## 20           20   Pelanggan 20 Alamat 20            NA
## 21           21   Pelanggan 21 Alamat 21        100000
## 22           22   Pelanggan 22 Alamat 22         99999
## 23           23   Pelanggan 23 Alamat 23            NA
## 24           24   Pelanggan 24 Alamat 24         99999
## 25           25   Pelanggan 25 Alamat 25        100000
## 26           26   Pelanggan 26 Alamat 26            NA
## 27           27   Pelanggan 27 Alamat 27            NA
## 28           28   Pelanggan 28 Alamat 28         99999
## 29           29   Pelanggan 29 Alamat 29            NA
## 30           30   Pelanggan 30 Alamat 30         99999
## 31           31   Pelanggan 31 Alamat 31            NA
## 32           32   Pelanggan 32 Alamat 32            NA
## 33           33   Pelanggan 33 Alamat 33            NA
## 34           34   Pelanggan 34 Alamat 34        100000
## 35           35   Pelanggan 35 Alamat 35            NA
## 36           36   Pelanggan 36 Alamat 36         99999
## 37           37   Pelanggan 37 Alamat 37         99999
## 38           38   Pelanggan 38 Alamat 38         99999
## 39           39   Pelanggan 39 Alamat 39         99999
## 40           40   Pelanggan 40 Alamat 40         99999
## 41           41   Pelanggan 41 Alamat 41        100000
## 42           42   Pelanggan 42 Alamat 42        100000
## 43           43   Pelanggan 43 Alamat 43        100000
## 44           44   Pelanggan 44 Alamat 44            NA
## 45           45   Pelanggan 45 Alamat 45        100000
## 46           46   Pelanggan 46 Alamat 46         99999
## 47           47   Pelanggan 47 Alamat 47         99999
## 48           48   Pelanggan 48 Alamat 48        100000
## 49           49   Pelanggan 49 Alamat 49        100000
## 50           50   Pelanggan 50 Alamat 50         99999

2.4 menyimpan dataset

write.csv(data_penjualan1, "fix_data/data_penjualan_missing.csv", row.names=FALSE)
write.csv(data_produk2, "fix_data/data_produk_missing.csv", row.names=FALSE)
write.csv(data_pelanggan3, "fix_data/data_pelanggan_missing.csv", row.names=FALSE)

3 Melakukan implementasi ETL terhadap dataset

pada hal ini, saya akan melakukan implementasi ETL (Extract, Transform, Load) pada dataset yang telah ada

3.1 Ekstraksi

data_penjualan_missing <- read_csv("fix_data/data_penjualan_missing.csv",show_col_types = FALSE) #data penjualan
data_penjualan_missing
## # A tibble: 100 × 2
##    id_penjualan tanggal_penjualan
##           <dbl> <date>           
##  1            1 2024-02-26       
##  2            2 2024-11-30       
##  3            3 2024-06-03       
##  4            4 2024-03-10       
##  5            5 2024-03-02       
##  6            6 2024-08-16       
##  7            7 2024-11-05       
##  8            8 2024-10-03       
##  9            9 2024-12-04       
## 10           10 2024-02-15       
## # ℹ 90 more rows
data_produk_missing <- read_csv("fix_data/data_produk_missing.csv", show_col_types = FALSE) #data produk
data_produk_missing
## # A tibble: 50 × 3
##    id_produk nama_produk harga_produk
##        <dbl> <chr>              <dbl>
##  1         1 Produk 1              75
##  2         2 Produk 2             140
##  3         3 Produk 3             100
##  4         4 Produk 4             182
##  5         5 Produk 5             190
##  6         6 Produk 6             167
##  7         7 Produk 7             155
##  8         8 Produk 8              95
##  9         9 Produk 9              50
## 10        10 Produk 10            156
## # ℹ 40 more rows
data_pelanggan_missing <- read_csv("fix_data/data_pelanggan_missing.csv", show_col_types = FALSE) #data pelanggan
data_pelanggan_missing
## # A tibble: 50 × 4
##    id_pelanggan nama_pelanggan alamat    nomor_telepon
##           <dbl> <chr>          <chr>             <dbl>
##  1            1 Pelanggan 1    Alamat 1             NA
##  2            2 Pelanggan 2    Alamat 2             NA
##  3            3 Pelanggan 3    Alamat 3             NA
##  4            4 Pelanggan 4    Alamat 4             NA
##  5            5 Pelanggan 5    Alamat 5          99999
##  6            6 Pelanggan 6    Alamat 6          99999
##  7            7 Pelanggan 7    Alamat 7         100000
##  8            8 Pelanggan 8    Alamat 8          99999
##  9            9 Pelanggan 9    Alamat 9             NA
## 10           10 Pelanggan 10   Alamat 10        100000
## # ℹ 40 more rows

3.2 tranformasi

data_bersih_penjualan <- data_penjualan_missing %>% #cek nilai NA
  filter_all(any_vars(is.na(.)))
data_bersih_penjualan
## # A tibble: 0 × 2
## # ℹ 2 variables: id_penjualan <dbl>, tanggal_penjualan <date>
data_bersih_produk <- data_produk_missing %>% #cek nilai NA
  filter_all(any_vars(is.na(.)))
data_bersih_produk
## # A tibble: 0 × 3
## # ℹ 3 variables: id_produk <dbl>, nama_produk <chr>, harga_produk <dbl>
data_bersih_pelanggan <- data_pelanggan_missing %>% #cek nilai NA
  filter_all(any_vars(is.na(.)))
data_bersih_pelanggan
## # A tibble: 20 × 4
##    id_pelanggan nama_pelanggan alamat    nomor_telepon
##           <dbl> <chr>          <chr>             <dbl>
##  1            1 Pelanggan 1    Alamat 1             NA
##  2            2 Pelanggan 2    Alamat 2             NA
##  3            3 Pelanggan 3    Alamat 3             NA
##  4            4 Pelanggan 4    Alamat 4             NA
##  5            9 Pelanggan 9    Alamat 9             NA
##  6           11 Pelanggan 11   Alamat 11            NA
##  7           14 Pelanggan 14   Alamat 14            NA
##  8           15 Pelanggan 15   Alamat 15            NA
##  9           16 Pelanggan 16   Alamat 16            NA
## 10           18 Pelanggan 18   Alamat 18            NA
## 11           20 Pelanggan 20   Alamat 20            NA
## 12           23 Pelanggan 23   Alamat 23            NA
## 13           26 Pelanggan 26   Alamat 26            NA
## 14           27 Pelanggan 27   Alamat 27            NA
## 15           29 Pelanggan 29   Alamat 29            NA
## 16           31 Pelanggan 31   Alamat 31            NA
## 17           32 Pelanggan 32   Alamat 32            NA
## 18           33 Pelanggan 33   Alamat 33            NA
## 19           35 Pelanggan 35   Alamat 35            NA
## 20           44 Pelanggan 44   Alamat 44            NA

terdapat banyak NA di bagian data pelanggan, maka

library(readr)
library(dplyr)
data_bersih <- read_csv("fix_data/data_pelanggan_missing.csv", show_col_types = FALSE)
missing_rows <- data_pelanggan_missing %>%
  filter_all(any_vars(is.na(.)))
miss <- data_pelanggan_missing %>%
  mutate_all(~ifelse(is.na(.), median(., na.rm = TRUE), .))
miss <- miss %>%
  mutate(across(where(is.numeric), ~round(., digits = 0)))
miss
## # A tibble: 50 × 4
##    id_pelanggan nama_pelanggan alamat    nomor_telepon
##           <dbl> <chr>          <chr>             <dbl>
##  1            1 Pelanggan 1    Alamat 1          99999
##  2            2 Pelanggan 2    Alamat 2          99999
##  3            3 Pelanggan 3    Alamat 3          99999
##  4            4 Pelanggan 4    Alamat 4          99999
##  5            5 Pelanggan 5    Alamat 5          99999
##  6            6 Pelanggan 6    Alamat 6          99999
##  7            7 Pelanggan 7    Alamat 7         100000
##  8            8 Pelanggan 8    Alamat 8          99999
##  9            9 Pelanggan 9    Alamat 9          99999
## 10           10 Pelanggan 10   Alamat 10        100000
## # ℹ 40 more rows

3.3 menggabungkan data

data_gabungan <- cbind(data_penjualan_missing, data_produk_missing)
data_gabungan
##     id_penjualan tanggal_penjualan id_produk nama_produk harga_produk
## 1              1        2024-02-26         1    Produk 1           75
## 2              2        2024-11-30         2    Produk 2          140
## 3              3        2024-06-03         3    Produk 3          100
## 4              4        2024-03-10         4    Produk 4          182
## 5              5        2024-03-02         5    Produk 5          190
## 6              6        2024-08-16         6    Produk 6          167
## 7              7        2024-11-05         7    Produk 7          155
## 8              8        2024-10-03         8    Produk 8           95
## 9              9        2024-12-04         9    Produk 9           50
## 10            10        2024-02-15        10   Produk 10          156
## 11            11        2024-11-27        11   Produk 11          144
## 12            12        2024-12-09        12   Produk 12           83
## 13            13        2024-10-01        13   Produk 13          184
## 14            14        2024-01-15        14   Produk 14          144
## 15            15        2024-01-10        15   Produk 15          195
## 16            16        2024-03-10        16   Produk 16          102
## 17            17        2024-12-11        17   Produk 17          170
## 18            18        2024-02-08        18   Produk 18          141
## 19            19        2024-01-03        19   Produk 19          180
## 20            20        2024-03-17        20   Produk 20           69
## 21            21        2024-09-10        21   Produk 21           57
## 22            22        2024-10-18        22   Produk 22          166
## 23            23        2024-04-19        23   Produk 23          108
## 24            24        2024-09-30        24   Produk 24           57
## 25            25        2024-12-20        25   Produk 25          119
## 26            26        2024-09-08        26   Produk 26          161
## 27            27        2024-08-11        27   Produk 27           62
## 28            28        2024-05-02        28   Produk 28          192
## 29            29        2024-05-13        29   Produk 29           58
## 30            30        2024-06-16        30   Produk 30          171
## 31            31        2024-06-26        31   Produk 31           68
## 32            32        2024-05-22        32   Produk 32           73
## 33            33        2024-05-19        33   Produk 33           65
## 34            34        2024-04-29        34   Produk 34           60
## 35            35        2024-07-26        35   Produk 35          189
## 36            36        2024-07-04        36   Produk 36           83
## 37            37        2024-07-17        37   Produk 37           60
## 38            38        2024-04-07        38   Produk 38          166
## 39            39        2024-08-23        39   Produk 39          188
## 40            40        2024-02-09        40   Produk 40          177
## 41            41        2024-01-08        41   Produk 41          131
## 42            42        2024-02-24        42   Produk 42          192
## 43            43        2024-09-05        43   Produk 43          159
## 44            44        2024-06-12        44   Produk 44          194
## 45            45        2024-09-30        45   Produk 45           82
## 46            46        2024-11-08        46   Produk 46           60
## 47            47        2024-04-27        47   Produk 47          150
## 48            48        2024-05-14        48   Produk 48          140
## 49            49        2024-02-24        49   Produk 49          200
## 50            50        2024-12-06        50   Produk 50          102
## 51            51        2024-11-09         1    Produk 1           75
## 52            52        2024-08-23         2    Produk 2          140
## 53            53        2024-08-18         3    Produk 3          100
## 54            54        2024-03-29         4    Produk 4          182
## 55            55        2024-12-15         5    Produk 5          190
## 56            56        2024-04-21         6    Produk 6          167
## 57            57        2024-09-25         7    Produk 7          155
## 58            58        2024-07-14         8    Produk 8           95
## 59            59        2024-09-06         9    Produk 9           50
## 60            60        2024-05-08        10   Produk 10          156
## 61            61        2024-07-05        11   Produk 11          144
## 62            62        2024-03-22        12   Produk 12           83
## 63            63        2024-01-06        13   Produk 13          184
## 64            64        2024-12-15        14   Produk 14          144
## 65            65        2024-08-26        15   Produk 15          195
## 66            66        2024-10-25        16   Produk 16          102
## 67            67        2024-10-19        17   Produk 17          170
## 68            68        2024-08-21        18   Produk 18          141
## 69            69        2024-10-15        19   Produk 19          180
## 70            70        2024-11-22        20   Produk 20           69
## 71            71        2024-01-25        21   Produk 21           57
## 72            72        2024-02-16        22   Produk 22          166
## 73            73        2024-07-07        23   Produk 23          108
## 74            74        2024-11-26        24   Produk 24           57
## 75            75        2024-08-14        25   Produk 25          119
## 76            76        2024-08-29        26   Produk 26          161
## 77            77        2024-06-28        27   Produk 27           62
## 78            78        2024-08-14        28   Produk 28          192
## 79            79        2024-02-21        29   Produk 29           58
## 80            80        2024-08-03        30   Produk 30          171
## 81            81        2024-12-25        31   Produk 31           68
## 82            82        2024-08-06        32   Produk 32           73
## 83            83        2024-12-27        33   Produk 33           65
## 84            84        2024-04-26        34   Produk 34           60
## 85            85        2024-10-08        35   Produk 35          189
## 86            86        2024-07-21        36   Produk 36           83
## 87            87        2024-01-20        37   Produk 37           60
## 88            88        2024-12-30        38   Produk 38          166
## 89            89        2024-12-13        39   Produk 39          188
## 90            90        2024-04-03        40   Produk 40          177
## 91            91        2024-10-25        41   Produk 41          131
## 92            92        2024-07-20        42   Produk 42          192
## 93            93        2024-07-23        43   Produk 43          159
## 94            94        2024-02-16        44   Produk 44          194
## 95            95        2024-05-18        45   Produk 45           82
## 96            96        2024-09-30        46   Produk 46           60
## 97            97        2024-01-12        47   Produk 47          150
## 98            98        2024-03-01        48   Produk 48          140
## 99            99        2024-05-08        49   Produk 49          200
## 100          100        2024-05-03        50   Produk 50          102
data_gabungan1 <- cbind(miss, data_gabungan)
data_gabungan1
##     id_pelanggan nama_pelanggan    alamat nomor_telepon id_penjualan
## 1              1    Pelanggan 1  Alamat 1         99999            1
## 2              2    Pelanggan 2  Alamat 2         99999            2
## 3              3    Pelanggan 3  Alamat 3         99999            3
## 4              4    Pelanggan 4  Alamat 4         99999            4
## 5              5    Pelanggan 5  Alamat 5         99999            5
## 6              6    Pelanggan 6  Alamat 6         99999            6
## 7              7    Pelanggan 7  Alamat 7        100000            7
## 8              8    Pelanggan 8  Alamat 8         99999            8
## 9              9    Pelanggan 9  Alamat 9         99999            9
## 10            10   Pelanggan 10 Alamat 10        100000           10
## 11            11   Pelanggan 11 Alamat 11         99999           11
## 12            12   Pelanggan 12 Alamat 12        100000           12
## 13            13   Pelanggan 13 Alamat 13        100000           13
## 14            14   Pelanggan 14 Alamat 14         99999           14
## 15            15   Pelanggan 15 Alamat 15         99999           15
## 16            16   Pelanggan 16 Alamat 16         99999           16
## 17            17   Pelanggan 17 Alamat 17         99999           17
## 18            18   Pelanggan 18 Alamat 18         99999           18
## 19            19   Pelanggan 19 Alamat 19        100000           19
## 20            20   Pelanggan 20 Alamat 20         99999           20
## 21            21   Pelanggan 21 Alamat 21        100000           21
## 22            22   Pelanggan 22 Alamat 22         99999           22
## 23            23   Pelanggan 23 Alamat 23         99999           23
## 24            24   Pelanggan 24 Alamat 24         99999           24
## 25            25   Pelanggan 25 Alamat 25        100000           25
## 26            26   Pelanggan 26 Alamat 26         99999           26
## 27            27   Pelanggan 27 Alamat 27         99999           27
## 28            28   Pelanggan 28 Alamat 28         99999           28
## 29            29   Pelanggan 29 Alamat 29         99999           29
## 30            30   Pelanggan 30 Alamat 30         99999           30
## 31            31   Pelanggan 31 Alamat 31         99999           31
## 32            32   Pelanggan 32 Alamat 32         99999           32
## 33            33   Pelanggan 33 Alamat 33         99999           33
## 34            34   Pelanggan 34 Alamat 34        100000           34
## 35            35   Pelanggan 35 Alamat 35         99999           35
## 36            36   Pelanggan 36 Alamat 36         99999           36
## 37            37   Pelanggan 37 Alamat 37         99999           37
## 38            38   Pelanggan 38 Alamat 38         99999           38
## 39            39   Pelanggan 39 Alamat 39         99999           39
## 40            40   Pelanggan 40 Alamat 40         99999           40
## 41            41   Pelanggan 41 Alamat 41        100000           41
## 42            42   Pelanggan 42 Alamat 42        100000           42
## 43            43   Pelanggan 43 Alamat 43        100000           43
## 44            44   Pelanggan 44 Alamat 44         99999           44
## 45            45   Pelanggan 45 Alamat 45        100000           45
## 46            46   Pelanggan 46 Alamat 46         99999           46
## 47            47   Pelanggan 47 Alamat 47         99999           47
## 48            48   Pelanggan 48 Alamat 48        100000           48
## 49            49   Pelanggan 49 Alamat 49        100000           49
## 50            50   Pelanggan 50 Alamat 50         99999           50
## 51             1    Pelanggan 1  Alamat 1         99999           51
## 52             2    Pelanggan 2  Alamat 2         99999           52
## 53             3    Pelanggan 3  Alamat 3         99999           53
## 54             4    Pelanggan 4  Alamat 4         99999           54
## 55             5    Pelanggan 5  Alamat 5         99999           55
## 56             6    Pelanggan 6  Alamat 6         99999           56
## 57             7    Pelanggan 7  Alamat 7        100000           57
## 58             8    Pelanggan 8  Alamat 8         99999           58
## 59             9    Pelanggan 9  Alamat 9         99999           59
## 60            10   Pelanggan 10 Alamat 10        100000           60
## 61            11   Pelanggan 11 Alamat 11         99999           61
## 62            12   Pelanggan 12 Alamat 12        100000           62
## 63            13   Pelanggan 13 Alamat 13        100000           63
## 64            14   Pelanggan 14 Alamat 14         99999           64
## 65            15   Pelanggan 15 Alamat 15         99999           65
## 66            16   Pelanggan 16 Alamat 16         99999           66
## 67            17   Pelanggan 17 Alamat 17         99999           67
## 68            18   Pelanggan 18 Alamat 18         99999           68
## 69            19   Pelanggan 19 Alamat 19        100000           69
## 70            20   Pelanggan 20 Alamat 20         99999           70
## 71            21   Pelanggan 21 Alamat 21        100000           71
## 72            22   Pelanggan 22 Alamat 22         99999           72
## 73            23   Pelanggan 23 Alamat 23         99999           73
## 74            24   Pelanggan 24 Alamat 24         99999           74
## 75            25   Pelanggan 25 Alamat 25        100000           75
## 76            26   Pelanggan 26 Alamat 26         99999           76
## 77            27   Pelanggan 27 Alamat 27         99999           77
## 78            28   Pelanggan 28 Alamat 28         99999           78
## 79            29   Pelanggan 29 Alamat 29         99999           79
## 80            30   Pelanggan 30 Alamat 30         99999           80
## 81            31   Pelanggan 31 Alamat 31         99999           81
## 82            32   Pelanggan 32 Alamat 32         99999           82
## 83            33   Pelanggan 33 Alamat 33         99999           83
## 84            34   Pelanggan 34 Alamat 34        100000           84
## 85            35   Pelanggan 35 Alamat 35         99999           85
## 86            36   Pelanggan 36 Alamat 36         99999           86
## 87            37   Pelanggan 37 Alamat 37         99999           87
## 88            38   Pelanggan 38 Alamat 38         99999           88
## 89            39   Pelanggan 39 Alamat 39         99999           89
## 90            40   Pelanggan 40 Alamat 40         99999           90
## 91            41   Pelanggan 41 Alamat 41        100000           91
## 92            42   Pelanggan 42 Alamat 42        100000           92
## 93            43   Pelanggan 43 Alamat 43        100000           93
## 94            44   Pelanggan 44 Alamat 44         99999           94
## 95            45   Pelanggan 45 Alamat 45        100000           95
## 96            46   Pelanggan 46 Alamat 46         99999           96
## 97            47   Pelanggan 47 Alamat 47         99999           97
## 98            48   Pelanggan 48 Alamat 48        100000           98
## 99            49   Pelanggan 49 Alamat 49        100000           99
## 100           50   Pelanggan 50 Alamat 50         99999          100
##     tanggal_penjualan id_produk nama_produk harga_produk
## 1          2024-02-26         1    Produk 1           75
## 2          2024-11-30         2    Produk 2          140
## 3          2024-06-03         3    Produk 3          100
## 4          2024-03-10         4    Produk 4          182
## 5          2024-03-02         5    Produk 5          190
## 6          2024-08-16         6    Produk 6          167
## 7          2024-11-05         7    Produk 7          155
## 8          2024-10-03         8    Produk 8           95
## 9          2024-12-04         9    Produk 9           50
## 10         2024-02-15        10   Produk 10          156
## 11         2024-11-27        11   Produk 11          144
## 12         2024-12-09        12   Produk 12           83
## 13         2024-10-01        13   Produk 13          184
## 14         2024-01-15        14   Produk 14          144
## 15         2024-01-10        15   Produk 15          195
## 16         2024-03-10        16   Produk 16          102
## 17         2024-12-11        17   Produk 17          170
## 18         2024-02-08        18   Produk 18          141
## 19         2024-01-03        19   Produk 19          180
## 20         2024-03-17        20   Produk 20           69
## 21         2024-09-10        21   Produk 21           57
## 22         2024-10-18        22   Produk 22          166
## 23         2024-04-19        23   Produk 23          108
## 24         2024-09-30        24   Produk 24           57
## 25         2024-12-20        25   Produk 25          119
## 26         2024-09-08        26   Produk 26          161
## 27         2024-08-11        27   Produk 27           62
## 28         2024-05-02        28   Produk 28          192
## 29         2024-05-13        29   Produk 29           58
## 30         2024-06-16        30   Produk 30          171
## 31         2024-06-26        31   Produk 31           68
## 32         2024-05-22        32   Produk 32           73
## 33         2024-05-19        33   Produk 33           65
## 34         2024-04-29        34   Produk 34           60
## 35         2024-07-26        35   Produk 35          189
## 36         2024-07-04        36   Produk 36           83
## 37         2024-07-17        37   Produk 37           60
## 38         2024-04-07        38   Produk 38          166
## 39         2024-08-23        39   Produk 39          188
## 40         2024-02-09        40   Produk 40          177
## 41         2024-01-08        41   Produk 41          131
## 42         2024-02-24        42   Produk 42          192
## 43         2024-09-05        43   Produk 43          159
## 44         2024-06-12        44   Produk 44          194
## 45         2024-09-30        45   Produk 45           82
## 46         2024-11-08        46   Produk 46           60
## 47         2024-04-27        47   Produk 47          150
## 48         2024-05-14        48   Produk 48          140
## 49         2024-02-24        49   Produk 49          200
## 50         2024-12-06        50   Produk 50          102
## 51         2024-11-09         1    Produk 1           75
## 52         2024-08-23         2    Produk 2          140
## 53         2024-08-18         3    Produk 3          100
## 54         2024-03-29         4    Produk 4          182
## 55         2024-12-15         5    Produk 5          190
## 56         2024-04-21         6    Produk 6          167
## 57         2024-09-25         7    Produk 7          155
## 58         2024-07-14         8    Produk 8           95
## 59         2024-09-06         9    Produk 9           50
## 60         2024-05-08        10   Produk 10          156
## 61         2024-07-05        11   Produk 11          144
## 62         2024-03-22        12   Produk 12           83
## 63         2024-01-06        13   Produk 13          184
## 64         2024-12-15        14   Produk 14          144
## 65         2024-08-26        15   Produk 15          195
## 66         2024-10-25        16   Produk 16          102
## 67         2024-10-19        17   Produk 17          170
## 68         2024-08-21        18   Produk 18          141
## 69         2024-10-15        19   Produk 19          180
## 70         2024-11-22        20   Produk 20           69
## 71         2024-01-25        21   Produk 21           57
## 72         2024-02-16        22   Produk 22          166
## 73         2024-07-07        23   Produk 23          108
## 74         2024-11-26        24   Produk 24           57
## 75         2024-08-14        25   Produk 25          119
## 76         2024-08-29        26   Produk 26          161
## 77         2024-06-28        27   Produk 27           62
## 78         2024-08-14        28   Produk 28          192
## 79         2024-02-21        29   Produk 29           58
## 80         2024-08-03        30   Produk 30          171
## 81         2024-12-25        31   Produk 31           68
## 82         2024-08-06        32   Produk 32           73
## 83         2024-12-27        33   Produk 33           65
## 84         2024-04-26        34   Produk 34           60
## 85         2024-10-08        35   Produk 35          189
## 86         2024-07-21        36   Produk 36           83
## 87         2024-01-20        37   Produk 37           60
## 88         2024-12-30        38   Produk 38          166
## 89         2024-12-13        39   Produk 39          188
## 90         2024-04-03        40   Produk 40          177
## 91         2024-10-25        41   Produk 41          131
## 92         2024-07-20        42   Produk 42          192
## 93         2024-07-23        43   Produk 43          159
## 94         2024-02-16        44   Produk 44          194
## 95         2024-05-18        45   Produk 45           82
## 96         2024-09-30        46   Produk 46           60
## 97         2024-01-12        47   Produk 47          150
## 98         2024-03-01        48   Produk 48          140
## 99         2024-05-08        49   Produk 49          200
## 100        2024-05-03        50   Produk 50          102

3.4 memperkaya data

terdapat nilai NA di data_penjualan

fixnya<- na.omit(data_penjualan) %>% #mengganti nilai NA yg ada di data_penjualan
  filter_all(any_vars(is.na(.)))
miss <- na.omit(data_penjualan) %>%
  mutate_all(~ifelse(is.na(.), median(., na.rm = TRUE), .)) #menggunakan nilai median
miss2 <- na.omit(miss) %>%
  mutate(across(where(is.numeric), ~round(., digits = 0)))
miss2
## # A tibble: 97 × 5
##    id_penjualan tanggal_penjualan id_produk jumlah_terjual id_toko
##           <dbl>             <dbl>     <dbl>          <dbl>   <dbl>
##  1            1             19783       101             10       1
##  2            2             19783       102             20       2
##  3            3             19784       103              5       5
##  4            4             19784       104             15       3
##  5            5             19785       105              8       1
##  6            7             19786       107              9       1
##  7            8             19786       108             18       2
##  8            9             19787       109              6       5
##  9           10             19787       110             25       4
## 10           11             19788       111              4       3
## # ℹ 87 more rows
dataaa <- data_gabungan1%>% #diaplikasikan
  mutate(total_penjualan = miss2$jumlah_terjual * data_produk$harga_produk)
dataaa
##     id_pelanggan nama_pelanggan    alamat nomor_telepon id_penjualan
## 1              1    Pelanggan 1  Alamat 1         99999            1
## 2              2    Pelanggan 2  Alamat 2         99999            2
## 3              3    Pelanggan 3  Alamat 3         99999            3
## 4              4    Pelanggan 4  Alamat 4         99999            4
## 5              5    Pelanggan 5  Alamat 5         99999            5
## 6              6    Pelanggan 6  Alamat 6         99999            6
## 7              7    Pelanggan 7  Alamat 7        100000            7
## 8              8    Pelanggan 8  Alamat 8         99999            8
## 9              9    Pelanggan 9  Alamat 9         99999            9
## 10            10   Pelanggan 10 Alamat 10        100000           10
## 11            11   Pelanggan 11 Alamat 11         99999           11
## 12            12   Pelanggan 12 Alamat 12        100000           12
## 13            13   Pelanggan 13 Alamat 13        100000           13
## 14            14   Pelanggan 14 Alamat 14         99999           14
## 15            15   Pelanggan 15 Alamat 15         99999           15
## 16            16   Pelanggan 16 Alamat 16         99999           16
## 17            17   Pelanggan 17 Alamat 17         99999           17
## 18            18   Pelanggan 18 Alamat 18         99999           18
## 19            19   Pelanggan 19 Alamat 19        100000           19
## 20            20   Pelanggan 20 Alamat 20         99999           20
## 21            21   Pelanggan 21 Alamat 21        100000           21
## 22            22   Pelanggan 22 Alamat 22         99999           22
## 23            23   Pelanggan 23 Alamat 23         99999           23
## 24            24   Pelanggan 24 Alamat 24         99999           24
## 25            25   Pelanggan 25 Alamat 25        100000           25
## 26            26   Pelanggan 26 Alamat 26         99999           26
## 27            27   Pelanggan 27 Alamat 27         99999           27
## 28            28   Pelanggan 28 Alamat 28         99999           28
## 29            29   Pelanggan 29 Alamat 29         99999           29
## 30            30   Pelanggan 30 Alamat 30         99999           30
## 31            31   Pelanggan 31 Alamat 31         99999           31
## 32            32   Pelanggan 32 Alamat 32         99999           32
## 33            33   Pelanggan 33 Alamat 33         99999           33
## 34            34   Pelanggan 34 Alamat 34        100000           34
## 35            35   Pelanggan 35 Alamat 35         99999           35
## 36            36   Pelanggan 36 Alamat 36         99999           36
## 37            37   Pelanggan 37 Alamat 37         99999           37
## 38            38   Pelanggan 38 Alamat 38         99999           38
## 39            39   Pelanggan 39 Alamat 39         99999           39
## 40            40   Pelanggan 40 Alamat 40         99999           40
## 41            41   Pelanggan 41 Alamat 41        100000           41
## 42            42   Pelanggan 42 Alamat 42        100000           42
## 43            43   Pelanggan 43 Alamat 43        100000           43
## 44            44   Pelanggan 44 Alamat 44         99999           44
## 45            45   Pelanggan 45 Alamat 45        100000           45
## 46            46   Pelanggan 46 Alamat 46         99999           46
## 47            47   Pelanggan 47 Alamat 47         99999           47
## 48            48   Pelanggan 48 Alamat 48        100000           48
## 49            49   Pelanggan 49 Alamat 49        100000           49
## 50            50   Pelanggan 50 Alamat 50         99999           50
## 51             1    Pelanggan 1  Alamat 1         99999           51
## 52             2    Pelanggan 2  Alamat 2         99999           52
## 53             3    Pelanggan 3  Alamat 3         99999           53
## 54             4    Pelanggan 4  Alamat 4         99999           54
## 55             5    Pelanggan 5  Alamat 5         99999           55
## 56             6    Pelanggan 6  Alamat 6         99999           56
## 57             7    Pelanggan 7  Alamat 7        100000           57
## 58             8    Pelanggan 8  Alamat 8         99999           58
## 59             9    Pelanggan 9  Alamat 9         99999           59
## 60            10   Pelanggan 10 Alamat 10        100000           60
## 61            11   Pelanggan 11 Alamat 11         99999           61
## 62            12   Pelanggan 12 Alamat 12        100000           62
## 63            13   Pelanggan 13 Alamat 13        100000           63
## 64            14   Pelanggan 14 Alamat 14         99999           64
## 65            15   Pelanggan 15 Alamat 15         99999           65
## 66            16   Pelanggan 16 Alamat 16         99999           66
## 67            17   Pelanggan 17 Alamat 17         99999           67
## 68            18   Pelanggan 18 Alamat 18         99999           68
## 69            19   Pelanggan 19 Alamat 19        100000           69
## 70            20   Pelanggan 20 Alamat 20         99999           70
## 71            21   Pelanggan 21 Alamat 21        100000           71
## 72            22   Pelanggan 22 Alamat 22         99999           72
## 73            23   Pelanggan 23 Alamat 23         99999           73
## 74            24   Pelanggan 24 Alamat 24         99999           74
## 75            25   Pelanggan 25 Alamat 25        100000           75
## 76            26   Pelanggan 26 Alamat 26         99999           76
## 77            27   Pelanggan 27 Alamat 27         99999           77
## 78            28   Pelanggan 28 Alamat 28         99999           78
## 79            29   Pelanggan 29 Alamat 29         99999           79
## 80            30   Pelanggan 30 Alamat 30         99999           80
## 81            31   Pelanggan 31 Alamat 31         99999           81
## 82            32   Pelanggan 32 Alamat 32         99999           82
## 83            33   Pelanggan 33 Alamat 33         99999           83
## 84            34   Pelanggan 34 Alamat 34        100000           84
## 85            35   Pelanggan 35 Alamat 35         99999           85
## 86            36   Pelanggan 36 Alamat 36         99999           86
## 87            37   Pelanggan 37 Alamat 37         99999           87
## 88            38   Pelanggan 38 Alamat 38         99999           88
## 89            39   Pelanggan 39 Alamat 39         99999           89
## 90            40   Pelanggan 40 Alamat 40         99999           90
## 91            41   Pelanggan 41 Alamat 41        100000           91
## 92            42   Pelanggan 42 Alamat 42        100000           92
## 93            43   Pelanggan 43 Alamat 43        100000           93
## 94            44   Pelanggan 44 Alamat 44         99999           94
## 95            45   Pelanggan 45 Alamat 45        100000           95
## 96            46   Pelanggan 46 Alamat 46         99999           96
## 97            47   Pelanggan 47 Alamat 47         99999           97
## 98            48   Pelanggan 48 Alamat 48        100000           98
## 99            49   Pelanggan 49 Alamat 49        100000           99
## 100           50   Pelanggan 50 Alamat 50         99999          100
##     tanggal_penjualan id_produk nama_produk harga_produk total_penjualan
## 1          2024-02-26         1    Produk 1           75             500
## 2          2024-11-30         2    Produk 2          140             400
## 3          2024-06-03         3    Produk 3          100             500
## 4          2024-03-10         4    Produk 4          182             450
## 5          2024-03-02         5    Produk 5          190             120
## 6          2024-08-16         6    Produk 6          167              90
## 7          2024-11-05         7    Produk 7          155            1440
## 8          2024-10-03         8    Produk 8           95             420
## 9          2024-12-04         9    Produk 9           50             625
## 10         2024-02-15        10   Produk 10          156             180
## 11         2024-11-27        11   Produk 11          144            1200
## 12         2024-12-09        12   Produk 12           83              NA
## 13         2024-10-01        13   Produk 13          184             560
## 14         2024-01-15        14   Produk 14          144            1800
## 15         2024-01-10        15   Produk 15          195            4000
## 16         2024-03-10        16   Produk 16          102             105
## 17         2024-12-11        17   Produk 17          170             810
## 18         2024-02-08        18   Produk 18          141             825
## 19         2024-01-03        19   Produk 19          180             750
## 20         2024-03-17        20   Produk 20           69             440
## 21         2024-09-10        21   Produk 21           57             660
## 22         2024-10-18        22   Produk 22          166             160
## 23         2024-04-19        23   Produk 23          108            1120
## 24         2024-09-30        24   Produk 24           57              75
## 25         2024-12-20        25   Produk 25          119             100
## 26         2024-09-08        26   Produk 26          161            1350
## 27         2024-08-11        27   Produk 27           62             600
## 28         2024-05-02        28   Produk 28          192            1125
## 29         2024-05-13        29   Produk 29           58             240
## 30         2024-06-16        30   Produk 30          171             250
## 31         2024-06-26        31   Produk 31           68             210
## 32         2024-05-22        32   Produk 32           73             210
## 33         2024-05-19        33   Produk 33           65             300
## 34         2024-04-29        34   Produk 34           60            2400
## 35         2024-07-26        35   Produk 35          189             120
## 36         2024-07-04        36   Produk 36           83             450
## 37         2024-07-17        37   Produk 37           60            2250
## 38         2024-04-07        38   Produk 38          166            6000
## 39         2024-08-23        39   Produk 39          188              NA
## 40         2024-02-09        40   Produk 40          177            1980
## 41         2024-01-08        41   Produk 41          131             440
## 42         2024-02-24        42   Produk 42          192             400
## 43         2024-09-05        43   Produk 43          159             200
## 44         2024-06-12        44   Produk 44          194             300
## 45         2024-09-30        45   Produk 45           82             180
## 46         2024-11-08        46   Produk 46           60            1260
## 47         2024-04-27        47   Produk 47          150             360
## 48         2024-05-14        48   Produk 48          140             625
## 49         2024-02-24        49   Produk 49          200             120
## 50         2024-12-06        50   Produk 50          102             150
## 51         2024-11-09         1    Produk 1           75             175
## 52         2024-08-23         2    Produk 2          140            1680
## 53         2024-08-18         3    Produk 3          100             480
## 54         2024-03-29         4    Produk 4          182            1000
## 55         2024-12-15         5    Produk 5          190             450
## 56         2024-04-21         6    Produk 6          167            1800
## 57         2024-09-25         7    Produk 7          155             525
## 58         2024-07-14         8    Produk 8           95             990
## 59         2024-09-06         9    Produk 9           50            1210
## 60         2024-05-08        10   Produk 10          156             200
## 61         2024-07-05        11   Produk 11          144             640
## 62         2024-03-22        12   Produk 12           83             150
## 63         2024-01-06        13   Produk 13          184             200
## 64         2024-12-15        14   Produk 14          144             630
## 65         2024-08-26        15   Produk 15          195            1080
## 66         2024-10-25        16   Produk 16          102             150
## 67         2024-10-19        17   Produk 17          170             750
## 68         2024-08-21        18   Produk 18          141              60
## 69         2024-10-15        19   Produk 19          180             250
## 70         2024-11-22        20   Produk 20           69             840
## 71         2024-01-25        21   Produk 21           57             560
## 72         2024-02-16        22   Produk 22          166             600
## 73         2024-07-07        23   Produk 23          108            3000
## 74         2024-11-26        24   Produk 24           57             600
## 75         2024-08-14        25   Produk 25          119             315
## 76         2024-08-29        26   Produk 26          161            1350
## 77         2024-06-28        27   Produk 27           62            1650
## 78         2024-08-14        28   Produk 28          192             275
## 79         2024-02-21        29   Produk 29           58             880
## 80         2024-08-03        30   Produk 30          171             240
## 81         2024-12-25        31   Produk 31           68             320
## 82         2024-08-06        32   Produk 32           73             350
## 83         2024-12-27        33   Produk 33           65             600
## 84         2024-04-26        34   Produk 34           60             225
## 85         2024-10-08        35   Produk 35          189             540
## 86         2024-07-21        36   Produk 36           83              90
## 87         2024-01-20        37   Produk 37           60             625
## 88         2024-12-30        38   Produk 38          166             480
## 89         2024-12-13        39   Produk 39          188             400
## 90         2024-04-03        40   Produk 40          177             350
## 91         2024-10-25        41   Produk 41          131            2100
## 92         2024-07-20        42   Produk 42          192            2400
## 93         2024-07-23        43   Produk 43          159             700
## 94         2024-02-16        44   Produk 44          194             270
## 95         2024-05-18        45   Produk 45           82             495
## 96         2024-09-30        46   Produk 46           60             375
## 97         2024-01-12        47   Produk 47          150            1200
## 98         2024-03-01        48   Produk 48          140             300
## 99         2024-05-08        49   Produk 49          200             400
## 100        2024-05-03        50   Produk 50          102             350

3.5 mengubah format data

datanya <- as.character(data_penjualan$tanggal_penjualan)
datanya
##   [1] "2024-03-01" "2024-03-01" "2024-03-02" "2024-03-02" "2024-03-03"
##   [6] "2024-03-03" "2024-03-04" "2024-03-04" "2024-03-05" "2024-03-05"
##  [11] "2024-03-06" "2024-03-06" "2024-03-07" "2024-03-07" "2024-03-08"
##  [16] "2024-03-08" "2024-03-09" "2024-03-09" "2024-03-10" "2024-03-10"
##  [21] "2024-03-11" "2024-03-11" "2024-03-12" "2024-03-12" "2024-03-13"
##  [26] "2024-03-13" "2024-03-14" "2024-03-14" "2024-03-15" "2024-03-15"
##  [31] "2024-03-16" "2024-03-16" "2024-03-17" "2024-03-17" "2024-03-18"
##  [36] "2024-03-18" "2024-03-19" "2024-03-19" "2024-03-20" "2024-03-20"
##  [41] "2024-03-21" "2024-03-21" "2024-03-22" "2024-03-22" "2024-03-23"
##  [46] "2024-03-23" "2024-03-24" "2024-03-24" "2024-03-25" "2024-03-25"
##  [51] "2024-03-26" "2024-03-26" "2024-03-27" "2024-03-27" "2024-03-28"
##  [56] "2024-03-28" "2024-03-29" "2024-03-29" "2024-03-30" "2024-03-30"
##  [61] "2024-03-31" "2024-03-31" "2024-04-01" "2024-04-01" "2024-04-02"
##  [66] "2024-04-02" "2024-04-03" "2024-04-03" "2024-04-04" "2024-04-04"
##  [71] "2024-04-05" "2024-04-05" "2024-04-06" "2024-04-06" "2024-04-07"
##  [76] "2024-04-07" "2024-04-08" "2024-04-08" "2024-04-09" "2024-04-09"
##  [81] "2024-04-10" "2024-04-10" "2024-04-11" "2024-04-11" "2024-04-12"
##  [86] "2024-04-12" "2024-04-13" "2024-04-13" "2024-04-14" "2024-04-14"
##  [91] "2024-04-15" "2024-04-15" "2024-04-16" "2024-04-16" "2024-04-17"
##  [96] "2024-04-17" "2024-04-18" "2024-04-18" "2024-04-19" "2024-04-19"

3.6 menangani nilai yang hilang

kali ini saya menggunakan nilai median sebagai acuannya.

miss <- data_pelanggan3%>%
  mutate_all(~ifelse(is.na(.), median(., na.rm = TRUE), .))
miss <- miss %>%
  mutate(across(where(is.numeric), ~round(., digits = 2)))
miss
##    id_pelanggan nama_pelanggan    alamat nomor_telepon
## 1             1    Pelanggan 1  Alamat 1         99999
## 2             2    Pelanggan 2  Alamat 2         99999
## 3             3    Pelanggan 3  Alamat 3         99999
## 4             4    Pelanggan 4  Alamat 4         99999
## 5             5    Pelanggan 5  Alamat 5         99999
## 6             6    Pelanggan 6  Alamat 6         99999
## 7             7    Pelanggan 7  Alamat 7        100000
## 8             8    Pelanggan 8  Alamat 8         99999
## 9             9    Pelanggan 9  Alamat 9         99999
## 10           10   Pelanggan 10 Alamat 10        100000
## 11           11   Pelanggan 11 Alamat 11         99999
## 12           12   Pelanggan 12 Alamat 12        100000
## 13           13   Pelanggan 13 Alamat 13        100000
## 14           14   Pelanggan 14 Alamat 14         99999
## 15           15   Pelanggan 15 Alamat 15         99999
## 16           16   Pelanggan 16 Alamat 16         99999
## 17           17   Pelanggan 17 Alamat 17         99999
## 18           18   Pelanggan 18 Alamat 18         99999
## 19           19   Pelanggan 19 Alamat 19        100000
## 20           20   Pelanggan 20 Alamat 20         99999
## 21           21   Pelanggan 21 Alamat 21        100000
## 22           22   Pelanggan 22 Alamat 22         99999
## 23           23   Pelanggan 23 Alamat 23         99999
## 24           24   Pelanggan 24 Alamat 24         99999
## 25           25   Pelanggan 25 Alamat 25        100000
## 26           26   Pelanggan 26 Alamat 26         99999
## 27           27   Pelanggan 27 Alamat 27         99999
## 28           28   Pelanggan 28 Alamat 28         99999
## 29           29   Pelanggan 29 Alamat 29         99999
## 30           30   Pelanggan 30 Alamat 30         99999
## 31           31   Pelanggan 31 Alamat 31         99999
## 32           32   Pelanggan 32 Alamat 32         99999
## 33           33   Pelanggan 33 Alamat 33         99999
## 34           34   Pelanggan 34 Alamat 34        100000
## 35           35   Pelanggan 35 Alamat 35         99999
## 36           36   Pelanggan 36 Alamat 36         99999
## 37           37   Pelanggan 37 Alamat 37         99999
## 38           38   Pelanggan 38 Alamat 38         99999
## 39           39   Pelanggan 39 Alamat 39         99999
## 40           40   Pelanggan 40 Alamat 40         99999
## 41           41   Pelanggan 41 Alamat 41        100000
## 42           42   Pelanggan 42 Alamat 42        100000
## 43           43   Pelanggan 43 Alamat 43        100000
## 44           44   Pelanggan 44 Alamat 44         99999
## 45           45   Pelanggan 45 Alamat 45        100000
## 46           46   Pelanggan 46 Alamat 46         99999
## 47           47   Pelanggan 47 Alamat 47         99999
## 48           48   Pelanggan 48 Alamat 48        100000
## 49           49   Pelanggan 49 Alamat 49        100000
## 50           50   Pelanggan 50 Alamat 50         99999