Jurusan: Teknik Informatika
Lembaga: Universitas Islam Negeri Maulana Malik Ibrahim Malang
Manipulasi data, manipulasi data dapat diartikan sebagai proses perubahan data sesuai dengan aturan yang kita terapkan. Manfaat manipulasi data dapat kita gunakan untuk melakukan prediksi data. Dengan adanya prediksi tersebut kita dapat membuat rencana untuk mencegah hal-hal yang tidak kita inginkan.Berikut ini merupakan contoh penerapan manipulasi data inflow uang kartal di Pulau Kalimantan
library(readxl)
## Warning: package 'readxl' was built under R version 4.1.2
outflowkalimantan <- read_excel(path = "outflowkalimantan.xlsx")
outflowkalimantan
## # A tibble: 5 x 12
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019` `2020`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kaliman~ 5221. 5698. 6011. 6764. 8486. 9402. 11132. 12278. 13768. 13501.
## 2 Kaliman~ 6850. 7741. 15421. 8346. 10190. 10131. 11695. 13040. 12891. 12518.
## 3 Kaliman~ 5126. 5580. 5046. 6265. 6755. 7424. 9544. 8476. 9228. 8222.
## 4 Kaliman~ 12337. 14426. 18451. 17398. 16514. 15221. 16525. 17724. 18596. 14993.
## 5 Kaliman~ 0 0 0 0 0 0 1507. 2471. 3096. 2826.
## # ... with 1 more variable: 2021 <dbl>
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.2
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.8
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 2.0.1 v forcats 0.5.1
## Warning: package 'dplyr' was built under R version 4.1.2
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
kalimantan1 <- select(outflowkalimantan,'Provinsi', '2018')
kalimantan1
## # A tibble: 5 x 2
## Provinsi `2018`
## <chr> <dbl>
## 1 Kalimantan Barat 12278.
## 2 Kalimantan Tengah 13040.
## 3 Kalimantan Selatan 8476.
## 4 Kalimantan Timur 17724.
## 5 Kalimantan Utara 2471.
kalimantan2 <- select(outflowkalimantan, -'2012')
kalimantan2
## # A tibble: 5 x 11
## Provinsi `2011` `2013` `2014` `2015` `2016` `2017` `2018` `2019` `2020` `2021`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kaliman~ 5221. 6011. 6764. 8486. 9402. 11132. 12278. 13768. 13501. 6958.
## 2 Kaliman~ 6850. 15421. 8346. 10190. 10131. 11695. 13040. 12891. 12518. 7071.
## 3 Kaliman~ 5126. 5046. 6265. 6755. 7424. 9544. 8476. 9228. 8222. 5192.
## 4 Kaliman~ 12337. 18451. 17398. 16514. 15221. 16525. 17724. 18596. 14993. 9110.
## 5 Kaliman~ 0 0 0 0 0 1507. 2471. 3096. 2826. 1960.
kalimantan3 <- outflowkalimantan %>% select('Provinsi', '2014', '2015', '2016' , '2017' , '2018')
kalimantan3
## # A tibble: 5 x 6
## Provinsi `2014` `2015` `2016` `2017` `2018`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kalimantan Barat 6764. 8486. 9402. 11132. 12278.
## 2 Kalimantan Tengah 8346. 10190. 10131. 11695. 13040.
## 3 Kalimantan Selatan 6265. 6755. 7424. 9544. 8476.
## 4 Kalimantan Timur 17398. 16514. 15221. 16525. 17724.
## 5 Kalimantan Utara 0 0 0 1507. 2471.
kalimantan4 <- outflowkalimantan %>% rename('Tahun 2011' = '2011' , 'Tahun 2012' = '2012' , 'Tahun 2013' = '2013' , 'Tahun 2014' = '2014' , 'Tahun 2015' = '2015' , 'Tahun 2016' = '2016' , 'Tahun 2017' = '2017' , 'Tahun 2018' = '2018' , 'Tahun 2019' = '2019' , 'Tahun 2020' = '2020' , 'Tahun 2021' = '2021')
head(kalimantan4)
## # A tibble: 5 x 12
## Provinsi `Tahun 2011` `Tahun 2012` `Tahun 2013` `Tahun 2014` `Tahun 2015`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kalimantan B~ 5221. 5698. 6011. 6764. 8486.
## 2 Kalimantan T~ 6850. 7741. 15421. 8346. 10190.
## 3 Kalimantan S~ 5126. 5580. 5046. 6265. 6755.
## 4 Kalimantan T~ 12337. 14426. 18451. 17398. 16514.
## 5 Kalimantan U~ 0 0 0 0 0
## # ... with 6 more variables: Tahun 2016 <dbl>, Tahun 2017 <dbl>,
## # Tahun 2018 <dbl>, Tahun 2019 <dbl>, Tahun 2020 <dbl>, Tahun 2021 <dbl>
kalimantan5 <- outflowkalimantan %>%
filter(Provinsi == 'Kalimantan Utara') %>%
select( 'Provinsi', '2015','2016', '2017','2018', '2019', '2020')
kalimantan5
## # A tibble: 1 x 7
## Provinsi `2015` `2016` `2017` `2018` `2019` `2020`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kalimantan Utara 0 0 1507. 2471. 3096. 2826.
str(outflowkalimantan)
## tibble [5 x 12] (S3: tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:5] "Kalimantan Barat" "Kalimantan Tengah" "Kalimantan Selatan" "Kalimantan Timur" ...
## $ 2011 : num [1:5] 5221 6850 5126 12337 0
## $ 2012 : num [1:5] 5698 7741 5580 14426 0
## $ 2013 : num [1:5] 6011 15421 5046 18451 0
## $ 2014 : num [1:5] 6764 8346 6265 17398 0
## $ 2015 : num [1:5] 8486 10190 6755 16514 0
## $ 2016 : num [1:5] 9402 10131 7424 15221 0
## $ 2017 : num [1:5] 11132 11695 9544 16525 1507
## $ 2018 : num [1:5] 12278 13040 8476 17724 2471
## $ 2019 : num [1:5] 13768 12891 9228 18596 3096
## $ 2020 : num [1:5] 13501 12518 8222 14993 2826
## $ 2021 : num [1:5] 6958 7071 5192 9110 1960
str(outflowkalimantan %>% group_by(Provinsi))
## grouped_df [5 x 12] (S3: grouped_df/tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:5] "Kalimantan Barat" "Kalimantan Tengah" "Kalimantan Selatan" "Kalimantan Timur" ...
## $ 2011 : num [1:5] 5221 6850 5126 12337 0
## $ 2012 : num [1:5] 5698 7741 5580 14426 0
## $ 2013 : num [1:5] 6011 15421 5046 18451 0
## $ 2014 : num [1:5] 6764 8346 6265 17398 0
## $ 2015 : num [1:5] 8486 10190 6755 16514 0
## $ 2016 : num [1:5] 9402 10131 7424 15221 0
## $ 2017 : num [1:5] 11132 11695 9544 16525 1507
## $ 2018 : num [1:5] 12278 13040 8476 17724 2471
## $ 2019 : num [1:5] 13768 12891 9228 18596 3096
## $ 2020 : num [1:5] 13501 12518 8222 14993 2826
## $ 2021 : num [1:5] 6958 7071 5192 9110 1960
## - attr(*, "groups")= tibble [5 x 2] (S3: tbl_df/tbl/data.frame)
## ..$ Provinsi: chr [1:5] "Kalimantan Barat" "Kalimantan Selatan" "Kalimantan Tengah" "Kalimantan Timur" ...
## ..$ .rows : list<int> [1:5]
## .. ..$ : int 1
## .. ..$ : int 3
## .. ..$ : int 2
## .. ..$ : int 4
## .. ..$ : int 5
## .. ..@ ptype: int(0)
## ..- attr(*, ".drop")= logi TRUE
kalimantan6 <- outflowkalimantan %>%
group_by(Provinsi)
kalimantan6
## # A tibble: 5 x 12
## # Groups: Provinsi [5]
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019` `2020`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kaliman~ 5221. 5698. 6011. 6764. 8486. 9402. 11132. 12278. 13768. 13501.
## 2 Kaliman~ 6850. 7741. 15421. 8346. 10190. 10131. 11695. 13040. 12891. 12518.
## 3 Kaliman~ 5126. 5580. 5046. 6265. 6755. 7424. 9544. 8476. 9228. 8222.
## 4 Kaliman~ 12337. 14426. 18451. 17398. 16514. 15221. 16525. 17724. 18596. 14993.
## 5 Kaliman~ 0 0 0 0 0 0 1507. 2471. 3096. 2826.
## # ... with 1 more variable: 2021 <dbl>
outflowkalimantan %>%
filter(Provinsi == 'Kalimantan Utara') %>%
count('2020', sort = TRUE)
## # A tibble: 1 x 2
## `"2020"` n
## <chr> <int>
## 1 2020 1
kalimantan7 <- outflowkalimantan %>%
mutate('2017' = outflowkalimantan$`2017`/2)
kalimantan7
## # A tibble: 5 x 12
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019` `2020`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kaliman~ 5221. 5698. 6011. 6764. 8486. 9402. 5566. 12278. 13768. 13501.
## 2 Kaliman~ 6850. 7741. 15421. 8346. 10190. 10131. 5848. 13040. 12891. 12518.
## 3 Kaliman~ 5126. 5580. 5046. 6265. 6755. 7424. 4772. 8476. 9228. 8222.
## 4 Kaliman~ 12337. 14426. 18451. 17398. 16514. 15221. 8262. 17724. 18596. 14993.
## 5 Kaliman~ 0 0 0 0 0 0 754. 2471. 3096. 2826.
## # ... with 1 more variable: 2021 <dbl>
ggplot(data = outflowkalimantan, mapping = aes(x = Provinsi, y = `2020`)) +
geom_point()