Dosen Pengampu : Prof. Dr. Suhartono, M.Kom
Mata Kuliah : Linear Algebra
Prodi : Teknik Informatika
Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang”
Manipulasi data adalah proses pengolahan data agar lebih mudah di baca atau terorganisir menjadi informasi yang lebih berguna, berupa menambah (append), menghapus (delete), mengganti (update), menyisip (insert), menarik informasi tertentu (query).
library(readxl)
dataoutflowsumatera <- read_excel(path = "C:/Users/DELL LATITUDE 7280/Documents/KULIAH/SEMESTER 2/LINEAR ALGEBRA/Manipulasi Data/outflowsumatera.xlsx")
dataoutflowsumatera
## # A tibble: 11 x 12
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatera 80092. 85235. 1.03e5 1.02e5 1.09e5 1.22e5 1.34e5 1.36e5 1.53e5
## 2 Aceh 6338. 6378. 2.33e4 8.63e3 9.64e3 1.13e4 1.18e4 1.14e4 1.31e4
## 3 Sumatera Utara 22176. 22495. 1.92e4 2.64e4 2.79e4 3.20e4 3.52e4 3.69e4 4.41e4
## 4 Sumatera Barat 5300. 6434. 6.51e3 7.06e3 7.47e3 9.20e3 1.08e4 8.45e3 9.46e3
## 5 Riau 12434. 13014. 1.55e4 1.52e4 1.58e4 1.76e4 1.81e4 1.79e4 1.93e4
## 6 Kep. Riau 5819. 6966. 8.75e3 1.01e4 9.80e3 1.01e4 1.07e4 1.26e4 1.26e4
## 7 Jambi 5217. 5013. 6.30e3 8.36e3 8.32e3 7.77e3 8.43e3 8.46e3 9.20e3
## 8 Sumatera Sela~ 14524. 15600. 1.27e4 1.34e4 1.35e4 1.58e4 1.70e4 1.79e4 1.91e4
## 9 Bengkulu 2561. 2959. 6.49e3 4.58e3 4.85e3 5.16e3 5.45e3 5.50e3 6.84e3
## 10 Lampung 5724. 6376. 4.57e3 8.34e3 9.95e3 1.04e4 1.34e4 1.37e4 1.56e4
## 11 Kep. Bangka B~ 0 0 0 3.22e2 2.00e3 2.68e3 2.75e3 2.74e3 4.17e3
## # ... with 2 more variables: `2020` <dbl>, `2021` <dbl>
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
sumatera1 <- select(dataoutflowsumatera,'Provinsi', '2021')
sumatera1
## # A tibble: 11 x 2
## Provinsi `2021`
## <chr> <dbl>
## 1 Sumatera 86627.
## 2 Aceh 5770.
## 3 Sumatera Utara 23453.
## 4 Sumatera Barat 5941.
## 5 Riau 12631.
## 6 Kep. Riau 5128.
## 7 Jambi 6046.
## 8 Sumatera Selatan 11436.
## 9 Bengkulu 4681.
## 10 Lampung 8050.
## 11 Kep. Bangka Belitung 3493.
sumatera2 <- select(dataoutflowsumatera, -'2021')
sumatera2
## # A tibble: 11 x 11
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatera 80092. 85235. 1.03e5 1.02e5 1.09e5 1.22e5 1.34e5 1.36e5 1.53e5
## 2 Aceh 6338. 6378. 2.33e4 8.63e3 9.64e3 1.13e4 1.18e4 1.14e4 1.31e4
## 3 Sumatera Utara 22176. 22495. 1.92e4 2.64e4 2.79e4 3.20e4 3.52e4 3.69e4 4.41e4
## 4 Sumatera Barat 5300. 6434. 6.51e3 7.06e3 7.47e3 9.20e3 1.08e4 8.45e3 9.46e3
## 5 Riau 12434. 13014. 1.55e4 1.52e4 1.58e4 1.76e4 1.81e4 1.79e4 1.93e4
## 6 Kep. Riau 5819. 6966. 8.75e3 1.01e4 9.80e3 1.01e4 1.07e4 1.26e4 1.26e4
## 7 Jambi 5217. 5013. 6.30e3 8.36e3 8.32e3 7.77e3 8.43e3 8.46e3 9.20e3
## 8 Sumatera Sela~ 14524. 15600. 1.27e4 1.34e4 1.35e4 1.58e4 1.70e4 1.79e4 1.91e4
## 9 Bengkulu 2561. 2959. 6.49e3 4.58e3 4.85e3 5.16e3 5.45e3 5.50e3 6.84e3
## 10 Lampung 5724. 6376. 4.57e3 8.34e3 9.95e3 1.04e4 1.34e4 1.37e4 1.56e4
## 11 Kep. Bangka B~ 0 0 0 3.22e2 2.00e3 2.68e3 2.75e3 2.74e3 4.17e3
## # ... with 1 more variable: `2020` <dbl>
sumatera3 <- dataoutflowsumatera %>% select('Provinsi' , '2019' , '2020' , '2021')
sumatera3
## # A tibble: 11 x 4
## Provinsi `2019` `2020` `2021`
## <chr> <dbl> <dbl> <dbl>
## 1 Sumatera 153484. 140589. 86627.
## 2 Aceh 13087. 12874. 5770.
## 3 Sumatera Utara 44051. 39758. 23453.
## 4 Sumatera Barat 9465. 8763. 5941.
## 5 Riau 19277. 19139. 12631.
## 6 Kep. Riau 12644. 8461. 5128.
## 7 Jambi 9204. 8950. 6046.
## 8 Sumatera Selatan 19121. 18309. 11436.
## 9 Bengkulu 6842. 6564. 4681.
## 10 Lampung 15626. 13873. 8050.
## 11 Kep. Bangka Belitung 4167. 3899. 3493.
sumatera4 <- dataoutflowsumatera %>% rename('Tahun 2013' = '2013')
head(sumatera4)
## # A tibble: 6 x 12
## Provinsi `2011` `2012` `Tahun 2013` `2014` `2015` `2016` `2017` `2018` `2019`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatera 80092. 85235. 103288. 1.02e5 1.09e5 1.22e5 1.34e5 1.36e5 1.53e5
## 2 Aceh 6338. 6378. 23278. 8.63e3 9.64e3 1.13e4 1.18e4 1.14e4 1.31e4
## 3 Sumatera~ 22176. 22495. 19235. 2.64e4 2.79e4 3.20e4 3.52e4 3.69e4 4.41e4
## 4 Sumatera~ 5300. 6434. 6511. 7.06e3 7.47e3 9.20e3 1.08e4 8.45e3 9.46e3
## 5 Riau 12434. 13014. 15460. 1.52e4 1.58e4 1.76e4 1.81e4 1.79e4 1.93e4
## 6 Kep. Riau 5819. 6966. 8747. 1.01e4 9.80e3 1.01e4 1.07e4 1.26e4 1.26e4
## # ... with 2 more variables: `2020` <dbl>, `2021` <dbl>
sumatera5 <- dataoutflowsumatera %>%
filter(Provinsi == 'Sumatera Utara') %>%
select( 'Provinsi', '2020', '2021')
sumatera5
## # A tibble: 1 x 3
## Provinsi `2020` `2021`
## <chr> <dbl> <dbl>
## 1 Sumatera Utara 39758. 23453.
str(dataoutflowsumatera)
## tibble [11 x 12] (S3: tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:11] "Sumatera" "Aceh" "Sumatera Utara" "Sumatera Barat" ...
## $ 2011 : num [1:11] 80092 6338 22176 5300 12434 ...
## $ 2012 : num [1:11] 85235 6378 22495 6434 13014 ...
## $ 2013 : num [1:11] 103288 23278 19235 6511 15460 ...
## $ 2014 : num [1:11] 102338 8630 26391 7060 15158 ...
## $ 2015 : num [1:11] 109186 9637 27877 7471 15789 ...
## $ 2016 : num [1:11] 121992 11311 31959 9198 17645 ...
## $ 2017 : num [1:11] 133606 11760 35243 10754 18128 ...
## $ 2018 : num [1:11] 135676 11450 36908 8447 17926 ...
## $ 2019 : num [1:11] 153484 13087 44051 9465 19277 ...
## $ 2020 : num [1:11] 140589 12874 39758 8763 19139 ...
## $ 2021 : num [1:11] 86627 5770 23453 5941 12631 ...
str(dataoutflowsumatera %>% group_by(Provinsi))
## grouped_df [11 x 12] (S3: grouped_df/tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:11] "Sumatera" "Aceh" "Sumatera Utara" "Sumatera Barat" ...
## $ 2011 : num [1:11] 80092 6338 22176 5300 12434 ...
## $ 2012 : num [1:11] 85235 6378 22495 6434 13014 ...
## $ 2013 : num [1:11] 103288 23278 19235 6511 15460 ...
## $ 2014 : num [1:11] 102338 8630 26391 7060 15158 ...
## $ 2015 : num [1:11] 109186 9637 27877 7471 15789 ...
## $ 2016 : num [1:11] 121992 11311 31959 9198 17645 ...
## $ 2017 : num [1:11] 133606 11760 35243 10754 18128 ...
## $ 2018 : num [1:11] 135676 11450 36908 8447 17926 ...
## $ 2019 : num [1:11] 153484 13087 44051 9465 19277 ...
## $ 2020 : num [1:11] 140589 12874 39758 8763 19139 ...
## $ 2021 : num [1:11] 86627 5770 23453 5941 12631 ...
## - attr(*, "groups")= tibble [11 x 2] (S3: tbl_df/tbl/data.frame)
## ..$ Provinsi: chr [1:11] "Aceh" "Bengkulu" "Jambi" "Kep. Bangka Belitung" ...
## ..$ .rows : list<int> [1:11]
## .. ..$ : int 2
## .. ..$ : int 9
## .. ..$ : int 7
## .. ..$ : int 11
## .. ..$ : int 6
## .. ..$ : int 10
## .. ..$ : int 5
## .. ..$ : int 1
## .. ..$ : int 4
## .. ..$ : int 8
## .. ..$ : int 3
## .. ..@ ptype: int(0)
## ..- attr(*, ".drop")= logi TRUE
sumatera6 <- dataoutflowsumatera %>%
group_by(Provinsi)
sumatera6
## # A tibble: 11 x 12
## # Groups: Provinsi [11]
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatera 80092. 85235. 1.03e5 1.02e5 1.09e5 1.22e5 1.34e5 1.36e5 1.53e5
## 2 Aceh 6338. 6378. 2.33e4 8.63e3 9.64e3 1.13e4 1.18e4 1.14e4 1.31e4
## 3 Sumatera Utara 22176. 22495. 1.92e4 2.64e4 2.79e4 3.20e4 3.52e4 3.69e4 4.41e4
## 4 Sumatera Barat 5300. 6434. 6.51e3 7.06e3 7.47e3 9.20e3 1.08e4 8.45e3 9.46e3
## 5 Riau 12434. 13014. 1.55e4 1.52e4 1.58e4 1.76e4 1.81e4 1.79e4 1.93e4
## 6 Kep. Riau 5819. 6966. 8.75e3 1.01e4 9.80e3 1.01e4 1.07e4 1.26e4 1.26e4
## 7 Jambi 5217. 5013. 6.30e3 8.36e3 8.32e3 7.77e3 8.43e3 8.46e3 9.20e3
## 8 Sumatera Sela~ 14524. 15600. 1.27e4 1.34e4 1.35e4 1.58e4 1.70e4 1.79e4 1.91e4
## 9 Bengkulu 2561. 2959. 6.49e3 4.58e3 4.85e3 5.16e3 5.45e3 5.50e3 6.84e3
## 10 Lampung 5724. 6376. 4.57e3 8.34e3 9.95e3 1.04e4 1.34e4 1.37e4 1.56e4
## 11 Kep. Bangka B~ 0 0 0 3.22e2 2.00e3 2.68e3 2.75e3 2.74e3 4.17e3
## # ... with 2 more variables: `2020` <dbl>, `2021` <dbl>
dataoutflowsumatera %>%
filter(Provinsi == 'Bengkulu') %>%
count('2016', sort = TRUE)
## # A tibble: 1 x 2
## `"2016"` n
## <chr> <int>
## 1 2016 1
sumatera7 <- dataoutflowsumatera %>%
mutate('2011' = dataoutflowsumatera$`2014`/2)
sumatera7
## # A tibble: 11 x 12
## Provinsi `2011` `2012` `2013` `2014` `2015` `2016` `2017` `2018` `2019`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatera 51169. 85235. 1.03e5 1.02e5 1.09e5 1.22e5 1.34e5 1.36e5 1.53e5
## 2 Aceh 4315. 6378. 2.33e4 8.63e3 9.64e3 1.13e4 1.18e4 1.14e4 1.31e4
## 3 Sumatera Utara 13195. 22495. 1.92e4 2.64e4 2.79e4 3.20e4 3.52e4 3.69e4 4.41e4
## 4 Sumatera Barat 3530. 6434. 6.51e3 7.06e3 7.47e3 9.20e3 1.08e4 8.45e3 9.46e3
## 5 Riau 7579. 13014. 1.55e4 1.52e4 1.58e4 1.76e4 1.81e4 1.79e4 1.93e4
## 6 Kep. Riau 5061. 6966. 8.75e3 1.01e4 9.80e3 1.01e4 1.07e4 1.26e4 1.26e4
## 7 Jambi 4181. 5013. 6.30e3 8.36e3 8.32e3 7.77e3 8.43e3 8.46e3 9.20e3
## 8 Sumatera Sela~ 6686. 15600. 1.27e4 1.34e4 1.35e4 1.58e4 1.70e4 1.79e4 1.91e4
## 9 Bengkulu 2291. 2959. 6.49e3 4.58e3 4.85e3 5.16e3 5.45e3 5.50e3 6.84e3
## 10 Lampung 4170. 6376. 4.57e3 8.34e3 9.95e3 1.04e4 1.34e4 1.37e4 1.56e4
## 11 Kep. Bangka B~ 161. 0 0 3.22e2 2.00e3 2.68e3 2.75e3 2.74e3 4.17e3
## # ... with 2 more variables: `2020` <dbl>, `2021` <dbl>
ggplot(data = dataoutflowsumatera, mapping = aes(Provinsi, `2021`, color = Provinsi)) +
geom_point()