Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang
Fakultas : Sains dan Teknologi
Program Studi : Teknik Informatika
Mata Kuliah : Linear Algebra (C)
Untuk mengetehui tentang manipulasi data maka kita tinjau dulu dari pengertian Manipulasi itu sendiri. Manipulasi adalah sebuah proses rekayasa yang secara disengaja dengan melakukan penambahan, penyembunyian, penghilangan atau pengkaburan terhadap bagian atau keseluruhan sebuah sumber informasi, subtansi, realitas, kenyataan, fakta-fakta, data ataupun sejarah yang dibuat berdasarkan sistem perancangan yang bisa dilakukan secara individu, kelompok atau sebuah tata sistem nilai. Sehingga dapat diartikan manipulasi data adalah sebuah istilah tentang penggambaran dari proses pengubahan struktur data supaya jadi lebih mudah dibaca dan lebih terorganisir.
Manipulasi adalah bagian penting dari suatu tujuan tertentu dalam hal tindakan penanaman gagasan, dogma, doktrinisme, sikap, sistem berpikir, perilaku dan kepercayaan tertentu.
Salah satu cara memanipulasi data adalah dengan package “dplyr” pada software R.
dplyr dan tidyverse pada software RDisini saya mangambil data dari excel, dimana datanya berisikan Inflow uang kartal dari wilayah Jawa. Data uang kartal inflow wilayah Jawa ini bisa didapat melalui web Bank Indonesia. Inflow merupakan uang yang masuk ke BI melalui kegiatan penyetoran. Data yang saya ambil adalah per-Tahun mulai dari tahun 2011-2021
Berikut contoh proses me-Manipulasi Data Uang Kartal Inflow di wilayah Jawa :
library(readxl)
## Warning: package 'readxl' was built under R version 4.1.3
InJawa <- read_excel("InJawa.xlsx")
InJawa
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## Warning: package 'ggplot2' was built under R version 4.1.3
## Warning: package 'tibble' was built under R version 4.1.3
## Warning: package 'tidyr' was built under R version 4.1.3
## Warning: package 'readr' was built under R version 4.1.3
## Warning: package 'purrr' was built under R version 4.1.3
## Warning: package 'dplyr' was built under R version 4.1.3
## Warning: package 'forcats' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
Jawa2020 <- select(InJawa, '2020')
Jawa2020
library(tidyverse)
Jawanon2020 <- select(InJawa, -'2020')
Jawanon2020
Jawa2021 <- InJawa %>% select('2021')
Jawa2021
library(dplyr)
Jawatahun <- InJawa %>% rename('2022' = '2021')
head(Jawatahun)
library(dplyr)
Jawa_Timur <- InJawa %>%
filter(Provinsi == 'Jawa Timur') %>%
select('2014','2015')
Jawa_Timur
library(dplyr)
Jawaup1 <- InJawa %>%
filter(Provinsi == 'Jawa Timur', Provinsi == 'Jawa Barat') %>%
select('2014','2015')
Jawaup1
str(InJawa)
## tibble [4 x 12] (S3: tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:4] "Jawa Barat" "Jawa Tengah" "Yogyakarta" "Jawa Timur"
## $ 2011 : num [1:4] 43775 35137 6490 38515
## $ 2012 : num [1:4] 60629 43298 9173 47383
## $ 2013 : num [1:4] 35190 42182 8939 48687
## $ 2014 : num [1:4] 78660 60476 13890 64276
## $ 2015 : num [1:4] 81303 65198 14831 68808
## $ 2016 : num [1:4] 88036 72782 17350 83439
## $ 2017 : num [1:4] 83220 77031 17483 98380
## $ 2018 : num [1:4] 87243 87829 20574 106433
## $ 2019 : num [1:4] 94846 90751 20899 113651
## $ 2020 : num [1:4] 76883 84970 7348 86848
## $ 2021 : num [1:4] 57295 62024 6714 58986
str(InJawa %>% group_by(Provinsi))
## grouped_df [4 x 12] (S3: grouped_df/tbl_df/tbl/data.frame)
## $ Provinsi: chr [1:4] "Jawa Barat" "Jawa Tengah" "Yogyakarta" "Jawa Timur"
## $ 2011 : num [1:4] 43775 35137 6490 38515
## $ 2012 : num [1:4] 60629 43298 9173 47383
## $ 2013 : num [1:4] 35190 42182 8939 48687
## $ 2014 : num [1:4] 78660 60476 13890 64276
## $ 2015 : num [1:4] 81303 65198 14831 68808
## $ 2016 : num [1:4] 88036 72782 17350 83439
## $ 2017 : num [1:4] 83220 77031 17483 98380
## $ 2018 : num [1:4] 87243 87829 20574 106433
## $ 2019 : num [1:4] 94846 90751 20899 113651
## $ 2020 : num [1:4] 76883 84970 7348 86848
## $ 2021 : num [1:4] 57295 62024 6714 58986
## - attr(*, "groups")= tibble [4 x 2] (S3: tbl_df/tbl/data.frame)
## ..$ Provinsi: chr [1:4] "Jawa Barat" "Jawa Tengah" "Jawa Timur" "Yogyakarta"
## ..$ .rows : list<int> [1:4]
## .. ..$ : int 1
## .. ..$ : int 2
## .. ..$ : int 4
## .. ..$ : int 3
## .. ..@ ptype: int(0)
## ..- attr(*, ".drop")= logi TRUE
Jawaup5 <- InJawa %>%
group_by(Provinsi)
Jawaup5
InJawa %>%
filter(Provinsi == 'Jawa Tengah') %>%
count('2011', sort = TRUE)
JWacehup1 <- InJawa %>%
mutate('2010' = InJawa$'2011'/2)
JWacehup1
ggplot(data = InJawa, mapping = aes(x = Provinsi, y = `2011`)) +
geom_point()
ggplot(data = InJawa, mapping = aes(x = Provinsi, y = `2011`, color=`2011`)) +
geom_point()
ggplot(data = InJawa)+
geom_point(mapping = aes(x = Provinsi, y = `2012`, color=`2012`))
ggplot(data = InJawa)+
geom_point(mapping = aes(x = Provinsi, y = `2013`, color=`2013`))
ggplot(data = InJawa, mapping = aes(x = Provinsi, y = `2011`+`2012`, color=`2012`+ `2013`)) +
geom_point()