Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang
Fakultas : Sains dan Teknologi
Program Studi : Teknik Informatika
Manipulasi data merupakan salah satu proses untuk mengubah data menjadi lebih mudah untuk dibaca dan lebih terorganisir. Sebagai contoh para data analis dibidang sosial seperti akutansi atau sejenisnya sering menggunakan proses manipulasi untuk mengetahui harga dari sebuah produk, tren dari penjualan, hingga potensi kewajiban pajak.
library(readxl)
datainflowJawa <- read_excel(path = "DataInflowProvinsiJawaTahun2012.xlsx")
datainflowJawa
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
jawaFebruari <- select(datainflowJawa,'Provinsi', 'Februari')
jawaFebruari
jawanonFebruari <- select(datainflowJawa, -'Februari')
jawanonFebruari
jawaSepOk <- datainflowJawa %>% select('Provinsi', 'September', 'Oktober')
jawaSepOk
jawarename <- datainflowJawa %>% rename('Maret 2012' = 'Maret')
head(jawarename)
jawaTimur <- datainflowJawa %>%
filter(Provinsi == 'Jawa Timur') %>%
select( 'Provinsi', 'Januari','Februari', 'Maret',)
jawaTimur
jawaup1 <- datainflowJawa %>%
filter(Provinsi == 'Jawa Barat') %>%
select( 'Provinsi', 'Oktober', 'November','Desember')
jawaup1
str(datainflowJawa)
## tibble [7 x 13] (S3: tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:7] "DKI Jakarta" "Jawa" "Jawa Barat" "Jawa Tengah" ...
## $ Januari : num [1:7] 6829 17028 5873 4367 1237 ...
## $ Februari : num [1:7] 5358 12389 4426 3063 807 ...
## $ Maret : num [1:7] 4813 11157 4118 3054 735 ...
## $ April : num [1:7] 5689 10775 4003 2865 714 ...
## $ Mei : num [1:7] 5664 12898 5021 3164 862 ...
## $ Juni : num [1:7] 5549 10223 5048 1928 573 ...
## $ Juli : num [1:7] 6420 13210 5403 3096 765 ...
## $ Agustus : num [1:7] 11431 18788 6685 5539 1196 ...
## $ September: num [1:7] 7576 17882 6179 5723 564 ...
## $ Oktober : num [1:7] 6159 11599 4405 2918 983 ...
## $ November : num [1:7] 6705 15009 5583 4970 313 ...
## $ Desember : num [1:7] 4472 9525 3885 2611 423 ...
str(datainflowJawa %>% group_by(Provinsi))
## grouped_df [7 x 13] (S3: grouped_df/tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:7] "DKI Jakarta" "Jawa" "Jawa Barat" "Jawa Tengah" ...
## $ Januari : num [1:7] 6829 17028 5873 4367 1237 ...
## $ Februari : num [1:7] 5358 12389 4426 3063 807 ...
## $ Maret : num [1:7] 4813 11157 4118 3054 735 ...
## $ April : num [1:7] 5689 10775 4003 2865 714 ...
## $ Mei : num [1:7] 5664 12898 5021 3164 862 ...
## $ Juni : num [1:7] 5549 10223 5048 1928 573 ...
## $ Juli : num [1:7] 6420 13210 5403 3096 765 ...
## $ Agustus : num [1:7] 11431 18788 6685 5539 1196 ...
## $ September: num [1:7] 7576 17882 6179 5723 564 ...
## $ Oktober : num [1:7] 6159 11599 4405 2918 983 ...
## $ November : num [1:7] 6705 15009 5583 4970 313 ...
## $ Desember : num [1:7] 4472 9525 3885 2611 423 ...
## - attr(*, "groups")= tibble [7 x 2] (S3: tbl_df/tbl/data.frame)
## ..$ Provinsi: chr [1:7] "Banten" "DKI Jakarta" "Jawa" "Jawa Barat" ...
## ..$ .rows : list<int> [1:7]
## .. ..$ : int 7
## .. ..$ : int 1
## .. ..$ : int 2
## .. ..$ : int 3
## .. ..$ : int 4
## .. ..$ : int 6
## .. ..$ : int 5
## .. ..@ ptype: int(0)
## ..- attr(*, ".drop")= logi TRUE
jawaup3 <- datainflowJawa %>%
group_by(Provinsi)
jawaup3
datainflowJawa %>%
filter(Provinsi == 'Yogyakarta') %>%
count('Februari', sort = TRUE)
jawayogyakartaup1 <- datainflowJawa %>%
mutate('Januari' = datainflowJawa$'Februari'/2)
jawayogyakartaup1
ggplot(data = datainflowJawa, mapping = aes(x = Provinsi, y = `Februari`)) +
geom_point()