Introduction to Data Science
TUGAS 1
Email          : calvin.riswandi@student.matanauniversity.ac.id
RPubs         : https://rpubs.com/Calvinriswandy/
Jurusan      : Statistika
Address     : ARA Center, Matana University Tower
             Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.
Saat ini ingin melakukan import data, membuat dan mengorganize menggunakan filter, select, arrange, slice, dan melakukan visualisasi menggunakan bar plot dari ggplot
Import data
library(tidyverse)## Warning: package 'tidyverse' was built under R version 4.1.2
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 2.0.1 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
pacman ::p_load(readxl, writexl)
hal <- read.csv("C:/Users/5/Documents/Semester2/Input/covid19.csv")
halPick a Category
hala = subset(hal, subset = Country.Region == "Australia")
halaOrganize
library(tidyverse)Filter
Filter yang dalam bahasa Indonesia berarti suatu fungsi yang digunakan untuk menyaring data yang ingin kita ambil.Contohnya saya ingin mengambil data covid-19 di Province.State Vintoria.
Victor <- filter(hal, Province.State == "Victoria")
VictorLalu misalkan ingin mengambil data Date/tanggal yang terkena covid-19 setiap harinya di Australia.
Tanggal <- filter(hal, Date == "1/30/20")
Tanggaljadi dengan memakai fungsi filter memudahkan kita untuk mencari data dengan mudah.
Select
perintah ini digunakan untuk menampilkan data lebih ringkas.Jadi, dengan perintah ini kita bisa menampilkan kolom apa saja yang kita inginkan dengan menggunakan library dplyr.
library(dplyr)berikut adalah contoh penggunaannya :
select_hal <- select(hal, Province.State, Country.Region, Date, Confirmed)
select_halArrage
fungsi ini berguna untuk pengurutan dari yang terkecil ke terbesar. Berikut contohnya :
arrange_hal <- arrange(select_hal, Confirmed)
arrange_halSlice
fungsi ini biasa digunakan untuk memotong data atau agar lebih dimengerti, misalnya bisa menampilkan data dari tanggal berapa sampai tanggal berapa.
slicetf <- slice(arrange_hal, 1:20)
slicetfVisualisasi Data
lalu sekarang kita akan menvisualisasi data yang terpapar covid-19 dengan ggplot.
ggplot(hal, aes(Date, Confirmed)) +
geom_bar(stat = "Identity",
fill = "Red") +
scale_x_discrete("Date") +
scale_y_continuous("Confirmed") +
theme(axis.text.x = element_text(angle = 1,vjust = 0.5)) +
labs(title = "Confirmed in Country Region")dari grafik bisa disimpulkan dari grafik orang-orang yang terkonfirmasi covid-19 naik setiap harinya dalam 1 tahun.