Introduction to Data Science

TUGAS 1

Email             :
RPubs            : https://rpubs.com/Calvinriswandy/
Jurusan          : Statistika
Address         : ARA Center, Matana University Tower
                         Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.


Saat ini ingin melakukan import data, membuat dan mengorganize menggunakan filter, select, arrange, slice, dan melakukan visualisasi menggunakan bar plot dari ggplot

Import data

library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.2
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.4     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   2.0.1     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
pacman ::p_load(readxl, writexl)
hal <- read.csv("C:/Users/5/Documents/Semester2/Input/covid19.csv")

hal

Pick a Category

hala = subset(hal, subset = Country.Region == "Australia")

hala

Organize

library(tidyverse)

Filter

Filter yang dalam bahasa Indonesia berarti suatu fungsi yang digunakan untuk menyaring data yang ingin kita ambil.Contohnya saya ingin mengambil data covid-19 di Province.State Vintoria.

Victor <- filter(hal, Province.State == "Victoria")

Victor

Lalu misalkan ingin mengambil data Date/tanggal yang terkena covid-19 setiap harinya di Australia.

Tanggal <- filter(hal, Date == "1/30/20")

Tanggal

jadi dengan memakai fungsi filter memudahkan kita untuk mencari data dengan mudah.

Select

perintah ini digunakan untuk menampilkan data lebih ringkas.Jadi, dengan perintah ini kita bisa menampilkan kolom apa saja yang kita inginkan dengan menggunakan library dplyr.

library(dplyr)

berikut adalah contoh penggunaannya :

select_hal <- select(hal, Province.State, Country.Region, Date, Confirmed)

select_hal

Arrage

fungsi ini berguna untuk pengurutan dari yang terkecil ke terbesar. Berikut contohnya :

arrange_hal <- arrange(select_hal, Confirmed)

arrange_hal

Slice

fungsi ini biasa digunakan untuk memotong data atau agar lebih dimengerti, misalnya bisa menampilkan data dari tanggal berapa sampai tanggal berapa.

slicetf <- slice(arrange_hal, 1:20)

slicetf

Visualisasi Data

lalu sekarang kita akan menvisualisasi data yang terpapar covid-19 dengan ggplot.

ggplot(hal, aes(Date, Confirmed)) +
  geom_bar(stat = "Identity",
           fill = "Red") +
  scale_x_discrete("Date") +
  scale_y_continuous("Confirmed") +
  theme(axis.text.x = element_text(angle = 1,vjust = 0.5)) +
  labs(title = "Confirmed in Country Region")

dari grafik bisa disimpulkan dari grafik orang-orang yang terkonfirmasi covid-19 naik setiap harinya dalam 1 tahun.