File ini berisi template untuk mejawab pertanyaan 5W+1H saat briefing Capstone Data Visualization sebagai langkah awal sebelum membuat Dashboard. Silakan Bapak/Ibu mengisi jawaban di bawah.

File ini tidak akan dinilai namun Bapak/Ibu WAJIB disubmit ke dalam classroom pada hari H briefing Capstone Data Visualization.

What

Tentukan tujuan atau informasi yang ingin ditampilkan dalam dashboard

Jawab

Saya ingin memperlihatkan peta persebaran covid - 19 di US antara akhir bulan Januari hingga Awal bulan September 2020. Informasi yang ingin ditunjukkan berupa total jumlah kasus yang terjadi di US berdasarkan negara bagian baik berupa kasus konfirmasi maupun total kematian yang disebabkan oleh Covid - 19 dan pergerakan tren penambahan kasus dari awal bulan Januari hingga akhir bulan September

Tujuan yang ingin dicapai atau informasi yang ingin disampaikan:

  • Untuk meningkatkan kewaspadaan terkait kasus Covid 19 di US
  • melihat keefektifan kebijakan yang telah dilakukan oleh pemerintah US (Apakah kasus bertambah atau berkurang)
  • Untuk mengetahui negara - negara bagian mana yang paling terdampak dengan kasus Covid 19

Who

Untuk siapa dashboard ini dibuat? Siapa target pembaca dari dashboard ini?

Jawab

  • Pemerintah US dan pembuat kebijakan penanggulangan terkait bencana covid 19, dashboard dapat digunakan sebagai tolak ukur pemerintah US terkait tingkat efektivitas penanggulangan bencana Covid 19 di US

Why

Apakah data yang dibuat relevan atau sesuai dengan tujuan? Mengapa?

Jawab

Data relevan dan sesuai dengan tujuan karena data diambil dari NY Times yang mengumpulkan angka kumulatif baik total kasus konfirmasi maupun kasus kematian akibat kasus covid 19 di tiap negara bagian baik dari pemerintahan negara bagian dan departemen kesehatan US dari awal pandemic muncul di US hingga awal September 2020. # When

Apakah data yang digunakan masih up to date atau masih relevan dengan kondisi sekarang? Apakah ada informasi tentang tanggal update terakhir dari data tersebut?

Jawab

Data yang digunakan up to date dan masih relevan dikarenakan pengumpulan yang diambil dari berbagai sumber dan rentang waktu yang jelas pada data tersebut (Awal Pandemic hingga tanggal 2 September)

How

Bagaimana Bapak/Ibu menggunakan visualisasi untuk menjawab tujuan yang telah disebutkan?

Buat plot yang akan dimasukkan ke dalam dashboard. Boleh dalam bentuk ggplot maupun plotly.

Jawab

Melakukan data wrangling

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
library(shiny)
library(shinydashboard)
## 
## Attaching package: 'shinydashboard'
## The following object is masked from 'package:graphics':
## 
##     box
library(plotly)
## Loading required package: ggplot2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(ggplot2)
library(DT)
## 
## Attaching package: 'DT'
## The following objects are masked from 'package:shiny':
## 
##     dataTableOutput, renderDataTable

Membaca Data

states <- read_csv("us-counties.csv")
## Parsed with column specification:
## cols(
##   date = col_date(format = ""),
##   county = col_character(),
##   state = col_character(),
##   fips = col_character(),
##   cases = col_double(),
##   deaths = col_double()
## )
glimpse(states)
## Rows: 495,663
## Columns: 6
## $ date   <date> 2020-01-21, 2020-01-22, 2020-01-23, 2020-01-24, 2020-01-24,...
## $ county <chr> "Snohomish", "Snohomish", "Snohomish", "Cook", "Snohomish", ...
## $ state  <chr> "Washington", "Washington", "Washington", "Illinois", "Washi...
## $ fips   <chr> "53061", "53061", "53061", "17031", "53061", "06059", "17031...
## $ cases  <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ deaths <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

Menghilangkan data NA

# Cek data NA

anyNA(states)
## [1] TRUE
colSums(is.na(states))
##   date county  state   fips  cases deaths 
##      0      0      0   4774      0      0
states <- states %>%
   select(date, state, cases, deaths)

states_agg <- states %>%
   group_by(state) %>%
   summarise("total case" = sum(cases),
             "total death" = sum(deaths)) %>%
   arrange(state)
## `summarise()` ungrouping output (override with `.groups` argument)

Plot untuk melihat jumlah total kasus di tiap negara bagian

# Plot Total Case by States

states_agg %>%
   head(10) %>%
   ggplot(aes(x = `total case`, y = reorder(state, `total case`))) +
   geom_col(aes(fill = `total case`)) 

Plot untuk melihat jumlah total kematian di tiap negara bagian

# Plot Total Death by States

states_agg %>%
   head(10) %>%
   ggplot(aes(x = `total death`, y = reorder(state, `total death`))) +
   geom_col(aes(fill = `total death`))

Plot berupa peta untuk melihat persebaran covid 19 di US

# Peta persebaran data covid 19 berdasarkan baik total death dan total case

Plot berupa tren pergerakan penambahan kasus sesuai dengan rentang waktu yang diinginkan di tiap negara

Where

Bagaimana desain layout atau tata letak dashboard yang akan dibuat?

Jawab

Contoh penulisan layout.

Tab atau halaman pertama

  • Bar Chart total case per negara menggunakan input select by state
  • Bar Chart total death per negara menggunakan input select by state

Tab atau halaman kedua

  • Maps menampilkan persebaran data covid 19 US
  • Ratio antara Jumlah kasus kematian dan kasus konfirmasi dapat dilihat per state

Tab atau halaman ketiga

  • Menampilkan data