Tugas Visualisasi Data
Package
Package yang digunakan pada percobaan ini adalah:
library(knitr)
library(kableExtra)
library(tidyverse)
library(ggridges)
library(GGally)
library(plotly) # Untuk membuat plot interaktif
library(mosaicData) # Untuk dataset Data
Data yang digunakan pada percobaan ini adalah data Weather yang memiliki 25 kolom.
2016-2017 weather in several cities : merupakan data time series yang menggambarkan kondisi perkembangan cuaca pada beberapa kota yang dirinci menurut bulan dan hari pada tahun 2016-2017
mosaicData::Weather## # A tibble: 3,655 x 25
## city date year month day high_temp avg_temp low_temp high_dewpt
## <chr> <date> <dbl> <int> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Auck~ 2016-01-01 2016 1 1 68 65 62 64
## 2 Auck~ 2016-01-02 2016 1 2 68 66 64 64
## 3 Auck~ 2016-01-03 2016 1 3 77 72 66 70
## 4 Auck~ 2016-01-04 2016 1 4 73 66 60 66
## 5 Auck~ 2016-01-05 2016 1 5 69 62 55 55
## 6 Auck~ 2016-01-06 2016 1 6 69 63 57 54
## 7 Auck~ 2016-01-07 2016 1 7 71 66 60 59
## 8 Auck~ 2016-01-08 2016 1 8 77 70 64 72
## 9 Auck~ 2016-01-09 2016 1 9 69 66 64 68
## 10 Auck~ 2016-01-10 2016 1 10 71 66 62 63
## # ... with 3,645 more rows, and 16 more variables: avg_dewpt <dbl>,
## # low_dewpt <dbl>, high_humidity <dbl>, avg_humidity <dbl>,
## # low_humidity <dbl>, high_hg <dbl>, avg_hg <dbl>, low_hg <dbl>,
## # high_vis <dbl>, avg_vis <dbl>, low_vis <dbl>, high_wind <dbl>,
## # avg_wind <dbl>, low_wind <dbl>, precip <chr>, events <chr>
kbl(head(Weather,20), caption = "Data Weather") %>% kable_styling() %>% scroll_box(height = "300px")| city | date | year | month | day | high_temp | avg_temp | low_temp | high_dewpt | avg_dewpt | low_dewpt | high_humidity | avg_humidity | low_humidity | high_hg | avg_hg | low_hg | high_vis | avg_vis | low_vis | high_wind | avg_wind | low_wind | precip | events |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Auckland | 2016-01-01 | 2016 | 1 | 1 | 68 | 65 | 62 | 64 | 60 | 55 | 100 | 82 | 68 | 30.15 | 30.09 | 30.01 | 6 | 6 | 4 | 21 | 15 | 28 | 0 | Rain |
| Auckland | 2016-01-02 | 2016 | 1 | 2 | 68 | 66 | 64 | 64 | 63 | 61 | 100 | 94 | 88 | 30.04 | 29.90 | 29.80 | 6 | 5 | 1 | 33 | 21 | 46 | 0 | Rain |
| Auckland | 2016-01-03 | 2016 | 1 | 3 | 77 | 72 | 66 | 70 | 67 | 64 | 100 | 91 | 74 | 29.80 | 29.73 | 29.68 | 6 | 6 | 1 | 18 | 12 | NA | 0 | Rain |
| Auckland | 2016-01-04 | 2016 | 1 | 4 | 73 | 66 | 60 | 66 | 60 | 54 | 100 | 76 | 53 | 30.12 | 29.90 | 29.77 | 6 | 6 | 6 | 15 | 10 | NA | 0 | Rain |
| Auckland | 2016-01-05 | 2016 | 1 | 5 | 69 | 62 | 55 | 55 | 52 | 48 | 82 | 69 | 56 | 30.21 | 30.14 | 30.09 | 6 | 6 | 6 | 13 | 7 | NA | 0 | NA |
| Auckland | 2016-01-06 | 2016 | 1 | 6 | 69 | 63 | 57 | 54 | 51 | 46 | 88 | 65 | 46 | 30.24 | 30.22 | 30.18 | 6 | 6 | 6 | 17 | 8 | 28 | 0 | NA |
| Auckland | 2016-01-07 | 2016 | 1 | 7 | 71 | 66 | 60 | 59 | 54 | 50 | 83 | 65 | 53 | 30.24 | 30.13 | 30.04 | 6 | 6 | 6 | 22 | 12 | 25 | 0 | Rain |
| Auckland | 2016-01-08 | 2016 | 1 | 8 | 77 | 70 | 64 | 72 | 67 | 59 | 100 | 92 | 83 | 30.01 | 29.79 | 29.62 | 6 | 6 | 2 | 21 | 14 | 28 | 0 | Rain |
| Auckland | 2016-01-09 | 2016 | 1 | 9 | 69 | 66 | 64 | 68 | 61 | 55 | 100 | 81 | 64 | 29.86 | 29.76 | 29.65 | 6 | 6 | 4 | 18 | 11 | 29 | 0 | Rain |
| Auckland | 2016-01-10 | 2016 | 1 | 10 | 71 | 66 | 62 | 63 | 58 | 55 | 88 | 76 | 64 | 29.95 | 29.86 | 29.83 | 6 | 6 | 6 | 20 | 15 | NA | 0 | Rain |
| Auckland | 2016-01-11 | 2016 | 1 | 11 | 75 | 67 | 59 | 61 | 58 | 54 | 94 | 72 | 53 | 30.09 | 30.03 | 29.95 | 6 | 6 | 6 | 17 | 10 | 26 | 0 | NA |
| Auckland | 2016-01-12 | 2016 | 1 | 12 | 69 | 66 | 62 | 66 | 62 | 59 | 100 | 87 | 78 | 30.09 | 30.01 | 29.95 | 6 | 6 | 3 | 16 | 8 | NA | 0 | Rain |
| Auckland | 2016-01-13 | 2016 | 1 | 13 | 71 | 66 | 62 | 61 | 57 | 54 | 83 | 73 | 64 | 30.06 | 30.00 | 29.95 | 6 | 6 | 6 | 18 | 13 | NA | 0 | NA |
| Auckland | 2016-01-14 | 2016 | 1 | 14 | 75 | 68 | 62 | 63 | 61 | 59 | 94 | 80 | 65 | 30.21 | 30.13 | 30.04 | 6 | 6 | 6 | 17 | 9 | NA | 0 | NA |
| Auckland | 2016-01-15 | 2016 | 1 | 15 | 75 | 68 | 62 | 63 | 60 | 57 | 94 | 76 | 57 | 30.21 | 30.12 | 30.04 | 6 | 6 | 6 | 15 | 7 | NA | 0 | NA |
| Auckland | 2016-01-16 | 2016 | 1 | 16 | 78 | 68 | 59 | 66 | 61 | 50 | 100 | 76 | 41 | 30.09 | 30.04 | 29.98 | 6 | 6 | 6 | 12 | 4 | NA | 0 | Rain |
| Auckland | 2016-01-17 | 2016 | 1 | 17 | 78 | 72 | 66 | 68 | 65 | 63 | 94 | 80 | 61 | 30.04 | 29.95 | 29.92 | 6 | 6 | 6 | 21 | 11 | NA | 0 | Rain |
| Auckland | 2016-01-18 | 2016 | 1 | 18 | 77 | 72 | 68 | 72 | 68 | 64 | 100 | 89 | 69 | 29.92 | 29.86 | 29.80 | 6 | 6 | 2 | 29 | 18 | 41 | 0 | Rain |
| Auckland | 2016-01-19 | 2016 | 1 | 19 | 75 | 68 | 62 | 70 | 62 | 59 | 100 | 78 | 61 | 30.01 | 29.91 | 29.83 | 6 | 6 | 6 | 20 | 11 | NA | 0 | Rain |
| Auckland | 2016-01-20 | 2016 | 1 | 20 | 75 | 68 | 62 | 63 | 62 | 61 | 94 | 78 | 65 | 30.09 | 30.03 | 29.98 | 6 | 6 | 6 | 12 | 5 | NA | 0 | NA |
Data Weather memiliki 3655 observasi data dan 25 kolom
dim(Weather)## [1] 3655 25
colnames(Weather)## [1] "city" "date" "year" "month"
## [5] "day" "high_temp" "avg_temp" "low_temp"
## [9] "high_dewpt" "avg_dewpt" "low_dewpt" "high_humidity"
## [13] "avg_humidity" "low_humidity" "high_hg" "avg_hg"
## [17] "low_hg" "high_vis" "avg_vis" "low_vis"
## [21] "high_wind" "avg_wind" "low_wind" "precip"
## [25] "events"
Visualisasi Data
Dilakukan agregasi data temperatur menurut city
df<-Weather %>% group_by(city) %>% summarise(m=sum(avg_temp))
df## # A tibble: 5 x 2
## city m
## * <chr> <dbl>
## 1 Auckland 44311
## 2 Beijing 40562
## 3 Chicago 38512
## 4 Mumbai 59165
## 5 San Diego 48649
Visualisasi Data Dengan Line Chart
ggplot(df, aes(x=city, y=m)) +
geom_line(aes(group=4), size=2, colour="green") +
geom_point(size=5, colour=c("red", "yellow", "blue", "orange", "black"))+
geom_label(data = df,
aes(label = m, x = city, y=m),
vjust = -0.5,
show.legend = TRUE)+
ggtitle("Weather in several cities")+
labs(x=NULL, y=NULL)+
ylim(38000,63000)Catatan Pelanggaran
1 Apprehension (Pemahaman) : Kemampuan untuk melihat hubungan di antara data dengan benar
Data Weather merupakan data yang berisi kondisi cuaca pada beberapa kota yang dirinci menurut tahun, bulan, dan hari. Plot yang dibuat adalah
penjumlahan temperaturmenurut kota pada series waktu 2016-2017. Plot menampilkan group by city dan summary data berupapenjumlahantemperatur (temp) selama 2016-2017, sehingga tidak tepat menggambarkan perbedaan cuaca menurut kota (city). Jenis plot yang digunakan adalahline chart, hal ini dinilai tidak tepat karena data yang ditampilkan bukan jenis data time series.
2 Clarity (Kejelasan) : Kemampuan untuk membedakan elemen-elemen grafik secara visual
Pada line chart
tidak terdapat label x dan label y, sehinggatidak jelas unit/satuandari line chart. Line chart juga tidak menampilkan variabel yang diukursatuandanreferensi waktuyang digunakan
3 Consistency (Konsistensi) : Kemampuan menafsirkan grafik berdasarkan keterpaparan pada grafik serupa di masa lalu atau standar universal yang wajar
Plot ini tidak konsisten karena
kesalahan dalam memilih tipe grafikuntuk menampilkan data.
4 Efficiency (Kejelasan) : Kemampuan grafik untuk menggambarkan data dengan cara sesederhana mungkin
Pemilihan warnapada unsur line dan point tidak tepat karena menggabungkan warna merah dan hijau, dimana warna tersebut sebaiknya dihindari pada pengidap buta warna
5 Necesity (Kebutuhan) : Berkaitan dengan kebutuhan grafik atau elemen tertentu.
Pemberian labeljumlah kasus pada setiap line point tidak diperlukan.
6 Truthfulness (Keadaan sebenarnya) : Apakah data di plot dengan benar dalam sistem koordinat yang ditentukan dengan baik.
Tidak menggambarkan keadaan yang sebenarnya, karena line chart dibuat dengan kaidah yang salah dari sisi data yang ditampilkan, karena jumlah temperature yang dikelompokan menurut kota (city) menjadikan data
hilang maknadantidak menggambarkan kondisi sebenarnya.
References
Dito GA, Anisa R. 2020. Visualisasi Data dengan ggplot2. [1 Maret 2021]. (https://rpubs.com/gdito/viz-ggplot2)
RStudio . tanpa tahun . Data Visualization with ggplot2 Cheat Sheet [4 Maret 2021]. https://rstudio.com/wp-content/uploads/2015/03/ggplot2-cheatsheet.pdf
Nurussadad, A.A. (2021). Visualisasi Data dengan ggplot2. [3 Maret 2021]. https://rpubs.com/nurussadad/STA581-04-ggplot2
Badan Pusat Stastitik (Tugas Belajar IPB University), annebel@apps.ipb.ac.id↩︎
Badan Pusat Stastitik (Tugas Belajar IPB University), hendra_dharmawan@apps.ipb.ac.id↩︎