Beberapa package yang harus di install diantaranya:
readr: untuk import data kedalam R
dplyr: untuk manipulasi data
ggplot2 dan ggpubr untuk visualisasi data
Package ggplot2 membuat mudah user pemula untuk membuat plot visualisasi.
Seluruh package yang tersebut di atas dikemas dalam satu package bernama tidyverse. Sehingga jika melakukan installasi tidyverse sudah otomatis tersintall packages readr, dplyr, ggplot dan lain-lain. Ketik perintah berikut untuk install:
install.packages(“tidyverse”)
install.packages(“ggpubr”)
Setelah tahapan installasi, langkah pertama user harus load package untuk menggunakan fungsi yang terdapat pada package. Perintah library() digunakan pada tahapan ini. Atau cara lain dapat menggunakan perintah require(). Untuk contoh, load package ggplot2 dan ggpubr, ketik seperti berikut:
library(ggplot2)
library(ggpubr)
## Loading required package: magrittr
Sekarang, user dapat menggunakan fungsi R, seperti ggscatter() [yang terdapat pada package ggpubr] untuk membuat scatter plot.
data = read.csv("E://BLOG/MATERI/R DASAR UNTUK VISUALISASI DATA/Data Diabetes.csv", sep =",", header = TRUE)
head(data) #Melihat data teratas
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 1 6 148 72 35 0 33.6
## 2 1 85 66 29 0 26.6
## 3 8 183 64 0 0 23.3
## 4 1 89 66 23 94 28.1
## 5 0 137 40 35 168 43.1
## 6 5 116 74 0 0 25.6
## DiabetesPedigreeFunction Age keterangan
## 1 0.627 50 Tidak Diabetes
## 2 0.351 31 Tidak Diabetes
## 3 0.672 32 Diabetes
## 4 0.167 21 Tidak Diabetes
## 5 2.288 33 Tidak Diabetes
## 6 0.201 30 Tidak Diabetes
tail(data) #Melihat data terbawah
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 763 9 89 62 0 0 22.5
## 764 10 101 76 48 180 32.9
## 765 2 122 70 27 0 36.8
## 766 5 121 72 23 112 26.2
## 767 1 126 60 0 0 30.1
## 768 1 93 70 31 0 30.4
## DiabetesPedigreeFunction Age keterangan
## 763 0.142 33 Tidak Diabetes
## 764 0.171 63 Tidak Diabetes
## 765 0.340 27 Tidak Diabetes
## 766 0.245 30 Tidak Diabetes
## 767 0.349 47 Tidak Diabetes
## 768 0.315 23 Tidak Diabetes
Perintah read.csv() untuk memanggil data kedalam direktori kerja R. Pembahasan lebih rinci dapat melihat pada materi Direktori kerja di R.
Setelah memasukkan data ke R, user dapat dengan mudah memanipulasi data itu dengan menggunakan package dplyr Setelah package dplyr di load, user dapat menggunakan beberapa fungsi seperti berikut:
R mempunyai fungsi yang sederhana untuk membuat grafik, diantaranya:
| Plot.Types | R.base.function |
|---|---|
| Scatter plot | plot() |
| Scatter plot matrix | pairs() |
| Box plot | boxplot() |
| Strip chart | stripchart() |
| Histogram plot | hist() |
| density plot | density() |
| Bar plot | barplot() |
| Line plot | plot() dan line() |
| Pie charts | pie() |
| Dot charts | dotchart() |
| Add text to a plot | text() |
Menggunakan fungsi R, kita akan menggunakan data untuk membuat scatter plot dan boxplot.
plot(x = data$BloodPressure, y = data$Glucose, pch = 19, cex = 0.8, frame = FALSE, xlab = "Tekanan darah", ylab = "Kadar Gula")
boxplot(Age ~ keterangan, data = data, ylab = "Umur", frame = FALSE, col = "lightgray")
Package lattice menyediakan fungsi plotting untuk meningkatkan Grafik basis di R. Cara installasinya seperti berikut:
install.packages(“lattice”) ketik perintah tersebut pada program R.
Membuat scatter plot dasar dari y oleh x.
library(lattice)
xyplot(
Glucose ~ BloodPressure, group = keterangan, data=data, auto.key = TRUE, pch = 19, cex = 0.5
)
xyplot( Glucose ~ BloodPressure | keterangan, layout = c(3,1), group = keterangan, data = data, type = c("p", "smooth"), scale = "free")
ggplot2 sangat powerful dan package yang fleksibel.
library(ggplot2)
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point()
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point(size = 1.2, color = "steelblue", shape = 21)
Catatan: sintaks diatas mendefinisikan nilai dengan bentuk titik. Jika ingin melihat bentuk lain dapat memilih bentuk yang berbeda di R. Ketik sintaks berikut:
ggpubr::show_point_shapes()
Untuk membuat legend dengan bentuk dan warna berbeda menggunakan perintah seperti ini:
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point(aes(color = keterangan, shape = keterangan))
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point(aes(color = keterangan, shape = keterangan))+
scale_color_manual(values = c("yellow", "green"))
User juga dapat memberikan sekat pada plot menjadi beberapa panel bagian berdasarkan variabel grup. Fungsinya seperti berikut facet_wrap(). Fitur lain yang menarik dari ggplot2 adalah memungkinkan user untuk menggabungkan beberapa layer pada plot yang sama.
ggplot(data, aes(x = Glucose, y = BloodPressure)) + geom_point(aes(color=keterangan)) + geom_smooth(aes(color=keterangan, fill = keterangan)) + facet_wrap(~keterangan, ncol = 2, nrow = 1)+ scale_color_manual(values = c("brown", "blue"))+ scale_fill_manual(values = c("brown", "blue"))
## `geom_smooth()` using method = 'loess'
library(ggpubr)
ggdensity(data, x = "Glucose", add = "mean", rug = TRUE, color = "keterangan", fill = "keterangan", palette = "jco")
my_comparison = list(c("Diabetes", "Tidak Diabetes"))
ggboxplot(data, x= "keterangan", y="Glucose", color = "keterangan", palette = c("#00AFBB", "#E7B800"), add = "jitter")+ stat_compare_means(comparisons = my_comparison, method = "t.test")
sekian, semoga bermanfaat! :)