R merupakan suatu bahasa pemrograman yang digunakan untuk komputasi statistik serta grafik. Sedangkan Rstudio adalah Integrated Development Environment (IDE) yang digunakan untuk mempermudah pengguna mengaplikasikan bahasa R (Melfi, 2020).R tersedia gratis dan open sources.Saat ini R cukup banyak digunakan untuk analisis dan pengolahan data. Kita gunakan Rstudio cloud untuk mempermudah belajar R tanpa perlu install pada perangkat kita. Langkah yang dilakukan adalah sebagai berikut: Pilih tab File -> New File -> R script
7 + 8
## [1] 15
22 / 7
## [1] 3.142857
8 * 5
## [1] 40
G1 <- c(7,1)
G2 <- c(3,5)
G3 <- c(4,6)
A <- cbind(G1,G2,G3)
A
## G1 G2 G3
## [1,] 7 3 4
## [2,] 1 5 6
Contoh:
A <- c(10,20,30,40,50) #variable numerik
A
## [1] 10 20 30 40 50
N <- "John" #variable character
Ad <- "123 Main St"
City <- "New York"
X <- 5 > 3 #variable logical
X
## [1] TRUE
Kita bisa membuat data dan mengetahui nilai minimum, mean dan median suatu data, secara satu persatu atau mendapatkan ringkasan sekaligus secara bersama.
C <- c(1,5,5,6,8,7,9,10)
mean(C)
## [1] 6.375
median(C)
## [1] 6.5
min(C)
## [1] 1
summary(C)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 5.000 6.500 6.375 8.250 10.000
R memiliki beragam package untuk kita mengeksplorasi data. Beberapa package tersebut diantaranya: library (tidyverse) library (ggplot2) *library (dplyr)
Contoh data2:
dt1 <- data.frame(Product = c("A","B","A","A","B","B","A","B"),
Satisfaction = c("Tinggi","Rendah","Sedang","Rendah",
"Tinggi","Sedang","Tinggi","Rendah"))
table(dt1$Product, dt1$Satisfaction)
##
## Rendah Sedang Tinggi
## A 1 1 2
## B 2 1 1
Selanjutnya kita visualisasikan data tersebut dengan package ggplot2
library(ggplot2)
mosaicplot(Product~Satisfaction, data=dt1)
mosaicplot(Product~Satisfaction, data=dt1, col=c("blue","red","green"))
Selain membuat data sendiri, kita bisa mengeksplorasi data yang tersedia dalam package untuk latihan. Contoh data yang kita gunakan berikut ini didapatkan dari library datarium.
library(datarium)
data('marketing')
dim(marketing)
## [1] 200 4
str(marketing)
## 'data.frame': 200 obs. of 4 variables:
## $ youtube : num 276.1 53.4 20.6 181.8 217 ...
## $ facebook : num 45.4 47.2 55.1 49.6 13 ...
## $ newspaper: num 83 54.1 83.2 70.2 70.1 ...
## $ sales : num 26.5 12.5 11.2 22.2 15.5 ...
summary(marketing)
## youtube facebook newspaper sales
## Min. : 0.84 Min. : 0.00 Min. : 0.36 Min. : 1.92
## 1st Qu.: 89.25 1st Qu.:11.97 1st Qu.: 15.30 1st Qu.:12.45
## Median :179.70 Median :27.48 Median : 30.90 Median :15.48
## Mean :176.45 Mean :27.92 Mean : 36.66 Mean :16.83
## 3rd Qu.:262.59 3rd Qu.:43.83 3rd Qu.: 54.12 3rd Qu.:20.88
## Max. :355.68 Max. :59.52 Max. :136.80 Max. :32.40
Data marketing memiliki 200 observasi dengan 4 variable. Dataframe ini menunjukkan dampak dari tiga media iklan (youtube, facebook, dan surat kabar) terhadap penjualan (sales). Data adalah anggaran iklan dalam ribuan dolar beserta penjualannya. Kita bisa berlatih visualisasi menggunakan data ini.
attach(marketing)
plot(youtube,sales,
col=c("blue", "green"),
xlab = "youtube",
ylab = "sales")
abline(lm(sales~youtube), col="red")
plot(facebook, sales,
col= c("black", "yellow"),
xlab = "facebook",
ylab= "sales")
abline(lm(sales~facebook), col="red")
#Selamat belajaR