R dan Rstudio

R merupakan suatu bahasa pemrograman yang digunakan untuk komputasi statistik serta grafik. Sedangkan Rstudio adalah Integrated Development Environment (IDE) yang digunakan untuk mempermudah pengguna mengaplikasikan bahasa R (Melfi, 2020).R tersedia gratis dan open sources.Saat ini R cukup banyak digunakan untuk analisis dan pengolahan data. Kita gunakan Rstudio cloud untuk mempermudah belajar R tanpa perlu install pada perangkat kita. Langkah yang dilakukan adalah sebagai berikut: Pilih tab File -> New File -> R script

Aritmatika Sederhana

7 + 8
## [1] 15
22 / 7
## [1] 3.142857
8 * 5
## [1] 40

Membuat Matriks

G1 <- c(7,1)
G2 <- c(3,5)
G3 <- c(4,6)
A <- cbind(G1,G2,G3)
A
##      G1 G2 G3
## [1,]  7  3  4
## [2,]  1  5  6

Tipe Data R

Contoh:

A <- c(10,20,30,40,50) #variable numerik
A
## [1] 10 20 30 40 50
N <- "John" #variable character
Ad <- "123 Main St"
City <- "New York"
X <- 5 > 3  #variable logical
X
## [1] TRUE

Statistik Deskriptif Dasar

Kita bisa membuat data dan mengetahui nilai minimum, mean dan median suatu data, secara satu persatu atau mendapatkan ringkasan sekaligus secara bersama.

C <- c(1,5,5,6,8,7,9,10)
mean(C)
## [1] 6.375
median(C)
## [1] 6.5
min(C)
## [1] 1
summary(C)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   5.000   6.500   6.375   8.250  10.000

Eksplorasi Data

R memiliki beragam package untuk kita mengeksplorasi data. Beberapa package tersebut diantaranya: library (tidyverse) library (ggplot2) *library (dplyr)

Contoh data2:

dt1 <- data.frame(Product = c("A","B","A","A","B","B","A","B"),
                  Satisfaction = c("Tinggi","Rendah","Sedang","Rendah",
                                   "Tinggi","Sedang","Tinggi","Rendah"))
table(dt1$Product, dt1$Satisfaction)
##    
##     Rendah Sedang Tinggi
##   A      1      1      2
##   B      2      1      1

Selanjutnya kita visualisasikan data tersebut dengan package ggplot2

library(ggplot2)
mosaicplot(Product~Satisfaction, data=dt1)

mosaicplot(Product~Satisfaction, data=dt1, col=c("blue","red","green"))

Data Package

Selain membuat data sendiri, kita bisa mengeksplorasi data yang tersedia dalam package untuk latihan. Contoh data yang kita gunakan berikut ini didapatkan dari library datarium.

library(datarium)
data('marketing')
dim(marketing)
## [1] 200   4
str(marketing)
## 'data.frame':    200 obs. of  4 variables:
##  $ youtube  : num  276.1 53.4 20.6 181.8 217 ...
##  $ facebook : num  45.4 47.2 55.1 49.6 13 ...
##  $ newspaper: num  83 54.1 83.2 70.2 70.1 ...
##  $ sales    : num  26.5 12.5 11.2 22.2 15.5 ...
summary(marketing)
##     youtube          facebook       newspaper          sales      
##  Min.   :  0.84   Min.   : 0.00   Min.   :  0.36   Min.   : 1.92  
##  1st Qu.: 89.25   1st Qu.:11.97   1st Qu.: 15.30   1st Qu.:12.45  
##  Median :179.70   Median :27.48   Median : 30.90   Median :15.48  
##  Mean   :176.45   Mean   :27.92   Mean   : 36.66   Mean   :16.83  
##  3rd Qu.:262.59   3rd Qu.:43.83   3rd Qu.: 54.12   3rd Qu.:20.88  
##  Max.   :355.68   Max.   :59.52   Max.   :136.80   Max.   :32.40

Data marketing memiliki 200 observasi dengan 4 variable. Dataframe ini menunjukkan dampak dari tiga media iklan (youtube, facebook, dan surat kabar) terhadap penjualan (sales). Data adalah anggaran iklan dalam ribuan dolar beserta penjualannya. Kita bisa berlatih visualisasi menggunakan data ini.

attach(marketing)
plot(youtube,sales,
     col=c("blue", "green"),
     xlab = "youtube", 
     ylab = "sales")
abline(lm(sales~youtube), col="red")

plot(facebook, sales,
     col= c("black", "yellow"),
     xlab = "facebook",
     ylab= "sales")
abline(lm(sales~facebook), col="red")

#Selamat belajaR