Himpunan

R memiliki fungsi-fungsi himpunan yang diterapkan pada vektor. Misalkan pada vektor x dan y berikut.

x <- c(1,6,3,6,5)
y <- c(8,9,5,1,4)

union(x,y)

digunakan untuk mendapatkan nilai unik dari anggota x dan y

union(x,y)
[1] 1 6 3 5 8 9 4

intersect(x,y)

digunakan untuk mendapatkan anggota x yang juga anggota y

intersect(x,y)
[1] 1 5

setdiff(x,y)

digunakan untuk mendapatkan anggota x yang bukan anggota y

x;y
[1] 1 6 3 6 5
[1] 8 9 5 1 4
setdiff(x,y)
[1] 6 3
setdiff(y,x)
[1] 8 9 4

setequal(x,y)

digunakan untuk mengetahui apakah semua anggota x dan y sama

setequal(x,y)
[1] FALSE
# contoh ketika x dan y memiliki anggota yang sama
x1 <- c(1,2,3,4,5,3,2,1)
y1 <- c(5,4,3,2,1)
setequal(x1,y1)
[1] TRUE

jumlah elemen dan urutan tidak berpengaruh, yang dicek ialah nilai unik dari setiap elemen pada kedua vektor.

c %in% y

digunakan untuk mengetahui apakah anggota vektor c ada di y

x; y
[1] 1 6 3 6 5
[1] 8 9 5 1 4
c(1,2,3) %in% x
[1]  TRUE FALSE  TRUE
7 %in% y
[1] FALSE
x %in% y
[1]  TRUE FALSE FALSE FALSE  TRUE

choose(n,k)

digunakan untuk mengetahui banyaknya kombinasi k dari n

choose(5,3)
[1] 10

combn(n,k)

digunakan untuk mendapatkan matriks semua kemungkinan kombinasi k dari n

combn(5,3)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,]    1    1    1    1    1    1    2    2    2     3
[2,]    2    2    2    3    3    4    3    3    4     4
[3,]    3    4    5    4    5    5    4    5    5     5

Fungsi-fungsi Matematika

Fungsi-fungsi Matematika Umum

exp()

fungsi eksponensial dengan basis natural (e)

exp(8)
[1] 2980.958
exp(1)
[1] 2.718282
exp(1)^8
[1] 2980.958

log()

digunakan untuk mendapatkan nilai logaritma dengan basis natural (ln)

log(100)
[1] 4.60517

log10()

digunakan untuk mendapatkan nilai logaritma dengan basis 10

log10(100)
[1] 2

sqrt()

digunakan untuk mendapatkan nilai akar kuadrat

sqrt(x)
[1] 1.000000 2.449490 1.732051 2.449490 2.236068
sqrt(100)
[1] 10

abs()

digunakan untuk mendapatkan nilai nilai absolut / nilai mutlaknya

x2 <- c(-1,2,-3,4,-5)
abs(x2)
[1] 1 2 3 4 5

Fungsi Trigonometri

Berikut adalah beberapa fungsi trigonometri

sin(0)
[1] 0
cos(0)
[1] 1

fungsi di atas digunakan untuk mendapatkan nilai sinus dan cosinus.

Fungsi-fungsi Bilangan Integer

Berikut adalah beberapa fungsi pembulatan bilangan agar menjadi bilangan integer.

y2 <- c(2.4, 3.6, 4.5, 5.5)
round(y2)
[1] 2 4 4 6
floor(y2) 
[1] 2 3 4 5
ceiling(y2) 
[1] 3 4 5 6

Perbedaan pada penggunaan fungsi-fungsi di atas yaitu:

  • round() memiliki hasil yang sama seperti pembulatan biasa dimana:
  • bila nilai koma > 0.5 maka bilangan akan dibulatkan ke atas.
  • bila nilai koma < 0.5 maka bilangan akan dibulatkan ke bawah.
  • bila nilai koma = 0.5 dan bilangan integernya bernilai genap maka bilangan akan dibulatkan ke bawah.
  • bila nilai koma = 0.5 dan bilangan integernya bernilai ganjil maka bilangan akan dibulatkan ke atas.
  • floor(): pembulatan ke bawah (hanya mengambil nilai integernya saja).
  • ceiling(): pembulatan ke atas

factorial()

fungsi faktorial (n!=nx(n-1)x(n-2)x…x1)

factorial(5)
[1] 120
5*4*3*2*1
[1] 120

Fungsi-fungsi Lain

Terdapat pula beberapa fungsi umum yang sering digunakan, berikut adalah contoh penggunaan fungsi umum pada suatu vektor a.

a <- c(4,5,6,2,1,3,5,4,8,3)

min() and max()

digunakan untuk mendapatkan nilai minimum dan maksimum dari suatu vektor

min(a)
[1] 1
max(a)
[1] 8

which

mendapatkan index vektor yang memenuhi kriteria tertentu

a
 [1] 4 5 6 2 1 3 5 4 8 3
which(a>4)
[1] 2 3 7 9

which.min() : mendapatkan index vektor untuk nilai minimum

which.max(): mendapatkan index vektor untuk nilai maksimum

a
 [1] 4 5 6 2 1 3 5 4 8 3
which.min(a)
[1] 5
which.max(a)
[1] 9

pmin() and pmax()

element-wise minimum dan maksimum dari suatu vektor

b <- c(2,1,8,7,8,2,8,6,3,2)
a
 [1] 4 5 6 2 1 3 5 4 8 3
b
 [1] 2 1 8 7 8 2 8 6 3 2
pmin(a,b)
 [1] 2 1 6 2 1 2 5 4 3 2
pmax(a,b)
 [1] 4 5 8 7 8 3 8 6 8 3
nilai1 <- round(rnorm(10,70,5),2)
nilai2 <- round(rnorm(10,80,7),2)
data.nilai <- data.frame(nilai1,nilai2,nilai.maksimum=pmax(nilai1,nilai2))
data.nilai

sum() and prod()

jumlah dan perkalian elemen suatu vektor

a
 [1] 4 5 6 2 1 3 5 4 8 3
sum(a)
[1] 41
prod(a)
[1] 345600

cumsum() and cumprod()

jumlah dan perkalian kumulatif dari elemen suatu vektor

a
 [1] 4 5 6 2 1 3 5 4 8 3
cumsum(a)
 [1]  4  9 15 17 18 21 26 30 38 41
cumprod(a)
 [1]      4     20    120    240    240    720   3600  14400 115200 345600

Fungsi Kalkulus: Diferensial

R memiliki fungsi-fungsi untuk mendapatkan turunan dari suatu fungsi. Fungsi yang digunakan merupakan fungsi dengan satu peubah.

D

D(expr,simbol) digunakan jika hasil turunan merupakan suatu fungsi. Sebagai contoh akan dicari turunan dari fungsi berikut.

\(\begin{aligned} f(x) = e^{(x^2)} \end{aligned}\)

xfs <- expression(exp(x^2))
D(xfs,"x")
exp(x^2) * (2 * x)

deriv

deriv(∼fungsi,simbol) digunakan jika akan memasukkan nilai dari hasil turunan pada suatu fungsi. Sebagai contoh akan dicari turunan dari fungsi berikut

\(\begin{aligned} f(x) = x^2 \end{aligned}\)

untuk nilai \(x=3\)

xturunan <- deriv(~x^2, "x")
x<-3
eval(xturunan)
[1] 9
attr(,"gradient")
     x
[1,] 6
xturunan
expression({
    .value <- x^2
    .grad <- array(0, c(length(.value), 1L), list(NULL, c("x")))
    .grad[, "x"] <- 2 * x
    attr(.value, "gradient") <- .grad
    .value
})

Fungsi Kalkulus: Integral

Selain turunan pada fungsi sederhana, R juga memiliki fungsi untuk mendapatkan luas wilayah suatu fungsi dengan integral integrate(fungsi, lower, upper)

fs <- function(x) x^2
integrate(fs,0,1)
0.3333333 with absolute error < 3.7e-15
fsi <- function(x) 1/3*x^3
fsi(1) - fsi(0)
[1] 0.3333333

Selain itu, terdapat fungsi yac_str() pada package Ryacas untuk mencari integral tak tentu.

Contoh dengan fungsi yac_str pada paket Ryacas

library(Ryacas)

\(\begin{aligned} \int x^2 + 4x dx \end{aligned}\)

yac_str("Integrate(x) x^2 + 4*x")
[1] "x^3/3+2*x^2"

Fungsi-fungsi Statistika:Sebaran

Fungsi sebaran statistik secara konvensi:

  • dnamasebaran: density or probability mass function (pmf)
  • pnamasebaran: cumulative distribution function (cdf)
  • qnamasebaran: quantiles
  • rnamasebaran: random number generation

Dengan nama sebaran dan parameter dapat dilihat pada tabel berikut

Distribution Name Parameters
beta beta shape1, shape2, ncp
binomial binom size, prob
Chauchy cauchy location, scale
chi-squared chisq df, ncp
exponential exp rate
F f df1, df2, ncp
gamma gamma shape, scale
geometric geom prob
hypergeometric hyper m, n, k
log-normal lnorm meanlog, sdlog
logistic logis location, scale
uniform unif min, max
neg binomial nbinom size, prob
normal norm mean, sd
Poisson pois lambda
Student’s t t df, ncp
Weibull weibull shape
Empirical cdf ecdf -
Box-percentile bpplot list of vector

berikut adalah contoh penggunaan fungsi sebaran pada sebaran normal baku.

dnorm(0,mean=0,sd=1)
[1] 0.3989423
pnorm(0,mean=0,sd=1)
[1] 0.5
qnorm(0.5,mean=0,sd=1)
[1] 0
x <- rnorm(10,mean=0,sd=1)
cbind(mean(x),sd(x))
           [,1]     [,2]
[1,] -0.2708766 1.179979

Optimasi Numerik

Beberapa metode statistik menggunakan metode pendugaan nilai optimum dari suatu fungsi tujuan seperti dengan metode kemungkinan maksimum (memaksimumkan likelihood) dan metode kuadrat terkecil (meminimumkan JKG).

Mendapatkan nilai optimum dari suatu fungsi merupakan suatu teknik optimasi numerik.

Beberapa metode yang sudah dikembangkan diantaranya:

Newton Raphson

Jika suatu fungsi memiliki turunan pertama dan kedua, maka nilai minimum dapat menggunakan metode Newton Raphson. Kelebihan metode ini adalah hanya memerlukan satu nilai untuk inisial. Kelemahannya adalah kita harus yakin f(x) memiliki turunan pertama dan turunan kedua. Jika di golden section tidak perlu ada turunan pertama dan turunan kedua.

Fungsi Newton Raphson

newtonr <- function (fx , x0 =1){
  fx1 <- deriv (fx ,"x") # turunan pertama
  fx2 <- deriv (D(fx ,"x"),"x") # turunan kedua
  er <- 1000
  
  while(er > 1e-6){
    x <- x0
    f1 <- attr ( eval (fx1),"gradient")[1]
    f2 <- attr ( eval (fx2),"gradient")[1]
    er <- abs(f1) # bisa juga e <- abs (x1 -x0)
    x1 <- x0 - f1/f2
    x0 <- x1
  }
  return (x1)
}

Hitung nilai minimum untuk fungsi- fungsi berikut.

\(\begin{aligned} f(x) = 4x^2 - 3x - 7 \end{aligned}\)

fx <- expression(4*x^2-3*x-7)
newtonr(fx,3)
[1] 0.375

\(\begin{aligned} f(x) = e^{-x}+x^4 \end{aligned}\)

fx <- expression(exp(-x)+x^4)
newtonr(fx)
[1] 0.5282519
newtonr(fx,1)
[1] 0.5282519

\(\begin{aligned} f(x) = x^2 - x \end{aligned}\)

fx <- expression(x^2-x)
newtonr(fx)
[1] 0.5

Fungsi Optimasi Built-in

Algoritma Nelder Mead adalah salah satu metode optimasi untuk fungsi yang memiliki lebih dari satu variabel. R telah menyiapkan fungsi optimasi dengan salah satu algoritmanya adalah Nelder-Mead:

  • optimize atau optimise untuk menduga parameter/ mencari nilai minimum dari satu peubah
  • optim untuk lebih dari satu peubah

Fungsi optimize/optimise

\(\begin{aligned} f(x) = \left( x - \frac{1}{3} \right)^2 \end{aligned}\)

f <- function(x) ((x-(1/3))^2) # membuat fungsi tujuan
curve(f)

xmin <- optimize(f, c(0,1), tol = 0.0001) # tolerance optional
xmin
$minimum
[1] 0.3333333

$objective
[1] 0

Fungsi optim

Digunakan untuk mencari nilai minimum dari fungsi yang lebih dari satu peubah. Contoh mencari nilai \(x_1\) dan \(x_2\), yang mebuat \(f(x_1,x_2) = 100(x_2 - x_1^2)^2 + (1-x_1)^2\) minimum

Program yang digunakan:

fr <- function (x){ # tetap dituliskan dalam sebuah vektor, akan diduga x
  x1<- x[1]
  x2 <- x[2]
  100 * (x2-x1^2)^2 + (1-x1)^2 # ini adalah nilai fungsi objetivenya
} 

# argumen pertama adalah nilai inisial, karena menduga x vektor berukuran 2 maka dimasukkan nilai inisialnya
optim (c(-1.2,1),fr) 
$par
[1] 1.000260 1.000506

$value
[1] 8.825241e-08

$counts
function gradient 
     195       NA 

$convergence
[1] 0

$message
NULL

  1. Mahasiswa Statistika dan Sains Data IPB, ↩︎

