Himpunan
R memiliki fungsi-fungsi himpunan yang diterapkan pada vektor. Misalkan pada vektor x dan y berikut.
x <- c(1,6,3,6,5)
y <- c(8,9,5,1,4)
union(x,y)
digunakan untuk mendapatkan nilai unik dari anggota x dan y
[1] 1 6 3 5 8 9 4
intersect(x,y)
digunakan untuk mendapatkan anggota x yang juga anggota y
[1] 1 5
setdiff(x,y)
digunakan untuk mendapatkan anggota x yang bukan anggota y
[1] 1 6 3 6 5
[1] 8 9 5 1 4
[1] 6 3
[1] 8 9 4
setequal(x,y)
digunakan untuk mengetahui apakah semua anggota x dan y sama
[1] FALSE
# contoh ketika x dan y memiliki anggota yang sama
x1 <- c(1,2,3,4,5,3,2,1)
y1 <- c(5,4,3,2,1)
setequal(x1,y1)
[1] TRUE
jumlah elemen dan urutan tidak berpengaruh, yang dicek ialah nilai unik dari setiap elemen pada kedua vektor.
c %in% y
digunakan untuk mengetahui apakah anggota vektor c ada di y
[1] 1 6 3 6 5
[1] 8 9 5 1 4
[1] TRUE FALSE TRUE
[1] FALSE
[1] TRUE FALSE FALSE FALSE TRUE
choose(n,k)
digunakan untuk mengetahui banyaknya kombinasi k dari n
[1] 10
combn(n,k)
digunakan untuk mendapatkan matriks semua kemungkinan kombinasi k dari n
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 1 1 1 1 1 1 2 2 2 3
[2,] 2 2 2 3 3 4 3 3 4 4
[3,] 3 4 5 4 5 5 4 5 5 5
Fungsi-fungsi Matematika
Fungsi-fungsi Matematika Umum
exp()
fungsi eksponensial dengan basis natural (e)
[1] 2980.958
[1] 2.718282
[1] 2980.958
log()
digunakan untuk mendapatkan nilai logaritma dengan basis natural (ln)
[1] 4.60517
log10()
digunakan untuk mendapatkan nilai logaritma dengan basis 10
[1] 2
sqrt()
digunakan untuk mendapatkan nilai akar kuadrat
[1] 1.000000 2.449490 1.732051 2.449490 2.236068
[1] 10
abs()
digunakan untuk mendapatkan nilai nilai absolut / nilai mutlaknya
x2 <- c(-1,2,-3,4,-5)
abs(x2)
[1] 1 2 3 4 5
Fungsi Trigonometri
Berikut adalah beberapa fungsi trigonometri
[1] 0
[1] 1
fungsi di atas digunakan untuk mendapatkan nilai sinus dan cosinus.
Fungsi-fungsi Bilangan Integer
Berikut adalah beberapa fungsi pembulatan bilangan agar menjadi bilangan integer.
y2 <- c(2.4, 3.6, 4.5, 5.5)
round(y2)
[1] 2 4 4 6
[1] 2 3 4 5
[1] 3 4 5 6
Perbedaan pada penggunaan fungsi-fungsi di atas yaitu:
round() memiliki hasil yang sama seperti pembulatan biasa dimana:
- bila nilai koma > 0.5 maka bilangan akan dibulatkan ke atas.
- bila nilai koma < 0.5 maka bilangan akan dibulatkan ke bawah.
- bila nilai koma = 0.5 dan bilangan integernya bernilai genap maka bilangan akan dibulatkan ke bawah.
- bila nilai koma = 0.5 dan bilangan integernya bernilai ganjil maka bilangan akan dibulatkan ke atas.
floor(): pembulatan ke bawah (hanya mengambil nilai integernya saja).
ceiling(): pembulatan ke atas
factorial()
fungsi faktorial (n!=nx(n-1)x(n-2)x…x1)
[1] 120
[1] 120
Fungsi-fungsi Lain
Terdapat pula beberapa fungsi umum yang sering digunakan, berikut adalah contoh penggunaan fungsi umum pada suatu vektor a.
a <- c(4,5,6,2,1,3,5,4,8,3)
min() and max()
digunakan untuk mendapatkan nilai minimum dan maksimum dari suatu vektor
[1] 1
[1] 8
which
mendapatkan index vektor yang memenuhi kriteria tertentu
[1] 4 5 6 2 1 3 5 4 8 3
[1] 2 3 7 9
which.min() : mendapatkan index vektor untuk nilai minimum
which.max(): mendapatkan index vektor untuk nilai maksimum
[1] 4 5 6 2 1 3 5 4 8 3
[1] 5
[1] 9
pmin() and pmax()
element-wise minimum dan maksimum dari suatu vektor
b <- c(2,1,8,7,8,2,8,6,3,2)
a
[1] 4 5 6 2 1 3 5 4 8 3
[1] 2 1 8 7 8 2 8 6 3 2
[1] 2 1 6 2 1 2 5 4 3 2
[1] 4 5 8 7 8 3 8 6 8 3
nilai1 <- round(rnorm(10,70,5),2)
nilai2 <- round(rnorm(10,80,7),2)
data.nilai <- data.frame(nilai1,nilai2,nilai.maksimum=pmax(nilai1,nilai2))
data.nilai
sum() and prod()
jumlah dan perkalian elemen suatu vektor
[1] 4 5 6 2 1 3 5 4 8 3
[1] 41
[1] 345600
cumsum() and cumprod()
jumlah dan perkalian kumulatif dari elemen suatu vektor
[1] 4 5 6 2 1 3 5 4 8 3
[1] 4 9 15 17 18 21 26 30 38 41
[1] 4 20 120 240 240 720 3600 14400 115200 345600
Fungsi Kalkulus: Diferensial
R memiliki fungsi-fungsi untuk mendapatkan turunan dari suatu fungsi. Fungsi yang digunakan merupakan fungsi dengan satu peubah.
D
D(expr,simbol) digunakan jika hasil turunan merupakan suatu fungsi. Sebagai contoh akan dicari turunan dari fungsi berikut.
\(\begin{aligned} f(x) = e^{(x^2)} \end{aligned}\)
xfs <- expression(exp(x^2))
D(xfs,"x")
exp(x^2) * (2 * x)
deriv
deriv(∼fungsi,simbol) digunakan jika akan memasukkan nilai dari hasil turunan pada suatu fungsi. Sebagai contoh akan dicari turunan dari fungsi berikut
\(\begin{aligned} f(x) = x^2 \end{aligned}\)
untuk nilai \(x=3\)
xturunan <- deriv(~x^2, "x")
x<-3
eval(xturunan)
[1] 9
attr(,"gradient")
x
[1,] 6
expression({
.value <- x^2
.grad <- array(0, c(length(.value), 1L), list(NULL, c("x")))
.grad[, "x"] <- 2 * x
attr(.value, "gradient") <- .grad
.value
})
Fungsi Kalkulus: Integral
Selain turunan pada fungsi sederhana, R juga memiliki fungsi untuk mendapatkan luas wilayah suatu fungsi dengan integral integrate(fungsi, lower, upper)
fs <- function(x) x^2
integrate(fs,0,1)
0.3333333 with absolute error < 3.7e-15
fsi <- function(x) 1/3*x^3
fsi(1) - fsi(0)
[1] 0.3333333
Selain itu, terdapat fungsi yac_str() pada package Ryacas untuk mencari integral tak tentu.
Contoh dengan fungsi yac_str pada paket Ryacas
\(\begin{aligned} \int x^2 + 4x dx \end{aligned}\)
yac_str("Integrate(x) x^2 + 4*x")
[1] "x^3/3+2*x^2"
Fungsi-fungsi Statistika:Sebaran
Fungsi sebaran statistik secara konvensi:
- dnamasebaran: density or probability mass function (pmf)
- pnamasebaran: cumulative distribution function (cdf)
- qnamasebaran: quantiles
- rnamasebaran: random number generation
Dengan nama sebaran dan parameter dapat dilihat pada tabel berikut
| beta |
beta |
shape1, shape2, ncp |
| binomial |
binom |
size, prob |
| Chauchy |
cauchy |
location, scale |
| chi-squared |
chisq |
df, ncp |
| exponential |
exp |
rate |
| F |
f |
df1, df2, ncp |
| gamma |
gamma |
shape, scale |
| geometric |
geom |
prob |
| hypergeometric |
hyper |
m, n, k |
| log-normal |
lnorm |
meanlog, sdlog |
| logistic |
logis |
location, scale |
| uniform |
unif |
min, max |
| neg binomial |
nbinom |
size, prob |
| normal |
norm |
mean, sd |
| Poisson |
pois |
lambda |
| Student’s t |
t |
df, ncp |
| Weibull |
weibull |
shape |
| Empirical cdf |
ecdf |
- |
| Box-percentile |
bpplot |
list of vector |
berikut adalah contoh penggunaan fungsi sebaran pada sebaran normal baku.
[1] 0.3989423
[1] 0.5
[1] 0
x <- rnorm(10,mean=0,sd=1)
cbind(mean(x),sd(x))
[,1] [,2]
[1,] -0.2708766 1.179979
Optimasi Numerik
Beberapa metode statistik menggunakan metode pendugaan nilai optimum dari suatu fungsi tujuan seperti dengan metode kemungkinan maksimum (memaksimumkan likelihood) dan metode kuadrat terkecil (meminimumkan JKG).
Mendapatkan nilai optimum dari suatu fungsi merupakan suatu teknik optimasi numerik.
Beberapa metode yang sudah dikembangkan diantaranya:
Golden Section Search
Metode golden section search digunakan untuk mencari nilai minimum suatu fungsi yang dibatasi dari dua buah nilai, yaitu sebuah selang a dan b. Algoritma untuk teknik ini adalah sebagai berikut:
- Mulai dengan selang [a,b] yang memuat minimum
- Perkecil selang \([a’, b’]\) yang memuat minimum
- Berhenti sampai \(|b’ - a’|\) lebih kecil dari nilai toleransi
Pemilihan nilai \(a'\) dan \(b'\), adalah sebagai berikut
Nilai antara [a,b] memiliki sifat golden ratio
Tentukan \(x_1\) dan \(x_2\)
\(x_1 = b-(b-a)/\mathrm{goldenratio}\)
\(x_2 = a+(b-a)/\mathrm{goldenratio}\)
Hitung \(f(x_1)\) dan \(f(x_2)\)
Jika \(f(x_1) > f(x_2)\) maka \([a’, b’] = [x_1, b]\)
Jika \(f(x_1) < f(x_2)\) maka \([a’, b’] = [a, x_2]\)
Fungsi golden section
golden <- function (f, a, b, tol=0.0000001) {
ratio <- 2 / ( sqrt (5)+1)
x1 <- b-ratio * (b-a)
x2 <- a+ratio * (b-a)
f1 <- f(x1)
f2 <- f(x2)
while ( abs (b-a)>tol){
if (f2>f1){
b <- x2
x2 <- x1
f2 <- f1
x1 <- b-ratio * (b-a)
f1 <- f(x1)
} else {
a <- x1
x1 <- x2
f1 <- f2
x2 <- a+ratio * (b-a)
f2 <- f(x2)
}
}
return ((a+b) / 2)
}
Contoh:
\(\begin{aligned} f(x) = |x -3.5| +(x-2)^2 \end{aligned}\)
# Membuat fungsi f(x)
f <- function(x) {abs(x-3.5)+(x-2)^2}
# Membuat plot
curve(f, 1,5)

# Menghitung nilai optimum
golden(f,1,2)
[1] 2
[1] 2.5
[1] 3
[1] 2.5
Newton Raphson
Jika suatu fungsi memiliki turunan pertama dan kedua, maka nilai minimum dapat menggunakan metode Newton Raphson. Kelebihan metode ini adalah hanya memerlukan satu nilai untuk inisial. Kelemahannya adalah kita harus yakin f(x) memiliki turunan pertama dan turunan kedua. Jika di golden section tidak perlu ada turunan pertama dan turunan kedua.
Fungsi Newton Raphson
newtonr <- function (fx , x0 =1){
fx1 <- deriv (fx ,"x") # turunan pertama
fx2 <- deriv (D(fx ,"x"),"x") # turunan kedua
er <- 1000
while(er > 1e-6){
x <- x0
f1 <- attr ( eval (fx1),"gradient")[1]
f2 <- attr ( eval (fx2),"gradient")[1]
er <- abs(f1) # bisa juga e <- abs (x1 -x0)
x1 <- x0 - f1/f2
x0 <- x1
}
return (x1)
}
Hitung nilai minimum untuk fungsi- fungsi berikut.
\(\begin{aligned} f(x) = 4x^2 - 3x - 7 \end{aligned}\)
fx <- expression(4*x^2-3*x-7)
newtonr(fx,3)
[1] 0.375
\(\begin{aligned} f(x) = e^{-x}+x^4 \end{aligned}\)
fx <- expression(exp(-x)+x^4)
newtonr(fx)
[1] 0.5282519
[1] 0.5282519
\(\begin{aligned} f(x) = x^2 - x \end{aligned}\)
fx <- expression(x^2-x)
newtonr(fx)
[1] 0.5
Fungsi Optimasi Built-in
Algoritma Nelder Mead adalah salah satu metode optimasi untuk fungsi yang memiliki lebih dari satu variabel. R telah menyiapkan fungsi optimasi dengan salah satu algoritmanya adalah Nelder-Mead:
optimize atau optimise untuk menduga parameter/ mencari nilai minimum dari satu peubah
optim untuk lebih dari satu peubah
Fungsi optimize/optimise
\(\begin{aligned} f(x) = \left( x - \frac{1}{3} \right)^2 \end{aligned}\)
f <- function(x) ((x-(1/3))^2) # membuat fungsi tujuan
curve(f)

xmin <- optimize(f, c(0,1), tol = 0.0001) # tolerance optional
xmin
$minimum
[1] 0.3333333
$objective
[1] 0
Fungsi optim
Digunakan untuk mencari nilai minimum dari fungsi yang lebih dari satu peubah. Contoh mencari nilai \(x_1\) dan \(x_2\), yang mebuat \(f(x_1,x_2) = 100(x_2 - x_1^2)^2 + (1-x_1)^2\) minimum
Program yang digunakan:
fr <- function (x){ # tetap dituliskan dalam sebuah vektor, akan diduga x
x1<- x[1]
x2 <- x[2]
100 * (x2-x1^2)^2 + (1-x1)^2 # ini adalah nilai fungsi objetivenya
}
# argumen pertama adalah nilai inisial, karena menduga x vektor berukuran 2 maka dimasukkan nilai inisialnya
optim (c(-1.2,1),fr)
$par
[1] 1.000260 1.000506
$value
[1] 8.825241e-08
$counts
function gradient
195 NA
$convergence
[1] 0
$message
NULL
