Dosen Pengampu : Prof. Dr. Suhartono, M.Kom

Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang

Jurusan : Teknik Informatika

Fakultas : Sains dan Teknologi

Pada dunia nyata, data sering kali tidak tersaji secara lengkap. Seringkali terdapat nilai data yang hilang (missing value). Terdapat banyak penyebab dari kondisi tersebut, baik akibat kesalahan manusianya maupun keterbatasan kemampuan alat ukur.

Kondisi lain yang muncul dari data yang kita miliki adalah adanya outlier atau nilai yang berbeda jauh dengan mayoritas data yang kita miliki. Nilai tersebut akan menentukan hasil analisis atau uji statistik yang kita lakukan, terlebih lagi jika uji statistik yang kita lakukan menggunakan metode parametrik.

Terdapat banyak cara untuk menangani kondisi-kondisi tersebut. Sejumlah peneliti memilih untuk menghapus data tersebut. Hal ini dapat dilakukan jika jumlah data yang kita miliki cukup besar. Bagaimana jika data yang kita miliki sedikit dan pengukuran ulang cukup mahal atau cukup sulit dilakukan?. Salah satu cara yang dapat dilakukan adalah dengan melakukan interpolasi terhadap data.

Interpolasi dan ekstrapolasi adalah proses “menebak” nilai data dengan memperhatikan data lain yang kita miliki. Interpolasi merupakan teknik untuk mencari nilai suatu variabel yang hilang pada rentang data yang diketahui, sedangkan ektrapolasi merupakan teknik menemukan nilai suatu variabel diluar rentang data yang telah diketahui. Data lain yang kita miliki seringkali memiliki sejumlah pola. Pola yang terbentuk dapat berupa polinomial atau mengelompok. Tiap pola akan memiliki metode pendekatan yang berbeda-beda. Terdapat kemungkinan tak terbatas dari pola data tersebut. Penilaian profesional atau ahli diperlukan untuk menentukan metode mana yang sesuai berdasarkan riwayat penelitian atau pekerjaan yang pernah dilakukan sebelumnya.

0.1 Interpolasi Polinomial Pada RStudio

Interpolasi polinomial merupakan teknik interpolasi dengan mengasumsikan pola data yang kita miliki mengikuti pola polinomial baik berderajat satu (linier) maupun berderajat tinggi. Interpolasi dengan metode ini dilakukan dengan terlebih dahulu membentuk persamaan polinomial. Persamaan polinomial yang terbentuk selanjutnya digunakan untuk melakukan interpolasi dari nilai yang diketahui atau ekstrapolasi (prediksi) dari nilai diluar rentang data yang diketahui.

Pada Chapter 8.1 pembahasan akan dibagi menjadi 3 bagian. Bagian pertama kita akan mengulang kembali teknik evaluasi polinomial, sedangkan dua bagian selanjutnya akan membahas teknik interpolasi linier dan polinomial orde tinggi dengan menjadikan pembahasan bagian pertama sebagai dasar pada dua bagian berikutnya.

0.2 1.1 Mengevaluasi Polinomial Pada RStudio

Pada Chapter ini pembaca akan mempelajari teknik untuk melakukan substitusi nilai xx pada persamaan polinomial untuk memperoleh nilai yy. Terdapat berbagai pendekatan dalam melakukan proses tersebut, mulai dari metode naive maupun metode Horner. Kedua metode akan menghasilkan hasil yang sama namun dengan proses komputasi yang berbeda. Metode naive cenderung lambat dalam proses komputasi karena jumlah proses yang dilakukan dalam sekali proses lebih banyak dari pada metode Horner.

Untuk memahami metode-metode evaluasi polinomial yang telah disebutkan tersebut, secara umum persamaan polinomial disajikan pada Persamaan (8.1).

f(x)=anxn+an−1xn−1+⋯+a1x+a0(8.1)(8.1)f(x)=anxn+an−1xn−1+⋯+a1x+a0

dimana aa merupakan koefisien polinomial, xx merupakan variabel, dan nn merupakan indeks dan pangkat polinomial.

Pada metode naive kita melakukan evaluasi polinomial sama dengan cara kita melakukan evaluasi polinomial saat kita SMA. Nilai xx akan disubstitusikan pada masing-masing elemen persamaan polinomial. Masing-masing elemen polinomial selanjutnya dijumkahkan untuk menghitung yy.

Pada R kita dapat menuliskan sebuah fungsi untuk melakukan evaluasi polinomial menggunakan metode naive tersebut. Pada fungsi tersebut, koefisien polinomial akan disimpan kedalam sebuah vektor dengan urutan pengisian mulai dari koefisien dengan pangkat xx terendah ke tertinggi.

naive_poly <- function(x, coeff){
  n <- length(x)
  y <- rep(0, n)
  
  for(i in 1:length(coeff)){
    y <- y + coeff[i]*(x^(i-1))
  }
  
  return(y)
}

Contoh 8.1 Hitung nilai yy pada persamaan f(x)=x4+3x3−15x2−19x+30f(x)=x4+3x3−15x2−19x+30, jika diketahui nilai xx adalah -1, 0, dan 1!

Jawab:

Untuk dapat menghitung nilai yy menggunakan fungsi naive_poly() pada persamaan tersebut dengan nilai xx yang diketahui, kita perlu merubah koefisien persamaan tersebut dan nilai xx yang diketahui menjadi vektor:

x <- c(-1,0,1)
coeff <- c(30,-19,-15,3,1)

Masukkan vektor-vektor yang telah terbentuk tersebut kedalam fungsi naive_poly().

naive_poly(x, coeff)

## [1] 32 30  0
## [1] 32 30  0

Berdasarkan hasil perhitungan diperoleh nilai yy masing-masing sebesar 32, 30, dan 0. Pembaca dapat mengeceknya sendiri hasil perhitungan tersebut menggunakan cara manual.

Kita dapat meningkatkan efisiensi proses perhitungan pada fungsi naive_poly() tersebut. Sebagai contoh, setiap kali kita melakukan loop untuk menghitung nilai yy pada polinomial, kita dapat memperoleh eksponensial dari xx. Namun untuk setiap koefisien aiai, nilai eksponensial yang terkait xixi merupakan seri produk.

xi=i∏j=0x(8.2)(8.2)xi=∏j=0ix

Untuk xixi, terdapat sebanyak ii koefisien xx dikalikan bersamaan. Namun, untuk setiap xi−1xi−1 terdapat lebih sedikit 1 perkalian dibanding koefisien xx dengan pangkat yang lebih besar dan seterusnya.

Berdasarkan ilustrasi tersebut, kita dapat membentuk fungsi better_poly() sebagai perbaikan dari fungsi naive_poly(). Berikut adalah sintaks yang digunakan:

better_poly <- function(x, coeff){
  n <- length(x)
  y <- rep(0, n)
  cached_x <- 1
  
  for(i in 1:length(coeff)){
    y <- y + coeff[i]*cached_x
    cached_x <- cached_x * x
  }
  return(y)
}

Contoh 8.2 Hitung nilai yy pada persamaan yang disajikan pada Contoh 8.1 menggunakan nilai xx yang telah diketahui pada soal tersebut menggunakan fungsi better_poly()?

Jawab:

better_poly(x, coeff)

## [1] 32 30  0
## [1] 32 30  0

Sejauh ini kita telah membentuk 2 fungsi yaitu naive_poly() dan better_poly(). Kedua fungsi tersebut memiliki perbedaan proses menghitung yang mempengaruhi efisiensinya masing-masing. Sebagai contoh jika diberikan polinomial berderajat 10, fungsi naive_poly() akan mengejakan perkalian dalam proses loop sebanyak 55 kali, sedangkan fungsi better_poly() akan melakukannya sebanyak 20 kali (2n2n perkalian).

Metode lain yang lebih efisien dalam melakukan evaluasi polinomial adalah metode Horner. Metode ini oleh William Horner pada abad ke-18. Dalam metode Horner, bentuk polinomial pada Persamaan (8.1) akan ditransformasi menjadi Persamaan (8.3).

f(x)=anxn+an−1xn−1+⋯+a1x+a0=a0+a1x+⋯+an−1xn−1+anxn=a0+x(a1+⋯+an−1xn−2+anxn−1)=a0+x(a1+⋯+x(an−1+x(an))⋯)(8.3)(8.3)f(x)=anxn+an−1xn−1+⋯+a1x+a0=a0+a1x+⋯+an−1xn−1+anxn=a0+x(a1+⋯+an−1xn−2+anxn−1)=a0+x(a1+⋯+x(an−1+x(an))⋯)

Berdasarkan Persamaan (8.3), jika kita melakukan perhitungan pada persamaan polinomial berderajat 10, kita dapat mereduksi perhitungan menjadi 10 perkalian dan 10 penjumlahan. Jumlah tersebut sangat kecil dibandingkan kedua metode sebelumnya dan dapat dikatakan lebih efisien dibandingkan metode lainnya.

FUngsi horner_poly() merupakan fungsi yang dibentuk bedasarkan Persamaan (8.3). Sintaks fungsi tersebut adalah sebagai berikut:

horner_poly <- function(x, coeff){
  n <- length(x)
  y <- rep(0, n)
  
  for(i in length(coeff):1){
    y <- coeff[i] + x * y
  }
  return(y)
}

0.2.1 Contoh 8.3 Kerjakan kembali Contoh 8.2 fungsi horner_poly()?

Jawab:

horner_poly(x, coeff)

## [1] 32 30  0
## [1] 32 30  0

0.3 1.2 Interpolasi Linier

Misalkan kita memiliki 3 buah data dengan dua buah variabel kita misalkan variabel xx dan variabel yy. Pada salah satu data terdapat data yang hilang pada. Agar ketiga data tersebut tetap dapat digunakan dalam iterasi diperlukan interpolasi untuk “menebak” nilai dari data yang hilang.

Berdasarkan pengukuran yang sebelumnya pernah dilakukan diketahui bahwa pola data yang terbentuk variabel xx dan yy divisualisasikan menggunakan scatterplot adalah pola linier. Berdasarkan hal tersebut interpolasi dilakukan dengan menggunakan metode linier.

Interpolasi linier dilakukan dengan terlebih dahulu membentuk fungsi linier. Dengan kata lain kita perlu mencari nilai slope mm dan intercept bb. Nilai mm dihitung sebagai rasio selisih jarak dua titik pada sumbu yy dan sumbu xx yang dapat dituliskan melalui Persamaan (8.4).

m=y2−y1x2−x1(8.4)(8.4)m=y2−y1x2−x1

Nilai intercept (titik potong pada sumbu yy) dihitung menggunakan Persamaan (8.5).

b=y2−mx2(8.5)(8.5)b=y2−mx2

Algoritma Interpolasi Linier

  1. Tentukan dua buah titik (x,y)(x,y) sebagai dasar pembentukan persaman linier.

  2. Hitung mm menggunakan Persamaan (8.4)

  3. Hitung bb menggunakan Persamaan (8.5)

  4. Definiskan fungsi linier berdasarkan nilai mm dan bb

  5. Hitung yy dengan cara substitusi nilai xx pada persamaan linier untuk melakukan interpolasi atau ekstrapolasi nilai yy yang ingin dicari.

Algoritma poin 1 sampai 4 tersebut, kita dapat membentuk fungsi pembentuk persamaan linier dari 2 titik yang diketahui. Fungsi tersebut disajikan pada sintaks berikut:

linear_inter <- function(x, y){
  m <- (y[2]-y[1]) / (x[2]-x[1])
  b <- y[2] - m*x[2]
  
  return(c(b, m))
}

Contoh 8.4 Diketahui koordinat 2 buah titik yaitu (0,-1) dan (2,3). Jika diketahui titik ketiga memiliki koordinat sumbu xx sebesar 1. Lakukan interpolasi untuk menentukan koordinat sumbu yy titik ketiga tersebut!

Jawab:

Berdasarkan data-data yang terdapat pada soal terserbut, kita dapat menghitung nilai mm dan bb. Nilai mm dapat dihitung sebagai berikut:

m=−1−30−2=2m=−1−30−2=2

Dengan menggunakan nilai mm tersebut kita dapat menghitung nilai bb.

b=3−2∗3=−1b=3−2∗3=−1

Berdasarkan hasil perhitungan diperoleh persamaan linier yang terbentuk adalah sebagai berikut:

y=2x−1y=2x−1

Berdasarkan persamaan linier tersebut nilai yy dapat dihitung.

y=2∗1−1=1y=2∗1−1=1

Kita dapat pula membentuk persamaan linier menggunakan fungsi linear_inter(). Berikut adalah sintaks yang digunakan:

x <- c(0,2)
y <- c(-1,3)

(coeff <- linear_inter(x,y))

## [1] -1  2
## [1] -1  2

Setelah diperoleh koefisien persamaan linier berdasarkan dua titik tersebut, kita akan menggunakan fungsi horner_poly() untuk memperoleh nilai yy. Berikut adalah sintaks yang digunakan:

horner_poly(1, coeff)

## [1] 1
## [1] 1

Hasil interpolasi yang diperoleh dapat dikatakan sesuai dengan lokasi kedua titik data yang ditunjukkan pada Gambar 8.1. Berdasarkan hal tersebut, kita dapat yakin bahwa hasil interpolasi yang telah kita lakukan telah sesuai.

Hasil interpolasi yang diperoleh dapat dikatakan sesuai dengan lokasi kedua titik data yang ditunjukkan pada Gambar 8.1. Berdasarkan hal tersebut, kita dapat yakin bahwa hasil interpolasi yang telah kita lakukan telah sesuai.

Contoh 8.6 Dengan menggunakan data pada Contoh 8.4, lakukan proses perhitungan untuk membentuk persamaan polinomial menggunakan fungsi poly_inter()

Jawab:

Berdasarkan data pada Contoh 8.4, polinomial yang terbentuk merupakan polinomial derajat 1 (linier). Berikut adalah nilai koefisien yang dihasilkan dari perhitungan menggunakan fungsi poly_inter().

x <- c(2, 0)
y <- c(3, -1)
poly_inter(x, y)

## [1] -1  2

Meskipun proses perhitungan menggunakan fungsi poly_inter() lebih rumit dibandingkan dengan fungsi linear_poly(), hasil perhitungan keduanya menggunakan data pada Contoh 8.4 menghasilkan hasil yang sama.