ALGORITMA & STRUKTUR DATA

~ Pengenalan Dasar R dan Python ~

Nb: Untuk segala bentuk diskusi, kritik dan saran mengenai materi silahkan hubungi admin!


Kontak Konsultasi & Diskusi ke : \(\downarrow\)
Email
Instagram https://www.instagram.com/dsciencelabs/
RPubs https://rpubs.com/dsciencelabs/
Github https://github.com/dsciencelabs/
Telegram @dsciencelabs

R Vs Python

R dan Python adalah bahasa pemrograman yang sangat populer, dinamis, digunakan secara luas dalam komunitas data science. R lebih banyak digunakan dalam analisis statistik sementara Python menyediakan pendekatan yang lebih umum mengenai sains data (sehingga dianggap lebih mudah untuk digunakan oleh pemula). Mempelajari kedua bahasa pemrograman ini adalah solusi yang lebih bijak karena keduanya mempunyai kelebihan dan kekurangan masing-masing. R dan Python membutuhkan investasi waktu, latihan dengan tutorial, dan melakukan projek-projek kecil berbasis LAB hingga penerapan sais data pada kasus-kasus yang sebenarnya.

Persamaan

  • R dan Python adalah bahasa pemrograman multi-paradigma. Keduanya mendukung Pemrograman Berorientasi Objek, Pemrograman Imperatif, Pemrograman Prosedural, dll.
  • Keduanya adalah bahasa yang ditafsirkan.
  • Keduanya dapat digunakan untuk mengembangkan algoritme.
  • Keduanya adalah bahasa pemrograman tingkat tinggi.
  • Keduanya gratis dan open source.
  • Keduanya dapat diintegrasikan dengan aplikasi lain seperti MySQL, Oracle, GitHub, dll.
  • Keduanya mendukung file yang berbeda seperti file CSV, file excel, file XML dan file JSON.
  • Kedua bahasa tersebut mudah digunakan dan dipelajari.

Perbedaan

Berikut adalah tabel yang secara ringkas membandingkan dua bahasa pemrograman Python dan R:

Kriteria R Python
Ruang lingkup Data science dan statistik Aplikasi dan industri
Pengguna Akademisi dan peneliti Programmers & developers
IDE (user interface) RStudio Spyder, Jupyter Notebook, Pycharm, dll
Ekstensi .R dan .Rmd .py dan .ipynb
Struktur data vektor, list, matriks, array, faktor, dan bingkai data list, dictionary, dan tupel
Packages dan library tidyverse, ggplot2, caret, zoo pandas, scipy, scikit-learn, TensorFlow, caret
Kelebihan memiliki lebih banyak library dan kualitas visualisasi grafik yang dihasilkan sangat tinggi sistematika penulisan script yang mudah dibaca, fokus pada kecepatan komputasi, pengembangan web, jaringan, otomatisasi, dll
Kekurangan Ketergantungan antar library library lebih sedikit dibanding R
Integrasi fitur RMarkdown dan Shiny integrasi aplikasi lebih luas

Catatan: Saya mengasumsikan R/Rstudio and Python/Anaconda sudah ter-install pada Komputer/Laptop Anda. Selanjutnya, anda dapat menggunakan RStudio dan Anaconda dalam pengenalan dasar-dasar R dan Pyton yang dibagi menjadi sub-topik dalam artikel (materi) ini.


Sintaks Dasar

Suatu program di R dan Python terdiri dari tiga hal mendasar: Variabel, operan (nilai) dan Komentar. Variabel digunakan untuk menyimpan suatu nilai, sedangkan Komentar digunakan untuk meningkatkan pemahaman pengguna mengenai skrip atau koding.

Penugasan Variabel

R

Dalam R, penugasan suatu program biasanya menggunakan suatu variabel yang dicadangkan untuk dapat merekam berbagai jenis data sesuai nama yang diberikan ke lokasi penyimpanan/memori. Perintah penugasan variabel ini, dapat dinotasikan dengan tiga cara:

  • = , digunakan untuk penugasan sederhana
  • <-, digunakan untuk penugasan dari sisi Kiri
  • ->, digunakan untuk penugasan dari sisi Kanan
x = 2
y <- 3 
5 -> z 
print(c(x,y,z))
## [1] 2 3 5

Python

Untuk menjalankan Python dengan Rstudio, install-lah Anaconda pada PC anda dengan baik, dan jangan lupa melakukan upgrade python tersebut menggukan CMD.exe pada anaconda navigator dengan menjalankan koding berikut:

conda update --all
conda create -n py38 python=3.8
conda activate py38

Kemudian jalankan koding berikut:

library(reticulate)
library(Rcpp)
# conda_list()
use_condaenv("py38", required = TRUE)

Setelah itu, anda dapan menjalankan koding python pada Rstudio dengan mengganti ```{r} menjadi ```{python} pada chunck Rmd anda, dan jalankan koding berikut:

x = 2
y = 3 
z = 5 
print(x,y,z)
## 2 3 5

Selain menyimpan atau pengisian nilai, ada juga menjumlahkan, mengurangi, perkalian, pembagian, dsb.

Operator Simbol
Penjumlahan +=
Pengurangan -=
Perkalian *=
Pembagian /=
Sisa Bagi %=
Pemangkatan **=

Perhatikan contoh berikut:

x += 2
print(x)
## 4

Menambahkan Komentar

Menambahkan/Memberikan komentar dalam skrip/koding R dan Python adalah untuk memudahkan anda memahami arti/makna penggunaan suatu perintah/program. Komentar yang ditulis dalam sebuah program tersebut hanya bersifat penjelasan tentang apa yang dilakukannya atau apa yang seharusnya dilakukan oleh sebuah skrip/koding. Perlu dicatat bahwa komentar yang bersifat informasi tidak ada hubungannya dengan logika pemrogaram yang sedang anda gunakan. Mereka benar-benar diabaikan oleh kompiler dan dengan demikian tidak pernah tercermin pada input. Biasanya komentar dituliskan pada satu baris yang tersedia di R dan Python, dengan menggunakan # di awal maupun di akhir pernyataan.

R

# Mengganti nilai x yang sudah direkam (Komentar di awal pernyataan) 
x=12  
z <- x + y   # Mengganti nilai z yang sudah direkam (Komentar di akhir pernyataan) 
x + y -> z   # sama dengan diatas

Python

# Mengganti nilai x yang sudah direkam (Komentar di awal pernyataan) 
x=12 
z = x + y   # Mengganti nilai z yang sudah direkam (Komentar di akhir pernyataan) 

Operator

Operator adalah simbol yang mengarahkan compiler untuk melakukan berbagai macam operasi terhadap beberapa penugasan. Operator mensimulasikan berbagai operasi matematis, logika, dan keputusan yang dilakukan pada sekumpulan Bilangan Kompleks, Integer, dan Numerik sebagai penugasan masukan (input). R dan Python mendukung sebagian besar empat jenis operator biner antara satu set penugasan. Dalam ini, kita akan melihat berbagai jenis operator yang tersedia di R dan Python dan penggunaannya.

Aritmatika

Penggunaan operator aritmatika dalam program R dan Python adalah untuk mensimulasikan berbagai operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian, dan modulo. Operator aritmatika yang dilakukan bisa saja berupa nilai skalar, bilangan kompleks, atau vektor.

Operator R Python
Penjumlahan + +
Pengurangan - -
Perkalian * *
Divisi/Pembagian / /
Pemangkatan ^ * *
Modulo %% %

R

Untuk pemahaman lebih lanjut, perhatikan cuplikan R berikut:

x <- c(2,3,5)    # memuat vektor x
y <- c(2,4,6)    # memuat vektor y
x+y              # hasil penjumahan vektor x dan y
## [1]  4  7 11
print (x+y)      # hasil penjumahan vektor x dan y
## [1]  4  7 11
print (x-y)      # hasil pengurangan vektor x dan y
## [1]  0 -1 -1
print (x*y)      # hasil perkalian vektor x dan y
## [1]  4 12 30
print (x/y)      # hasil pembagian vektor x dan y
## [1] 1.0000000 0.7500000 0.8333333
print (x^y)      # hasil pemangkatan vektor x dan y
## [1]     4    81 15625
print (x%%y)     # hasil modulo vektor x dan y
## [1] 0 3 5

Adakalanya anda perlu menampilkan keterangan/komentar yang juga melekat pada hasil perhitungan R itu sendiri. Maka anda dapat melakukannya dengan cara berikut:

cat("Penjumahan vektor x dan y :", x + y, "\n")
## Penjumahan vektor x dan y : 4 7 11
cat("Pengurangan vektor x dan y :", x - y, "\n")
## Pengurangan vektor x dan y : 0 -1 -1
cat("Perkalian vektor x dan y :", x * y, "\n")
## Perkalian vektor x dan y : 4 12 30
cat("Pembagian vektor x dan y :", x / y, "\n")
## Pembagian vektor x dan y : 1 0.75 0.8333333
cat ("Pemangkatan vektor x dan y :", x ^ y) 
## Pemangkatan vektor x dan y : 4 81 15625
cat("Modulo vektor x dan y :", x %% y, "\n")
## Modulo vektor x dan y : 0 3 5

Catatan: Penjelasan lebih lekap mengenai modulo dapat lihat pada link ini

Python

Untuk pemahaman lebih lanjut, perhatikan cuplikan Python berikut.

Catatan: Terlebih dahulu install numpy di Anaconda Navgator anda dengan cara membuka lingkungan (environment) py38 yang sudah anda buatkan sebelumnya.

import numpy as np      # fungsi untuk operasi pada Array
x = np.array([2,3,5])   # memuat vektor x
y = np.array([2,4,6])   # memuat vektor y
x+y                     # hasil penjumahan vektor x dan y
## array([ 4,  7, 11])
print (x+y)             # hasil penjumahan vektor x dan y
## [ 4  7 11]
print (x-y)             # hasil pengurangan vektor x dan y
## [ 0 -1 -1]
print (x*y)             # hasil perkalian vektor x dan y
## [ 4 12 30]
print (x/y)             # hasil pembagian vektor x dan y
## [1.         0.75       0.83333333]
print (x**y)            # hasil pemangkatan vektor x dan y
## [    4    81 15625]
print (x%y)             # hasil modulo (Sisa bagi) vektor x dan y
## [0 3 5]

Adakalanya anda perlu menampilkan keterangan/komentar yang juga melekat pada hasil perhitungan R itu sendiri. Maka anda dapat melakukannya dengan cara berikut:

print("Penjumahan vektor x dan y :", x + y, "\n")
## Penjumahan vektor x dan y : [ 4  7 11]
print("Pengurangan vektor x dan y :", x - y, "\n")
## Pengurangan vektor x dan y : [ 0 -1 -1]
print("Perkalian vektor x dan y :", x * y, "\n")
## Perkalian vektor x dan y : [ 4 12 30]
print("Pembagian vektor x dan y :", x / y, "\n")
## Pembagian vektor x dan y : [1.         0.75       0.83333333]
print("Pemangkatan vektor x dan y :", x ** y) 
## Pemangkatan vektor x dan y : [    4    81 15625]
print("Modulo vektor x dan y :", x % y, "\n")
## Modulo vektor x dan y : [0 3 5]

Catatan: Penjelasan lebih lekap mengenai modulo dapat lihat pada link ini

Relasional

Operator relasional melakukan operasi perbandingan antara elemen yang bersesuaian pada setiap operan. Mengembalikan nilai Boolean TRUE jika operan pertama memenuhi relasi dibandingkan dengan operan kedua. Nilai TRUE selalu dianggap lebih besar dari FALSE.

Operator R Python Keterangan
Kurang dari < < Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama lebih kecil dari operan kedua. Selain itu akan mengembalikan FALSE
Kurang dari sama dengan <= <= Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama kurang dari atau sama dengan elemen operan kedua. Selain itu akan mengembalikan FALSE
Lebih besar dari > > Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama lebih besar dari operan kedua. Selain itu akan mengembalikan FALSE
Lebih besar dari sama dengan >= >= Mengembalikan BENAR jika elemen yang bersesuaian pada operan pertama lebih besar atau sama dengan dari operan kedua. Selain itu akan mengembalikan FALSE
Sama Dengan == == Mengembalikan BENAR jika dan hanya jika kedua sisi bernilai sama
Tidak Sama dengan != != Mengembalikan BENAR jika elemen yang bersesuaian pada operan pertama tidak sama dengan dari operan kedua

R

x <- c(2,3,5)    # memuat vektor x
y <- c(2,4,6)    # memuat vektor y
cat("Vektor x  kurang dari Vektor y:", x < y, "\n")
## Vektor x  kurang dari Vektor y: FALSE TRUE TRUE
cat("Vector x kurang dari sama dengan Vector y:", x <= y, "\n")
## Vector x kurang dari sama dengan Vector y: TRUE TRUE TRUE
cat("Vector x lebih besar dari Vector y :", x > y, "\n")
## Vector x lebih besar dari Vector y : FALSE FALSE FALSE
cat("Vector x lebih besar dari sama dengan Vector y :", x >= y, "\n")
## Vector x lebih besar dari sama dengan Vector y : TRUE FALSE FALSE
cat("Vector x sama dengan Vector y:", x == y,"\n") 
## Vector x sama dengan Vector y: TRUE FALSE FALSE
cat("Vector x tidak sama dengan Vector y:", x != y) 
## Vector x tidak sama dengan Vector y: FALSE TRUE TRUE

Python

import numpy as np    # fungsi untuk operasi pada Array
x = np.array([2,3,5]) # memuat vektor x
y = np.array([2,4,6]) # memuat vektor y
print("Vektor x  kurang dari Vektor y:", x < y, "\n")
## Vektor x  kurang dari Vektor y: [False  True  True]
print("Vector x kurang dari sama dengan Vector y:", x <= y, "\n")
## Vector x kurang dari sama dengan Vector y: [ True  True  True]
print("Vector x lebih besar dari Vector y :", x > y, "\n")
## Vector x lebih besar dari Vector y : [False False False]
print("Vector x lebih besar dari sama dengan Vector y :", x >= y, "\n")
## Vector x lebih besar dari sama dengan Vector y : [ True False False]
print("Vector x sama dengan Vector y:", x == y,"\n") 
## Vector x sama dengan Vector y: [ True False False]
print("Vector x tidak sama dengan Vector y:", x != y) 
## Vector x tidak sama dengan Vector y: [False  True  True]

Logika

Operator logis mensimulasikan operasi keputusan, berdasarkan operator yang ditentukan antara operan, yang kemudian dievaluasi ke nilai Boolean Benar atau Salah. Nilai bilangan bulat bukan nol dianggap sebagai nilai BENAR, baik itu bilangan kompleks atau bilangan real.

Operator R Python Keterangan
NOT ! ! Operasi negasi/kebalikan pada status elemen operan
AND & & Mengembalikan TRUE jika kedua operan bernilai Benar
OR \(|\) \(|\) Mengembalikan TRUE jika salah satu operan adalah Benar
XOR ^ ^ Mengembalikan TRUE jika salah satu dari kedua elemen pertama operan bernilai Benar

R

x <- c(0,TRUE,FALSE)
y <- c(TRUE,0.1,4+3i)
 
# Melakukan operasi logika pada Operan
cat("Logika Negasi (~) untuk vektor x:", !x, "\n") 
## Logika Negasi (~) untuk vektor x: TRUE FALSE TRUE
cat("Logika Negasi (~) untuk vektor y :", !y, "\n") 
## Logika Negasi (~) untuk vektor y : FALSE FALSE FALSE
cat ("Logika Konjungsi (Dan) :", x & y, "\n")
## Logika Konjungsi (Dan) : FALSE TRUE FALSE
cat ("Logika Disjungsi (Atau) :", x | y, "\n")
## Logika Disjungsi (Atau) : TRUE TRUE TRUE
cat("Logika Disjungsi Parsial :", x || y)
## Logika Disjungsi Parsial : TRUE

Python

import numpy as np                # fungsi untuk operasi pada Array
x = np.array([False,True,False])  # memuat vektor x
y = np.array([True,True,False])   # memuat vektor y
 
# Melakukan operasi logika pada Operan
print("Logika Negasi (~) untuk vektor x:", ~x, "\n") 
## Logika Negasi (~) untuk vektor x: [ True False  True]
print("Logika Negasi (~) untuk vektor y :", ~y, "\n") 
## Logika Negasi (~) untuk vektor y : [False False  True]
print("Logika Konjungsi (Dan) :", x & y, "\n")
## Logika Konjungsi (Dan) : [False  True False]
print("Logika Disjungsi (Atau) :", x | y, "\n")
## Logika Disjungsi (Atau) : [ True  True False]
print("Logika Disjungsi Parsial :", x ^ y)
## Logika Disjungsi Parsial : [ True False False]

Catatan: Dalam R, data yang bernilai numerik kecuali nol dianggap TRUE dan yang lainnya adalah FALSE. Sedangkan dalam Python, hanya menggunakan True dan False.

Lain-lain

R

Berikut ini juga ada beberapa operator yang kemungkinan besar juga akan anda perlukan pada saat akan menggunakan R.

x <- c(2,3,5)                          # memuat vektor x
y <- c(2,4,6)                          # memuat vektor y
sqrt(x*y)                              # Bentuk akar
## [1] 2.000000 3.464102 5.477226
log(x)                                 # logaritma 
## [1] 0.6931472 1.0986123 1.6094379
exp(y)                                 # eksponen
## [1]   7.389056  54.598150 403.428793
(x/y) + y                              # Tanda kurung
## [1] 3.000000 4.750000 6.833333

Catatan: Sifat Komutatif Asosiatif dan Distributif juga berlaku dalam program R.

Python

Berikut ini juga ada beberapa operator yang kemungkinan besar juga akan anda perlukan pada saat akan menggunakan R.

import numpy as np            # library untuk memuat vektor (array)
x = 2                         # memuat vektor x
y = 3                         # memuat vektor y
from math import log,exp,sqrt # mengambil beberapa fungsi dari library `math`
sqrt(x*y)                     # Bentuk akar
## 2.449489742783178
log(x)                        # logaritma 
## 0.6931471805599453
exp(y)                        # eksponen
## 20.085536923187668
(x/y) + y                     # Tanda kurung
## 3.6666666666666665
import numpy as np      # library untuk memuat vektor (array)
x = np.array([2,3,5])   # memuat vektor x
y = np.array([2,4,6])   # memuat vektor y
np.sqrt(x*y)            # Bentuk akar
## array([2.        , 3.46410162, 5.47722558])
np.log(x)               # logaritma 
## array([0.69314718, 1.09861229, 1.60943791])
np.exp(y)               # eksponen
## array([  7.3890561 ,  54.59815003, 403.42879349])
(x/y) + y               # Tanda kurung
## array([3.        , 4.75      , 6.83333333])

Catatan: Sifat Komutatif Asosiatif dan Distributif juga berlaku dalam program R.

Tipe Data

Dalam pemrograman seperti R dan Python, tipe data merupakan konsep penting. Keduanya dapat menggunakan variabel untuk menyimpan tipe yang berbeda-beda, berikut adalah tipe data paling mendasar yang harus diketahui:

Tipe Data R Python Penjelasan
Double/Float 5.6 5.6 Bilangan yang mempunyai koma
Integer 5 5 Bilangan bulat 1,2,…,n
Bolean/Logical TRUE/FALSE True/False Benar bernilai 1 dan Salah bernilai 0
String/Character ‘Dsciencelabs’ ‘Dsciencelabs’ karakter/kalimat bisa berupa huruf angka, dll (diapit tanda " atau ’)
Complex 1 + 5i 1 + 5j Pasangan angka real dan imajiner

R

Berikut ini adalah koding R yang dapat digunakan untuk menetapkan kelima tipe data diatas:

d1 = 5.6                # Tetapkan nilai desimal 
d2 = as.integer(5)      # tetapkan nilai integer
d2 = 5L                 # cara lain untuk memuat nilai integer di R
d3 = c(TRUE,FALSE)      # Bolean/Logical
d3 = as.logical(c(0,1)) # cara lain untuk memuat Bolean/Logical
d4 = c("a",'b','123')   # String/Character
d5 = 1 + 5i             # Complex 

Untuk memeriksa tipe data dalam R:

class(d1)            # cetak nama kelas variabel
## [1] "numeric"
typeof(d1)           # cetak tipe variabel x
## [1] "double"

Python

Berikut ini adalah koding Python yang dapat digunakan untuk menetapkan kelima tipe data diatas:

d1 = 5.6             # Tetapkan nilai desimal 
d2 = 5               # tetapkan nilai integer
d3 = [True,False]    # list Bolean/Logical
d4 = ["a",'b','123'] # list String/Character
d5 = 1 + 5j          # Complex 

Untuk memeriksa tipe data dalam Python:

type(d5)             # cetak tipe variabel x
## <class 'complex'>

Bantuan

R

Salah satu bagian terpenting dalam bekerja dengan bahasa R adalah mengetahui di mana mencari bantuan. R memiliki beberapa fasilitas in-line, selain berbagai sumber daya bantuan di ekosistem R. Anda dapat menggunakan bantuan untuk fungsi tertentu.

help.start()         # menu di mana Anda dapat menavigasi bantuan lokal berbasis web
?help                # menu di mana Anda dapat menavigasi bantuan lokal berbasis web 
?class               # mendapatkan bantuan untuk fungsi `class`
help(class)          # mendapatkan bantuan untuk fungsi `class`
??class              # jika Anda tidak tahu nama fungsi yang Anda cari
help.search('class') # jika Anda tidak tahu nama fungsi yang Anda cari

Python

help(print)
## Help on built-in function print in module builtins:
## 
## print(...)
##     print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
##     
##     Prints the values to a stream, or to sys.stdout by default.
##     Optional keyword arguments:
##     file:  a file-like object (stream); defaults to the current sys.stdout.
##     sep:   string inserted between values, default a space.
##     end:   string appended after the last value, default a newline.
##     flush: whether to forcibly flush the stream.