ALGORITMA & STRUKTUR DATA
~ Pengenalan Dasar R dan Python ~
Nb: Untuk segala bentuk diskusi, kritik dan saran mengenai materi silahkan hubungi admin!
Kontak | Konsultasi & Diskusi ke : \(\downarrow\) |
dsciencelabs@outlook.com | |
https://www.instagram.com/dsciencelabs/ | |
RPubs | https://rpubs.com/dsciencelabs/ |
Github | https://github.com/dsciencelabs/ |
Telegram | @dsciencelabs |
R Vs Python
R dan Python adalah bahasa pemrograman yang sangat populer, dinamis, digunakan secara luas dalam komunitas data science. R lebih banyak digunakan dalam analisis statistik sementara Python menyediakan pendekatan yang lebih umum mengenai sains data (sehingga dianggap lebih mudah untuk digunakan oleh pemula). Mempelajari kedua bahasa pemrograman ini adalah solusi yang lebih bijak karena keduanya mempunyai kelebihan dan kekurangan masing-masing. R dan Python membutuhkan investasi waktu, latihan dengan tutorial, dan melakukan projek-projek kecil berbasis LAB hingga penerapan sais data pada kasus-kasus yang sebenarnya.
Persamaan
- R dan Python adalah bahasa pemrograman multi-paradigma. Keduanya mendukung Pemrograman Berorientasi Objek, Pemrograman Imperatif, Pemrograman Prosedural, dll.
- Keduanya adalah bahasa yang ditafsirkan.
- Keduanya dapat digunakan untuk mengembangkan algoritme.
- Keduanya adalah bahasa pemrograman tingkat tinggi.
- Keduanya gratis dan open source.
- Keduanya dapat diintegrasikan dengan aplikasi lain seperti MySQL, Oracle, GitHub, dll.
- Keduanya mendukung file yang berbeda seperti file CSV, file excel, file XML dan file JSON.
- Kedua bahasa tersebut mudah digunakan dan dipelajari.
Perbedaan
Berikut adalah tabel yang secara ringkas membandingkan dua bahasa pemrograman Python dan R:
Kriteria | R | Python |
Ruang lingkup | Data science dan statistik | Aplikasi dan industri |
Pengguna | Akademisi dan peneliti | Programmers & developers |
IDE (user interface) | RStudio | Spyder, Jupyter Notebook, Pycharm, dll |
Ekstensi | .R dan .Rmd |
.py dan .ipynb |
Struktur data | vektor, list, matriks, array, faktor, dan bingkai data | list, dictionary, dan tupel |
Packages dan library | tidyverse, ggplot2, caret, zoo | pandas, scipy, scikit-learn, TensorFlow, caret |
Kelebihan | memiliki lebih banyak library dan kualitas visualisasi grafik yang dihasilkan sangat tinggi | sistematika penulisan script yang mudah dibaca, fokus pada kecepatan komputasi, pengembangan web, jaringan, otomatisasi, dll |
Kekurangan | Ketergantungan antar library | library lebih sedikit dibanding R |
Integrasi | fitur RMarkdown dan Shiny | integrasi aplikasi lebih luas |
Catatan: Saya mengasumsikan R/Rstudio and Python/Anaconda sudah ter-install pada Komputer/Laptop Anda. Selanjutnya, anda dapat menggunakan RStudio dan Anaconda dalam pengenalan dasar-dasar R dan Pyton yang dibagi menjadi sub-topik dalam artikel (materi) ini.
Sintaks Dasar
Suatu program di R dan Python terdiri dari tiga hal mendasar: Variabel, operan (nilai) dan Komentar. Variabel digunakan untuk menyimpan suatu nilai, sedangkan Komentar digunakan untuk meningkatkan pemahaman pengguna mengenai skrip atau koding.
Penugasan Variabel
R
Dalam R, penugasan suatu program biasanya menggunakan suatu variabel yang dicadangkan untuk dapat merekam berbagai jenis data sesuai nama yang diberikan ke lokasi penyimpanan/memori. Perintah penugasan variabel ini, dapat dinotasikan dengan tiga cara:
=
, digunakan untuk penugasan sederhana<-
, digunakan untuk penugasan dari sisi Kiri->
, digunakan untuk penugasan dari sisi Kanan
= 2
x <- 3
y 5 -> z
print(c(x,y,z))
## [1] 2 3 5
Python
Untuk menjalankan Python dengan Rstudio, install-lah Anaconda pada PC anda dengan baik, dan jangan lupa melakukan upgrade python tersebut menggukan CMD.exe pada anaconda navigator dengan menjalankan koding berikut:
conda update --all
conda create -n py38 python=3.8
conda activate py38
Kemudian jalankan koding berikut:
library(reticulate)
library(Rcpp)
# conda_list()
use_condaenv("py38", required = TRUE)
Setelah itu, anda dapan menjalankan koding python pada Rstudio dengan mengganti ```{r} menjadi ```{python} pada chunck Rmd anda, dan jalankan koding berikut:
= 2
x = 3
y = 5
z print(x,y,z)
## 2 3 5
Selain menyimpan atau pengisian nilai, ada juga menjumlahkan, mengurangi, perkalian, pembagian, dsb.
Operator | Simbol |
Penjumlahan | += |
Pengurangan | -= |
Perkalian | *= |
Pembagian | /= |
Sisa Bagi | %= |
Pemangkatan **= |
Perhatikan contoh berikut:
+= 2
x print(x)
## 4
Menambahkan Komentar
Menambahkan/Memberikan komentar dalam skrip/koding R dan Python adalah untuk memudahkan anda memahami arti/makna penggunaan suatu perintah/program. Komentar yang ditulis dalam sebuah program tersebut hanya bersifat penjelasan tentang apa yang dilakukannya atau apa yang seharusnya dilakukan oleh sebuah skrip/koding. Perlu dicatat bahwa komentar yang bersifat informasi tidak ada hubungannya dengan logika pemrogaram yang sedang anda gunakan. Mereka benar-benar diabaikan oleh kompiler dan dengan demikian tidak pernah tercermin pada input. Biasanya komentar dituliskan pada satu baris yang tersedia di R dan Python, dengan menggunakan #
di awal maupun di akhir pernyataan.
R
# Mengganti nilai x yang sudah direkam (Komentar di awal pernyataan)
=12
x<- x + y # Mengganti nilai z yang sudah direkam (Komentar di akhir pernyataan)
z + y -> z # sama dengan diatas x
Python
# Mengganti nilai x yang sudah direkam (Komentar di awal pernyataan)
=12
x= x + y # Mengganti nilai z yang sudah direkam (Komentar di akhir pernyataan) z
Operator
Operator adalah simbol yang mengarahkan compiler untuk melakukan berbagai macam operasi terhadap beberapa penugasan. Operator mensimulasikan berbagai operasi matematis, logika, dan keputusan yang dilakukan pada sekumpulan Bilangan Kompleks, Integer, dan Numerik sebagai penugasan masukan (input). R dan Python mendukung sebagian besar empat jenis operator biner antara satu set penugasan. Dalam ini, kita akan melihat berbagai jenis operator yang tersedia di R dan Python dan penggunaannya.
Aritmatika
Penggunaan operator aritmatika dalam program R dan Python adalah untuk mensimulasikan berbagai operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian, dan modulo. Operator aritmatika yang dilakukan bisa saja berupa nilai skalar, bilangan kompleks, atau vektor.
Operator | R | Python |
Penjumlahan | + | + |
Pengurangan | - | - |
Perkalian | * | * |
Divisi/Pembagian | / | / |
Pemangkatan | ^ | * * |
Modulo | %% | % |
R
Untuk pemahaman lebih lanjut, perhatikan cuplikan R berikut:
<- c(2,3,5) # memuat vektor x
x <- c(2,4,6) # memuat vektor y
y +y # hasil penjumahan vektor x dan y x
## [1] 4 7 11
print (x+y) # hasil penjumahan vektor x dan y
## [1] 4 7 11
print (x-y) # hasil pengurangan vektor x dan y
## [1] 0 -1 -1
print (x*y) # hasil perkalian vektor x dan y
## [1] 4 12 30
print (x/y) # hasil pembagian vektor x dan y
## [1] 1.0000000 0.7500000 0.8333333
print (x^y) # hasil pemangkatan vektor x dan y
## [1] 4 81 15625
print (x%%y) # hasil modulo vektor x dan y
## [1] 0 3 5
Adakalanya anda perlu menampilkan keterangan/komentar yang juga melekat pada hasil perhitungan R itu sendiri. Maka anda dapat melakukannya dengan cara berikut:
cat("Penjumahan vektor x dan y :", x + y, "\n")
## Penjumahan vektor x dan y : 4 7 11
cat("Pengurangan vektor x dan y :", x - y, "\n")
## Pengurangan vektor x dan y : 0 -1 -1
cat("Perkalian vektor x dan y :", x * y, "\n")
## Perkalian vektor x dan y : 4 12 30
cat("Pembagian vektor x dan y :", x / y, "\n")
## Pembagian vektor x dan y : 1 0.75 0.8333333
cat ("Pemangkatan vektor x dan y :", x ^ y)
## Pemangkatan vektor x dan y : 4 81 15625
cat("Modulo vektor x dan y :", x %% y, "\n")
## Modulo vektor x dan y : 0 3 5
Catatan: Penjelasan lebih lekap mengenai modulo dapat lihat pada link ini
Python
Untuk pemahaman lebih lanjut, perhatikan cuplikan Python berikut.
Catatan: Terlebih dahulu install numpy
di Anaconda Navgator anda dengan cara membuka lingkungan (environment) py38
yang sudah anda buatkan sebelumnya.
import numpy as np # fungsi untuk operasi pada Array
= np.array([2,3,5]) # memuat vektor x
x = np.array([2,4,6]) # memuat vektor y
y +y # hasil penjumahan vektor x dan y x
## array([ 4, 7, 11])
print (x+y) # hasil penjumahan vektor x dan y
## [ 4 7 11]
print (x-y) # hasil pengurangan vektor x dan y
## [ 0 -1 -1]
print (x*y) # hasil perkalian vektor x dan y
## [ 4 12 30]
print (x/y) # hasil pembagian vektor x dan y
## [1. 0.75 0.83333333]
print (x**y) # hasil pemangkatan vektor x dan y
## [ 4 81 15625]
print (x%y) # hasil modulo (Sisa bagi) vektor x dan y
## [0 3 5]
Adakalanya anda perlu menampilkan keterangan/komentar yang juga melekat pada hasil perhitungan R itu sendiri. Maka anda dapat melakukannya dengan cara berikut:
print("Penjumahan vektor x dan y :", x + y, "\n")
## Penjumahan vektor x dan y : [ 4 7 11]
print("Pengurangan vektor x dan y :", x - y, "\n")
## Pengurangan vektor x dan y : [ 0 -1 -1]
print("Perkalian vektor x dan y :", x * y, "\n")
## Perkalian vektor x dan y : [ 4 12 30]
print("Pembagian vektor x dan y :", x / y, "\n")
## Pembagian vektor x dan y : [1. 0.75 0.83333333]
print("Pemangkatan vektor x dan y :", x ** y)
## Pemangkatan vektor x dan y : [ 4 81 15625]
print("Modulo vektor x dan y :", x % y, "\n")
## Modulo vektor x dan y : [0 3 5]
Catatan: Penjelasan lebih lekap mengenai modulo dapat lihat pada link ini
Relasional
Operator relasional melakukan operasi perbandingan antara elemen yang bersesuaian pada setiap operan. Mengembalikan nilai Boolean TRUE jika operan pertama memenuhi relasi dibandingkan dengan operan kedua. Nilai TRUE selalu dianggap lebih besar dari FALSE.
Operator | R | Python | Keterangan |
Kurang dari | < | < | Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama lebih kecil dari operan kedua. Selain itu akan mengembalikan FALSE |
Kurang dari sama dengan | <= | <= | Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama kurang dari atau sama dengan elemen operan kedua. Selain itu akan mengembalikan FALSE |
Lebih besar dari | > | > | Mengembalikan TRUE jika elemen yang bersesuaian pada operan pertama lebih besar dari operan kedua. Selain itu akan mengembalikan FALSE |
Lebih besar dari sama dengan | >= | >= | Mengembalikan BENAR jika elemen yang bersesuaian pada operan pertama lebih besar atau sama dengan dari operan kedua. Selain itu akan mengembalikan FALSE |
Sama Dengan | == | == | Mengembalikan BENAR jika dan hanya jika kedua sisi bernilai sama |
Tidak Sama dengan | != | != | Mengembalikan BENAR jika elemen yang bersesuaian pada operan pertama tidak sama dengan dari operan kedua |
R
<- c(2,3,5) # memuat vektor x
x <- c(2,4,6) # memuat vektor y
y cat("Vektor x kurang dari Vektor y:", x < y, "\n")
## Vektor x kurang dari Vektor y: FALSE TRUE TRUE
cat("Vector x kurang dari sama dengan Vector y:", x <= y, "\n")
## Vector x kurang dari sama dengan Vector y: TRUE TRUE TRUE
cat("Vector x lebih besar dari Vector y :", x > y, "\n")
## Vector x lebih besar dari Vector y : FALSE FALSE FALSE
cat("Vector x lebih besar dari sama dengan Vector y :", x >= y, "\n")
## Vector x lebih besar dari sama dengan Vector y : TRUE FALSE FALSE
cat("Vector x sama dengan Vector y:", x == y,"\n")
## Vector x sama dengan Vector y: TRUE FALSE FALSE
cat("Vector x tidak sama dengan Vector y:", x != y)
## Vector x tidak sama dengan Vector y: FALSE TRUE TRUE
Python
import numpy as np # fungsi untuk operasi pada Array
= np.array([2,3,5]) # memuat vektor x
x = np.array([2,4,6]) # memuat vektor y
y print("Vektor x kurang dari Vektor y:", x < y, "\n")
## Vektor x kurang dari Vektor y: [False True True]
print("Vector x kurang dari sama dengan Vector y:", x <= y, "\n")
## Vector x kurang dari sama dengan Vector y: [ True True True]
print("Vector x lebih besar dari Vector y :", x > y, "\n")
## Vector x lebih besar dari Vector y : [False False False]
print("Vector x lebih besar dari sama dengan Vector y :", x >= y, "\n")
## Vector x lebih besar dari sama dengan Vector y : [ True False False]
print("Vector x sama dengan Vector y:", x == y,"\n")
## Vector x sama dengan Vector y: [ True False False]
print("Vector x tidak sama dengan Vector y:", x != y)
## Vector x tidak sama dengan Vector y: [False True True]
Logika
Operator logis mensimulasikan operasi keputusan, berdasarkan operator yang ditentukan antara operan, yang kemudian dievaluasi ke nilai Boolean Benar atau Salah. Nilai bilangan bulat bukan nol dianggap sebagai nilai BENAR, baik itu bilangan kompleks atau bilangan real.
Operator | R | Python | Keterangan |
NOT | ! | ! | Operasi negasi/kebalikan pada status elemen operan |
AND | & | & | Mengembalikan TRUE jika kedua operan bernilai Benar |
OR | \(|\) | \(|\) | Mengembalikan TRUE jika salah satu operan adalah Benar |
XOR | ^ | ^ | Mengembalikan TRUE jika salah satu dari kedua elemen pertama operan bernilai Benar |
R
<- c(0,TRUE,FALSE)
x <- c(TRUE,0.1,4+3i)
y
# Melakukan operasi logika pada Operan
cat("Logika Negasi (~) untuk vektor x:", !x, "\n")
## Logika Negasi (~) untuk vektor x: TRUE FALSE TRUE
cat("Logika Negasi (~) untuk vektor y :", !y, "\n")
## Logika Negasi (~) untuk vektor y : FALSE FALSE FALSE
cat ("Logika Konjungsi (Dan) :", x & y, "\n")
## Logika Konjungsi (Dan) : FALSE TRUE FALSE
cat ("Logika Disjungsi (Atau) :", x | y, "\n")
## Logika Disjungsi (Atau) : TRUE TRUE TRUE
cat("Logika Disjungsi Parsial :", x || y)
## Logika Disjungsi Parsial : TRUE
Python
import numpy as np # fungsi untuk operasi pada Array
= np.array([False,True,False]) # memuat vektor x
x = np.array([True,True,False]) # memuat vektor y
y
# Melakukan operasi logika pada Operan
print("Logika Negasi (~) untuk vektor x:", ~x, "\n")
## Logika Negasi (~) untuk vektor x: [ True False True]
print("Logika Negasi (~) untuk vektor y :", ~y, "\n")
## Logika Negasi (~) untuk vektor y : [False False True]
print("Logika Konjungsi (Dan) :", x & y, "\n")
## Logika Konjungsi (Dan) : [False True False]
print("Logika Disjungsi (Atau) :", x | y, "\n")
## Logika Disjungsi (Atau) : [ True True False]
print("Logika Disjungsi Parsial :", x ^ y)
## Logika Disjungsi Parsial : [ True False False]
Catatan: Dalam R, data yang bernilai numerik kecuali nol dianggap TRUE dan yang lainnya adalah FALSE. Sedangkan dalam Python, hanya menggunakan True dan False.
Lain-lain
R
Berikut ini juga ada beberapa operator yang kemungkinan besar juga akan anda perlukan pada saat akan menggunakan R.
<- c(2,3,5) # memuat vektor x
x <- c(2,4,6) # memuat vektor y
y sqrt(x*y) # Bentuk akar
## [1] 2.000000 3.464102 5.477226
log(x) # logaritma
## [1] 0.6931472 1.0986123 1.6094379
exp(y) # eksponen
## [1] 7.389056 54.598150 403.428793
/y) + y # Tanda kurung (x
## [1] 3.000000 4.750000 6.833333
Catatan: Sifat Komutatif Asosiatif dan Distributif juga berlaku dalam program R.
Python
Berikut ini juga ada beberapa operator yang kemungkinan besar juga akan anda perlukan pada saat akan menggunakan R.
import numpy as np # library untuk memuat vektor (array)
= 2 # memuat vektor x
x = 3 # memuat vektor y
y from math import log,exp,sqrt # mengambil beberapa fungsi dari library `math`
*y) # Bentuk akar sqrt(x
## 2.449489742783178
# logaritma log(x)
## 0.6931471805599453
# eksponen exp(y)
## 20.085536923187668
/y) + y # Tanda kurung (x
## 3.6666666666666665
import numpy as np # library untuk memuat vektor (array)
= np.array([2,3,5]) # memuat vektor x
x = np.array([2,4,6]) # memuat vektor y
y *y) # Bentuk akar np.sqrt(x
## array([2. , 3.46410162, 5.47722558])
# logaritma np.log(x)
## array([0.69314718, 1.09861229, 1.60943791])
# eksponen np.exp(y)
## array([ 7.3890561 , 54.59815003, 403.42879349])
/y) + y # Tanda kurung (x
## array([3. , 4.75 , 6.83333333])
Catatan: Sifat Komutatif Asosiatif dan Distributif juga berlaku dalam program R.
Tipe Data
Dalam pemrograman seperti R dan Python, tipe data merupakan konsep penting. Keduanya dapat menggunakan variabel untuk menyimpan tipe yang berbeda-beda, berikut adalah tipe data paling mendasar yang harus diketahui:
Tipe Data | R | Python | Penjelasan |
Double/Float | 5.6 | 5.6 | Bilangan yang mempunyai koma |
Integer | 5 | 5 | Bilangan bulat 1,2,…,n |
Bolean/Logical | TRUE/FALSE | True/False | Benar bernilai 1 dan Salah bernilai 0 |
String/Character | ‘Dsciencelabs’ | ‘Dsciencelabs’ | karakter/kalimat bisa berupa huruf angka, dll (diapit tanda " atau ’) |
Complex | 1 + 5i | 1 + 5j | Pasangan angka real dan imajiner |
R
Berikut ini adalah koding R yang dapat digunakan untuk menetapkan kelima tipe data diatas:
= 5.6 # Tetapkan nilai desimal
d1 = as.integer(5) # tetapkan nilai integer
d2 = 5L # cara lain untuk memuat nilai integer di R
d2 = c(TRUE,FALSE) # Bolean/Logical
d3 = as.logical(c(0,1)) # cara lain untuk memuat Bolean/Logical
d3 = c("a",'b','123') # String/Character
d4 = 1 + 5i # Complex d5
Untuk memeriksa tipe data dalam R:
class(d1) # cetak nama kelas variabel
## [1] "numeric"
typeof(d1) # cetak tipe variabel x
## [1] "double"
Python
Berikut ini adalah koding Python yang dapat digunakan untuk menetapkan kelima tipe data diatas:
= 5.6 # Tetapkan nilai desimal
d1 = 5 # tetapkan nilai integer
d2 = [True,False] # list Bolean/Logical
d3 = ["a",'b','123'] # list String/Character
d4 = 1 + 5j # Complex d5
Untuk memeriksa tipe data dalam Python:
type(d5) # cetak tipe variabel x
## <class 'complex'>
Bantuan
R
Salah satu bagian terpenting dalam bekerja dengan bahasa R adalah mengetahui di mana mencari bantuan. R memiliki beberapa fasilitas in-line, selain berbagai sumber daya bantuan di ekosistem R. Anda dapat menggunakan bantuan untuk fungsi tertentu.
help.start() # menu di mana Anda dapat menavigasi bantuan lokal berbasis web
# menu di mana Anda dapat menavigasi bantuan lokal berbasis web
?help # mendapatkan bantuan untuk fungsi `class`
?class help(class) # mendapatkan bantuan untuk fungsi `class`
# jika Anda tidak tahu nama fungsi yang Anda cari
??class help.search('class') # jika Anda tidak tahu nama fungsi yang Anda cari
Python
help(print)
## Help on built-in function print in module builtins:
##
## print(...)
## print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
##
## Prints the values to a stream, or to sys.stdout by default.
## Optional keyword arguments:
## file: a file-like object (stream); defaults to the current sys.stdout.
## sep: string inserted between values, default a space.
## end: string appended after the last value, default a newline.
## flush: whether to forcibly flush the stream.