Universitas : UIN Maulana Malik Ibrahim Malang

Jurusan : Teknik Informatika

Struktur Data di R

R umumnya memiliki 6 struktur data diantaranya: Vector, Matrix, Array, Factor, List, Data Frame.

1. Vector

Vector atau array dua dimensi adalah struktur data yang dimana semua unsur atau elemen dalam vektor memiliki tipe kelas data yang sama.Pada pembahasan mengenai tipe kelas object R sebelumnya, secara tidak langsung saya sudah memberikan mengenai contoh struktur data vector dengan semua tipe kelas masing-masing.

nama <- c("Dina", "Anton", "Lily")
nama

## [1] "Dina"  "Anton" "Lily"

Kelas object yang berisikan karakter dan string.

nama <- c("Dina", "Anton", "Lily")
class(nama)

## [1] "character"

Kelas object yang berisikan bilangan kompleks misalkan bilangan imaginer.

waktu <- c(2+3i, 8i, (2+1i)*2)
class(waktu)

## [1] "complex"

Kelas object yang berisikan segala jenis angka

tinggi_badan <- c(160, 164.5, 156.8)
class(tinggi_badan)

## [1] "numeric"

Kelas object yang berisikan bilangan integer (bilangan bulat)

jml_saudara <- c(3L,2L,4L)
class(jml_saudara)

## [1] "integer"

Kelas object yang berisikan nilai boolean yaitu TRUE atau FALSE

abc <- c(TRUE, FALSE, TRUE)
class(abc)

## [1] "logical"

Yang menjadi pertanyaan adalah bagaimana jika kita membangun sebuah vector namun menginputkan lebih dari 1 tipe kelas yang berbeda? Maka R akan membaca tipe kelas data berdasarkan tipe kelas dengan urutan tertinggi sesuai susunan berikut:

Contoh: Kita akan membuat suatu vektor dengan 3 tipe kelas yang berbeda, yaitu: Complex, Integer, dan Logical.

vektor1 <- c(5i, 7i, 6.7, 8, TRUE, FALSE)
vektor1

## [1] 0.0+5i 0.0+7i 6.7+0i 8.0+0i 1.0+0i 0.0+0i

class(vektor1)

## [1] "complex"

Dapat dilihat tipe kelas object “vektor1” merupakan complex karena tipe kelas complex berada di atas integer dan logical.

Membuat baris bilangan genap dari 2 hingga 20.

seq(2, 20, by=2) 

##  [1]  2  4  6  8 10 12 14 16 18 20
#Membuat angka 10 sebanyak 5
rep(10,5)

## [1] 10 10 10 10 10

#Membuat deret angka 1 sampai 5 sebanyak 3 kali
rep(1:5, 3)

##  [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

#Membuat deret angka genap yang berada diantra 2 hingga 10 diulang sebanyak 3 kali.
rep(seq(2,10, by=2),3)

##  [1]  2  4  6  8 10  2  4  6  8 10  2  4  6  8 10

#Membuat deret angka 1 muncul 1 kali, angka 2 muncul 2 kali, dan angka 3 muncul 3 kali.
rep(1:3,1:3)

## [1] 1 2 2 3 3 3

#Membuat deret angka 1 sampai 3 yang dimana setiap angka diulang 2 kali 
rep(1:3,rep(2,3))

## [1] 1 1 2 2 3 3

rep(1:3,each=2)

## [1] 1 1 2 2 3 3
#Membuat karakter A1 sampai A10 dimana tidak ada pemisah antara A dan tiap angkanya.

paste("A",1:10,sep="")

##  [1] "A1"  "A2"  "A3"  "A4"  "A5"  "A6"  "A7"  "A8"  "A9"  "A10"

paste0("A",1:10)

##  [1] "A1"  "A2"  "A3"  "A4"  "A5"  "A6"  "A7"  "A8"  "A9"  "A10"

#Membuat karakter A-1 sampai A-10 dimana ada pemisah (-) antara A dan tiap angkanya.
paste("A",1:10,sep="-")

##  [1] "A-1"  "A-2"  "A-3"  "A-4"  "A-5"  "A-6"  "A-7"  "A-8"  "A-9"  "A-10"

Perhatikan perbedaan pola karakter jika menggunakan function ‘paste0’

paste0("A",1:10,sep="-")

##  [1] "A1-"  "A2-"  "A3-"  "A4-"  "A5-"  "A6-"  "A7-"  "A8-"  "A9-"  "A10-"

#Membuat pola karakter A1 sampai A3 dimana setiap karakter diulang 2 kali
paste0("A",rep(1:3,each=2))

## [1] "A1" "A1" "A2" "A2" "A3" "A3"

#Membuat sebuah vector terdiri dari 2 kata "la" dan "ye". Dengan urutan "la" "ye" "ye" "la" yang diulang sebanyak 4 kali

c("la","ye")[rep(c(1,2,2,1),times=4)]

##  [1] "la" "ye" "ye" "la" "la" "ye" "ye" "la" "la" "ye" "ye" "la" "la" "ye" "ye"
## [16] "la"

#Membuat sebuah vector terdiri dari 2 kata "la" dan "ye". Setiap"la" dan "ye" masing-masing diulang 3 kali, kemudian dimunculkan 2 kali.
c("la","ye")[rep(rep(1:2,each=3),2)]

##  [1] "la" "la" "la" "ye" "ye" "ye" "la" "la" "la" "ye" "ye" "ye"
vektor2 <- paste("A",1:12,sep="")
vektor2

##  [1] "A1"  "A2"  "A3"  "A4"  "A5"  "A6"  "A7"  "A8"  "A9"  "A10" "A11" "A12"

#Melihat panjang elemen pada vektor2
length(vektor2)

## [1] 12

#Mengambil elemen ketiga dalam vektor2
vektor2[3]

## [1] "A3"

#Mengambil elemen ke 7 sampai 10 dalam vektor2
vektor2[7:10]

## [1] "A7"  "A8"  "A9"  "A10"

#Mengambil elemen selain elemen ke 7 sampai 10 dalam vektor2
vektor2[-(7:10)]

## [1] "A1"  "A2"  "A3"  "A4"  "A5"  "A6"  "A11" "A12"

#Mengambil elemen 1, 3, dan 7 dari vektor2
vektor2[c(1,3,7)]

## [1] "A1" "A3" "A7"

#Mengambil elemen selain elemen 1, 3, dan 7 dari vektor2
vektor2[-c(1,3,7)]

## [1] "A2"  "A4"  "A5"  "A6"  "A8"  "A9"  "A10" "A11" "A12"

#Mengambil elemen dengan urutan genap dari vektor2
vektor2[(seq(2,12, by= 2))]

## [1] "A2"  "A4"  "A6"  "A8"  "A10" "A12"

#Mengambil elemen dengan urutan ganjil dari vektor2
vektor2[(seq(1,12, by= 2))]

## [1] "A1"  "A3"  "A5"  "A7"  "A9"  "A11"

vektor2[-(seq(2,12, by= 2))]

## [1] "A1"  "A3"  "A5"  "A7"  "A9"  "A11"

x1 <- paste(c("X","Y"),1:10,sep="")

#Membuat urutan bilangan dari 1:28 dengan selang 3 angka
x2 <- seq(1,28, by=3)

names(x2) <- x1
x2

##  X1  Y2  X3  Y4  X5  Y6  X7  Y8  X9 Y10 
##   1   4   7  10  13  16  19  22  25  28

x2[3:4]

## X3 Y4 
##  7 10

2. Matrix

Matrix atau array dua dimensi adalah struktur data yang memiliki row dan column, Unsur-unsur di dalam matriks semua harus memiliki tipe kelas data yang sama.

#Membuat matriks berisi angka 1 sampai 12 dengan elemen 3 baris dan 4 kolom
matrix(1:12,3,4)

##      [,1] [,2] [,3] [,4]
## [1,]    1    4    7   10
## [2,]    2    5    8   11
## [3,]    3    6    9   12

matrix(1:12,3,4,byrow=TRUE)

##      [,1] [,2] [,3] [,4]
## [1,]    1    2    3    4
## [2,]    5    6    7    8
## [3,]    9   10   11   12

matrix(1:10,4,5)

##      [,1] [,2] [,3] [,4] [,5]
## [1,]    1    5    9    3    7
## [2,]    2    6   10    4    8
## [3,]    3    7    1    5    9
## [4,]    4    8    2    6   10
vektor3 <- 1:12
vektor3

##  [1]  1  2  3  4  5  6  7  8  9 10 11 12

class(vektor3)

## [1] "integer"

dim(vektor3) <- c(6,2)
vektor3

##      [,1] [,2]
## [1,]    1    7
## [2,]    2    8
## [3,]    3    9
## [4,]    4   10
## [5,]    5   11
## [6,]    6   12

class(vektor3)

## [1] "matrix" "array"

typeof(vektor3)

## [1] "integer"

Function class pada structur data vector mengeluarkan type kelas data seperti output diatas object vektor3 memiliki struktur data “matrix” dan “array”. Function class pada selain structur data vector mengeluarkan type structur data. Pada contoh di atas structur data bisa matrix atau array (array 2 dimensi). Untuk mengeluarkan tipe kelas data pada structur mariks bisa menggunakan function typeof.

is.matrix(vektor3)

## [1] TRUE

is.array(vektor3)

## [1] TRUE

#Membuat matriks dengan hanya menentukan banyaknya nrow (banyaknya baris) kemudian ncol(banyaknya kolom) akan menyesuaikan sesuai bilangan yang tersisa

matrix(1:6,2)

##      [,1] [,2] [,3]
## [1,]    1    3    5
## [2,]    2    4    6

matrix(1:6,3)

##      [,1] [,2]
## [1,]    1    4
## [2,]    2    5
## [3,]    3    6

matriks1 <- matrix(1:4,2)
matriks1

##      [,1] [,2]
## [1,]    1    3
## [2,]    2    4

matriks2 <- matrix(6:9,2)
matriks2

##      [,1] [,2]
## [1,]    6    8
## [2,]    7    9
matriks3 <- rbind(matriks1, matriks2)
matriks3

##      [,1] [,2]
## [1,]    1    3
## [2,]    2    4
## [3,]    6    8
## [4,]    7    9
matriks4 <- cbind(matriks1, matriks2)
matriks4

##      [,1] [,2] [,3] [,4]
## [1,]    1    3    6    8
## [2,]    2    4    7    9
dim(matriks4)

## [1] 2 4

length(matriks4)

## [1] 8

matriks5 <- matrix(1:8, 4,4)
matriks5

##      [,1] [,2] [,3] [,4]
## [1,]    1    5    1    5
## [2,]    2    6    2    6
## [3,]    3    7    3    7
## [4,]    4    8    4    8

dim(matriks5)

## [1] 4 4

length(matriks5)

## [1] 16
#Mengakses elemen matriks5 yang berada di row ke 2 dan column ke 3
matriks5[2,3]

## [1] 2

#Mengakses elemen matriks5 yang berada di row ke 2 dan semua column
matriks5[2,]

## [1] 2 6 2 6

#Mengakses elemen matriks5 yang berada di row ke 1 dan 3 dan semua column kecuali column ke 2.
matriks5

##      [,1] [,2] [,3] [,4]
## [1,]    1    5    1    5
## [2,]    2    6    2    6
## [3,]    3    7    3    7
## [4,]    4    8    4    8

matriks5[c(1,3),-2]

##      [,1] [,2] [,3]
## [1,]    1    1    5
## [2,]    3    3    7

matriks6a <- matrix(paste("A",1:12,sep=""), 4,3)
matriks6a

##      [,1] [,2] [,3] 
## [1,] "A1" "A5" "A9" 
## [2,] "A2" "A6" "A10"
## [3,] "A3" "A7" "A11"
## [4,] "A4" "A8" "A12"

matriks6b <- matrix(paste("A",1:12,sep=""), 4,3, byrow = T)
matriks6b

##      [,1]  [,2]  [,3] 
## [1,] "A1"  "A2"  "A3" 
## [2,] "A4"  "A5"  "A6" 
## [3,] "A7"  "A8"  "A9" 
## [4,] "A10" "A11" "A12"

#Mengakses elemen ketiga dari matriks6a dan matriks6b. PERHATIKAN PERBEDAANNYA
matriks6a[3]

## [1] "A3"

matriks6b[3]

## [1] "A7"

3. Array

Array dalam Pemrograman R secara sederhana disebut sebagai struktur Data multi-dimensi. Array dasarnya sama seperti matrix namun array dapat mempunyai lebih dari dua dimensi.

array1 <- array(LETTERS,dim=c(2,2,3))
array1

## , , 1
## 
##      [,1] [,2]
## [1,] "A"  "C" 
## [2,] "B"  "D" 
## 
## , , 2
## 
##      [,1] [,2]
## [1,] "E"  "G" 
## [2,] "F"  "H" 
## 
## , , 3
## 
##      [,1] [,2]
## [1,] "I"  "K" 
## [2,] "J"  "L"
array(c("A","B"),dim=c(2,1,2,3))

## , , 1, 1
## 
##      [,1]
## [1,] "A" 
## [2,] "B" 
## 
## , , 2, 1
## 
##      [,1]
## [1,] "A" 
## [2,] "B" 
## 
## , , 1, 2
## 
##      [,1]
## [1,] "A" 
## [2,] "B" 
## 
## , , 2, 2
## 
##      [,1]
## [1,] "A" 
## [2,] "B" 
## 
## , , 1, 3
## 
##      [,1]
## [1,] "A" 
## [2,] "B" 
## 
## , , 2, 3
## 
##      [,1]
## [1,] "A" 
## [2,] "B"
array(1:12,dim=c(3,4))

##      [,1] [,2] [,3] [,4]
## [1,]    1    4    7   10
## [2,]    2    5    8   11
## [3,]    3    6    9   12

matrix(1:12,3,4)

##      [,1] [,2] [,3] [,4]
## [1,]    1    4    7   10
## [2,]    2    5    8   11
## [3,]    3    6    9   12

General Function object_array[baris, kolom, lembar, buku]

array1

## , , 1
## 
##      [,1] [,2]
## [1,] "A"  "C" 
## [2,] "B"  "D" 
## 
## , , 2
## 
##      [,1] [,2]
## [1,] "E"  "G" 
## [2,] "F"  "H" 
## 
## , , 3
## 
##      [,1] [,2]
## [1,] "I"  "K" 
## [2,] "J"  "L"

array1[1,2,3]

## [1] "K"

4. Factor

Faktor adalah objek data yang digunakan untuk data kategori dan menyimpannya sebagai level. Factor dapat menyimpan string dan integer, factor berguna untuk suatu kolom yang memiliki nilai unik dalam jumlah terbatas. Misalkan “Pria,” Wanita" dan “Benar”, “Salah”, dsb.

Faktor dibangun dengan menggunakan function faktor() dengan menggunakan vektor sebagai input.

#Membangun sebuah vektor kelas character
golongan_darah <- c("A", "A","B","O","AB","O")
golongan_darah

## [1] "A"  "A"  "B"  "O"  "AB" "O"

#Membangun struktur data factor dari yang semula vector
factor(golongan_darah)

## [1] A  A  B  O  AB O 
## Levels: A AB B O

levels(factor(golongan_darah))

## [1] "A"  "AB" "B"  "O"

Data golongan darah merupakan data kategorik nominal (yang tidak memiliki tingkatan) urutan levels akan terurut sesuai abjad. Bagaimana jika ingin mengurutkan levels menjadi “O”,“A”,“B”,“AB”?

faktor_nominal <- factor(golongan_darah, levels = c("O","A","B","AB"))
faktor_nominal

## [1] A  A  B  O  AB O 
## Levels: O A B AB

levels(factor(golongan_darah, levels = c("O","A","B","AB")))

## [1] "O"  "A"  "B"  "AB"
tingkat_pendidikan <- c("SD","SMP","SMA")

#Mendefinisikan tingkat_pendidikan sebagai data dengan skala pengukuran ordinal dengan urutan sesuai vektor tingkat_pendidikan
ordered(tingkat_pendidikan)

## [1] SD  SMP SMA
## Levels: SD < SMA < SMP

ordered(tingkat_pendidikan, levels=tingkat_pendidikan)

## [1] SD  SMP SMA
## Levels: SD < SMP < SMA

Karena tingkat_pendidikan sudah diordered (data ordinal) maka levels akan berubah dan mendefinisikan bahwa tingkat SD lebih rendah dibanding SMP dan lebihrendah dibanding SMA.

Atau langkah di atas bisa juga digantikan dengan alternatif syntax di bawah ini:

faktor_ordinal <- factor(tingkat_pendidikan, levels=tingkat_pendidikan, ordered=TRUE)
faktor_ordinal

## [1] SD  SMP SMA
## Levels: SD < SMP < SMA

Membangun factor dengan tipe peubah nominal hanya dengan mengganti parameter ordered=F

factor(golongan_darah, levels = c("O","A","B","AB"), ordered=F)

## [1] A  A  B  O  AB O 
## Levels: O A B AB
faktor_nominal[6]

## [1] O
## Levels: O A B AB

Mengambil elemen ke-6 dari faktor_nominal. Ingat yang diambil adalah elemennya bukan levels factornya.

faktor_ordinal[3:4]

## [1] SMA  <NA>
## Levels: SD < SMP < SMA

Mengambil elemen ke-3 dan 4 dari faktor_ordinal. Karena elemen dalam faktor_ordinal hanya ada 3 elemen, sehingga elemen ke-4 bernilai NA.

5. List

List adalah objek R yang memungkinkan elemen dari berbagai tipe kelas data seperti integer, character, logical dan lainnya. List juga dapat berisi matriks atau fungsi sebagai elemennya. List dibuat dengan menggunakan function list().

list1 <- list("man", "women", c(10,12,21), TRUE, FALSE, 119.1)
list1

## [[1]]
## [1] "man"
## 
## [[2]]
## [1] "women"
## 
## [[3]]
## [1] 10 12 21
## 
## [[4]]
## [1] TRUE
## 
## [[5]]
## [1] FALSE
## 
## [[6]]
## [1] 119.1

class(list1)

## [1] "list"

#Mengeluarkan elemen ke 2 dan 3 dari list1
list1[2:3]

## [[1]]
## [1] "women"
## 
## [[2]]
## [1] 10 12 21

#Mengeluarkan elemen ke-1 dari elemen ke-3 dari list1
list1[[3]][1]

## [1] 10

list2 <- list(vect=nama,mat=matriks1,array=array1,fac=faktor_ordinal)
list2

## $vect
## [1] "Dina"  "Anton" "Lily" 
## 
## $mat
##      [,1] [,2]
## [1,]    1    3
## [2,]    2    4
## 
## $array
## , , 1
## 
##      [,1] [,2]
## [1,] "A"  "C" 
## [2,] "B"  "D" 
## 
## , , 2
## 
##      [,1] [,2]
## [1,] "E"  "G" 
## [2,] "F"  "H" 
## 
## , , 3
## 
##      [,1] [,2]
## [1,] "I"  "K" 
## [2,] "J"  "L" 
## 
## 
## $fac
## [1] SD  SMP SMA
## Levels: SD < SMP < SMA

#Mengakses list2 dimana struktur datanya merupakan factor
list2$fac

## [1] SD  SMP SMA
## Levels: SD < SMP < SMA

list2$fac[2]

## [1] SMP
## Levels: SD < SMP < SMA

length(list1)

## [1] 6

length(list2)

## [1] 4

names(list2)

## [1] "vect"  "mat"   "array" "fac"

6. Data Frame

Data frame adalah struktur data dimana satu kolom harus memiliki tipe kelas yang sama, namun kolom yang berbeda dapat memiliki tipe kelas yang berbeda.

#Membuat data frame dari object sebelumnya yang sudah dibangun

df_1 <- data.frame(nama, tinggi_badan, jml_saudara, faktor_ordinal)
df_1

##    nama tinggi_badan jml_saudara faktor_ordinal
## 1  Dina        160.0           3             SD
## 2 Anton        164.5           2            SMP
## 3  Lily        156.8           4            SMA
names(df_1)

## [1] "nama"           "tinggi_badan"   "jml_saudara"    "faktor_ordinal"
str(df_1)

## 'data.frame':    3 obs. of  4 variables:
##  $ nama          : chr  "Dina" "Anton" "Lily"
##  $ tinggi_badan  : num  160 164 157
##  $ jml_saudara   : int  3 2 4
##  $ faktor_ordinal: Ord.factor w/ 3 levels "SD"<"SMP"<"SMA": 1 2 3
df_1$nama

## [1] "Dina"  "Anton" "Lily"

df_1[2,2]

## [1] 164.5

Melihat apakah ada daftar dengan nama Lily

df_1$nama=="Lily"

## [1] FALSE FALSE  TRUE

Nama Lily terdapat di daftar no.3

class(matriks1)

## [1] "matrix" "array"

is.array(matriks1)

## [1] TRUE

Seorang peneliti merancang sebuah perancangan percobaan RAKL dengan 4 perlakuan dan 3 kelompok (anggaplah respon percobaan berupa baris bilangan ganjil dari 1 hingga 23).

Perl <- paste0("P",rep(1:4,each=3))
Kel <- factor(rep(1:3,4))
Resp <- seq(1,23, by=2)

data1 <- data.frame(Perl, Kel, Resp)
data1

##    Perl Kel Resp
## 1    P1   1    1
## 2    P1   2    3
## 3    P1   3    5
## 4    P2   1    7
## 5    P2   2    9
## 6    P2   3   11
## 7    P3   1   13
## 8    P3   2   15
## 9    P3   3   17
## 10   P4   1   19
## 11   P4   2   21
## 12   P4   3   23

Kesimpulan

R memiliki banyak struktur data. Di sini, dikenalkan beberapa yang sering digunakan saja, sebagai permulaan sebelum terjerumus terlalu dalam dengan R.

REFERENSI

Modul Praktikum Pemrograman Statistika Tahun 2020 mengenai Object Data di R (Program Magister Statistika dan Sains Data Departemen Statistika FMIPA-IPB University)

https://www.linkedin.com/in/hafizah-ilma-665449141/

https://bookdown.org/moh_rosidi2610/Rcmdr-book/tipe-dan-struktur-data.html

https://rancage.com/web/pengenalan-struktur-data-dalam-r-20180508/

____________________________________________________________________________________________

Kunjungi Rpubs saya untuk melihat penjelasan yang lain <https://rpubs.com/henyrimadana>

____________________________________________________________________________________________

.