Syntax Dasar dalam R

print("This is my first code")
## [1] "This is my first code"

fungsi print(): mencetak atau menampilkan hasil atau ingin mengetahui nilai dari suatu objek print(variabel/object)

menulis kode/syntax dapat dilakukan pada chunk cara membuat 1 chunk: ctrl + alt + i

1+2
## [1] 3

ingin membuat operasi penjumlahan:

1+2
## [1] 3

mengeksekusi chunk bisa dilakukan dengan klik tanda segitiga hijau pada sudut kanan atas chunk atau dengan shortcut ctrl + shift + enter untuk mengeksekusi 1 line/baris pada chunk bisa dengan ctrl + enter

1+1
## [1] 2
1+3
## [1] 4

Bahasa R itu sensisitif terhadap kapitalisasi dalam penulisan objek (sensitif terhadap huruf bedar dan huruf kecil)

a <- 2
print(a)
## [1] 2

operator assigment utama pada R (<-) objek <- ekpresi/nilai (memasukkan nilai hasil dari operasi di sebelah kanan ke dalam objek yang berada di sebelah kiri) shortcut : Alt + - ingin memanggil objek tersebut cukup dengan menuliskan nama objeknya atau menggunakan fungsi print()

x <- 5
x
## [1] 5

Struktur dan Tipe Data

Terdapat beberapa strutur data di R, yakni

Kita simpulkan: Dimensi Homogen Heterogen 1D Atomic vektor List 2D Matrix data frame

Homogen: object/ variabel tersebut hanya menyimpan 1 tipe data atau 1 jenis data saja. (1 tipe data numeric atau 1 tipe data integer, atau 1 tipe data faktor) Hetogen: obejct/ variabel memiliki lebih dari 1 tipe data (misal dalam object tersebut memiliki tipe data numeric dan karakter)

Dari ke-empat sruktur data yang ada di R, pada bab ini akan dibahas mengenai 2 struktur data, yakni atomic vector dan data frame.

Atomic Vector

Merupakan sebuah object yang memiliki satu tipe data dan satu dimensi. Pada atomic vector, kita dapat membuat sebuah obyek dengan anggotanya memiliki satu tipe data. Namun, ketika kita menginput data lebih dari satu tipe data, maka secara otomatis akan terkonversi menjadi salah satu tipe data yang lebih umum.

Berikut merupakan beberapa tipe data yang telah diurutkan dari tingkat yang paling umum:

Character

Karakter merupakan tipe data yang paling umum pada R. Untuk membuat obyek dengan tipe data karakter, kita data menambahkan operator " " (kutip dua) pada tiap anggotanya. contoh : kita ingin menunjukkan penggunaaan tipe data karakter pada variabel mata_kuliah

objek/variabel <- nilai/ ekspresi <- : operator assignment atau tanda untuk mendefinisikan objek <- : Alt + - Ctrl + Alt + i

nama <- "idel"
print(nama)
## [1] "idel"
MataKuliah <- 'Belajar R'

R itu dia sangat sensitif terhadap huruf besar dan huruf kecil

MataKuliah
## [1] "Belajar R"

Selain itu, untuk meng-input lebih dari satu anggota pada obyek, bisa dilakukan dengan fungsi c() yang dapat kita artikan sebagai combine.

kar <- c("a", "b", "c")
kar
## [1] "a" "b" "c"
data_mahasiswa <- c("badu", "budi", "indah", "mutia")
data_mahasiswa
## [1] "badu"  "budi"  "indah" "mutia"

Untuk cek tipe data, dapat dilakukan dengan fungsi class(nama_obyek).

class(kar)
## [1] "character"
class(MataKuliah)
## [1] "character"
class(data_mahasiswa)
## [1] "character"

Numerik

Tipe data kedua yang paling umum adalah numeric. Numeric merupakan tipe bilangan nyata, sehingga mengizinkan adanya bilangan desimal.

num1 <- 2
num1
## [1] 2
num <- c(1, 2.4, 7)
num
## [1] 1.0 2.4 7.0
class(num)
## [1] "numeric"
class(num)
## [1] "numeric"

Integer

Tipe data interger merupakan tipe data bilangan bulat. Untuk menginput bilangan yang berurutan, bisa dilakukan dengan operator :.

int <- c(1:10)
int
##  [1]  1  2  3  4  5  6  7  8  9 10
int [2]
## [1] 2
int [c(3,4)]
## [1] 3 4
class(int)
## [1] "integer"
class(int)
## [1] "integer"

Sedangkan, saat anggotanya tidak berurutan, dapat ditambahkan L setelah angkanya

int2 <- c(2L, 5L)
int2
## [1] 2 5
int2 [1]
## [1] 2
class(int2)
## [1] "integer"

Logical

Logical merupakan tipe data yang berisi TRUE atau FALSE. Untuk membuat sebuah object dengan tipe data logical, kita bisa menuliskan anggotanya dengan TRUE, FALSE, T, F.

logi <- c(TRUE, FALSE, T, F)
logi
## [1]  TRUE FALSE  TRUE FALSE
class(logi)
## [1] "logical"

Atomic Vector dengan Lebih dari Satu Tipe Data

Misal kita memasukkan lebih dari 1 tipe data pada suatu object, seperti di bawah ini:

campur <- c(TRUE, 3, "Bintang")
campur
## [1] "TRUE"    "3"       "Bintang"

Dari output di atas semua tipe data terkonversi menjadi karakter, terlihat dari semua anggota memiliki petik dua.

class(campur)
## [1] "character"

Setelah dicek menggunakan fungsi class(), didapat hasilnya pun character, hal ini karena R akan mengkonversi menjadi tipe data yang paling umum, yakni character.

Data Frame

Data frame merupakan struktur data yang mempunyai 2 dimensi. Misal kita ingin membuat sebuah data frame dengan nama-nama kolom/variabelnya adalah Divisi, Nama, dan Tinggi dan memasukkan masing-masing 3 anggota ke dalam 3 kolom tersebut.

misal: ingin membuat kolom dengan variabel: divisi, nama, dan tinggi anggota dari kolomnya ada 3 anggota masing-masing kolom divisi: A1, A2, A3 nama: ross, ihaka, robert tinggi: 158, 160, 172

df <- data.frame(Divisi = c("A1","A2","A3"), 
                 Nama = c("Ross", "Ihaka", "Robert"), 
                 Tinggi = c(158, 160, 172))
df
##   Divisi   Nama Tinggi
## 1     A1   Ross    158
## 2     A2  Ihaka    160
## 3     A3 Robert    172
class(df)
## [1] "data.frame"

Hasil yang didapat adalah kita memiliki 3 baris dan 3 kolom pada data frame df.

contoh <- data.frame(No=c(1,2,3),
                     Nama=c("bunga", "dinda", "budi"),
                     jenis.kelamin=c("P", "P", "L"),
                     usia=c(27, 28, 29))
contoh$jenis.kelamin <- as.factor(contoh$jenis.kelamin)
contoh
##   No  Nama jenis.kelamin usia
## 1  1 bunga             P   27
## 2  2 dinda             P   28
## 3  3  budi             L   29
tail(contoh)
##   No  Nama jenis.kelamin usia
## 1  1 bunga             P   27
## 2  2 dinda             P   28
## 3  3  budi             L   29

Mengubah tipe data

Seringkali kita memiliki kebutuhan untuk mengubah tipe data yang ada. Misal dari data frame df, kita ingin mengubah variabel Divisi dari tipe character menjadi factor. Hal ini dapat dilakukan dengan:

df$Divisi <- as.factor(df$Divisi)
df
##   Divisi   Nama Tinggi
## 1     A1   Ross    158
## 2     A2  Ihaka    160
## 3     A3 Robert    172

Saya ingin mengubah tipe data dari kolom Tinggi ke dalam integer

df$Tinggi <- as.integer(df$Tinggi)
df
##   Divisi   Nama Tinggi
## 1     A1   Ross    158
## 2     A2  Ihaka    160
## 3     A3 Robert    172
df$Tinggi<-as.numeric(df$Tinggi)
df
##   Divisi   Nama Tinggi
## 1     A1   Ross    158
## 2     A2  Ihaka    160
## 3     A3 Robert    172

Keterangan: Variabel $ berfungsi untuk memanggil variabel pada data frame.

Dari hasil di atas, didapat tipe variabel Nama sudah berubah, yang awalnya factor menjadi character. Adapun untuk mengganti dengan tipe data lainnya, bisa dilakukan dengan fungsi:

  • as.character() = mengubah menjadi tipe character
  • as.numeric() = mengubah menjadi tipe numeric
  • as.integer() = mengubah menjadi tipe integer
  • as.logical() = mengubah menjadi tipe logical
  • as.Date() = mengubah menjadi tipe date
  • as.factor() = mengubah menjadi tipe factor/kategorikal

Membaca data di R

Pada bab ini akan ditampilkan bagaimana cara membaca sebuah data dengan tipe .csv (comma-separated values). Untuk membaca file dalam bentuk .csv tidak dibutuhkan library atau package apapun, memanggil file dalam bentuk .csv bisa dilakukan dengan memanggil fungsi read.csv()

getwd()
## [1] "D:/bahan ajar/2021/statistika industri/R programming"

mendefinisikan object dengan nama grads dan menggunakan file format csv yang sudah ada dengan nama recent-grads.csv

grads <- read.csv("D:/bahan ajar/2021/statistika industri/R programming/recent-grads.csv")
grads <- read.csv("recent-grads.csv")
summary(grads)
##       Rank       Major_code      Major               Total       
##  Min.   :  1   Min.   :1100   Length:173         Min.   :   124  
##  1st Qu.: 44   1st Qu.:2403   Class :character   1st Qu.:  4550  
##  Median : 87   Median :3608   Mode  :character   Median : 15104  
##  Mean   : 87   Mean   :3880                      Mean   : 39370  
##  3rd Qu.:130   3rd Qu.:5503                      3rd Qu.: 38910  
##  Max.   :173   Max.   :6403                      Max.   :393735  
##                                                  NA's   :1       
##       Men             Women        Major_category       ShareWomen    
##  Min.   :   119   Min.   :     0   Length:173         Min.   :0.0000  
##  1st Qu.:  2178   1st Qu.:  1778   Class :character   1st Qu.:0.3360  
##  Median :  5434   Median :  8386   Mode  :character   Median :0.5340  
##  Mean   : 16723   Mean   : 22647                      Mean   :0.5222  
##  3rd Qu.: 14631   3rd Qu.: 22554                      3rd Qu.:0.7033  
##  Max.   :173809   Max.   :307087                      Max.   :0.9690  
##  NA's   :1        NA's   :1                           NA's   :1       
##   Sample_size        Employed        Full_time        Part_time     
##  Min.   :   2.0   Min.   :     0   Min.   :   111   Min.   :     0  
##  1st Qu.:  39.0   1st Qu.:  3608   1st Qu.:  3154   1st Qu.:  1030  
##  Median : 130.0   Median : 11797   Median : 10048   Median :  3299  
##  Mean   : 356.1   Mean   : 31193   Mean   : 26029   Mean   :  8832  
##  3rd Qu.: 338.0   3rd Qu.: 31433   3rd Qu.: 25147   3rd Qu.:  9948  
##  Max.   :4212.0   Max.   :307933   Max.   :251540   Max.   :115172  
##                                                                     
##  Full_time_year_round   Unemployed    Unemployment_rate     Median      
##  Min.   :   111       Min.   :    0   Min.   :0.00000   Min.   : 22000  
##  1st Qu.:  2453       1st Qu.:  304   1st Qu.:0.05031   1st Qu.: 33000  
##  Median :  7413       Median :  893   Median :0.06796   Median : 36000  
##  Mean   : 19694       Mean   : 2416   Mean   :0.06819   Mean   : 40151  
##  3rd Qu.: 16891       3rd Qu.: 2393   3rd Qu.:0.08756   3rd Qu.: 45000  
##  Max.   :199897       Max.   :28169   Max.   :0.17723   Max.   :110000  
##                                                                         
##      P25th           P75th         College_jobs    Non_college_jobs
##  Min.   :18500   Min.   : 22000   Min.   :     0   Min.   :     0  
##  1st Qu.:24000   1st Qu.: 42000   1st Qu.:  1675   1st Qu.:  1591  
##  Median :27000   Median : 47000   Median :  4390   Median :  4595  
##  Mean   :29501   Mean   : 51494   Mean   : 12323   Mean   : 13284  
##  3rd Qu.:33000   3rd Qu.: 60000   3rd Qu.: 14444   3rd Qu.: 11783  
##  Max.   :95000   Max.   :125000   Max.   :151643   Max.   :148395  
##                                                                    
##  Low_wage_jobs  
##  Min.   :    0  
##  1st Qu.:  340  
##  Median : 1231  
##  Mean   : 3859  
##  3rd Qu.: 3466  
##  Max.   :48207  
## 
grads$Major_category <- as.factor(grads$Major_category)
summary(grads)
##       Rank       Major_code      Major               Total       
##  Min.   :  1   Min.   :1100   Length:173         Min.   :   124  
##  1st Qu.: 44   1st Qu.:2403   Class :character   1st Qu.:  4550  
##  Median : 87   Median :3608   Mode  :character   Median : 15104  
##  Mean   : 87   Mean   :3880                      Mean   : 39370  
##  3rd Qu.:130   3rd Qu.:5503                      3rd Qu.: 38910  
##  Max.   :173   Max.   :6403                      Max.   :393735  
##                                                  NA's   :1       
##       Men             Women                          Major_category
##  Min.   :   119   Min.   :     0   Engineering              :29    
##  1st Qu.:  2178   1st Qu.:  1778   Education                :16    
##  Median :  5434   Median :  8386   Humanities & Liberal Arts:15    
##  Mean   : 16723   Mean   : 22647   Biology & Life Science   :14    
##  3rd Qu.: 14631   3rd Qu.: 22554   Business                 :13    
##  Max.   :173809   Max.   :307087   Health                   :12    
##  NA's   :1        NA's   :1        (Other)                  :74    
##    ShareWomen      Sample_size        Employed        Full_time     
##  Min.   :0.0000   Min.   :   2.0   Min.   :     0   Min.   :   111  
##  1st Qu.:0.3360   1st Qu.:  39.0   1st Qu.:  3608   1st Qu.:  3154  
##  Median :0.5340   Median : 130.0   Median : 11797   Median : 10048  
##  Mean   :0.5222   Mean   : 356.1   Mean   : 31193   Mean   : 26029  
##  3rd Qu.:0.7033   3rd Qu.: 338.0   3rd Qu.: 31433   3rd Qu.: 25147  
##  Max.   :0.9690   Max.   :4212.0   Max.   :307933   Max.   :251540  
##  NA's   :1                                                          
##    Part_time      Full_time_year_round   Unemployed    Unemployment_rate
##  Min.   :     0   Min.   :   111       Min.   :    0   Min.   :0.00000  
##  1st Qu.:  1030   1st Qu.:  2453       1st Qu.:  304   1st Qu.:0.05031  
##  Median :  3299   Median :  7413       Median :  893   Median :0.06796  
##  Mean   :  8832   Mean   : 19694       Mean   : 2416   Mean   :0.06819  
##  3rd Qu.:  9948   3rd Qu.: 16891       3rd Qu.: 2393   3rd Qu.:0.08756  
##  Max.   :115172   Max.   :199897       Max.   :28169   Max.   :0.17723  
##                                                                         
##      Median           P25th           P75th         College_jobs   
##  Min.   : 22000   Min.   :18500   Min.   : 22000   Min.   :     0  
##  1st Qu.: 33000   1st Qu.:24000   1st Qu.: 42000   1st Qu.:  1675  
##  Median : 36000   Median :27000   Median : 47000   Median :  4390  
##  Mean   : 40151   Mean   :29501   Mean   : 51494   Mean   : 12323  
##  3rd Qu.: 45000   3rd Qu.:33000   3rd Qu.: 60000   3rd Qu.: 14444  
##  Max.   :110000   Max.   :95000   Max.   :125000   Max.   :151643  
##                                                                    
##  Non_college_jobs Low_wage_jobs  
##  Min.   :     0   Min.   :    0  
##  1st Qu.:  1591   1st Qu.:  340  
##  Median :  4595   Median : 1231  
##  Mean   : 13284   Mean   : 3859  
##  3rd Qu.: 11783   3rd Qu.: 3466  
##  Max.   :148395   Max.   :48207  
## 
summary(grads$Major_category)
##     Agriculture & Natural Resources                                Arts 
##                                  10                                   8 
##              Biology & Life Science                            Business 
##                                  14                                  13 
##         Communications & Journalism             Computers & Mathematics 
##                                   4                                  11 
##                           Education                         Engineering 
##                                  16                                  29 
##                              Health           Humanities & Liberal Arts 
##                                  12                                  15 
## Industrial Arts & Consumer Services                   Interdisciplinary 
##                                   7                                   1 
##                 Law & Public Policy                   Physical Sciences 
##                                   5                                  10 
##            Psychology & Social Work                      Social Science 
##                                   9                                   9

Transformasi data

Data transformasi merupakan proses mengubah dan memetakan data dari satu bentuk data “mentah” ke dalam format lain dengan maksud membuatnya lebih sesuai dan bernilai untuk berbagai keperluan seperti analitik

Dalam part ini, akan dibahas mengenai transformasi data sederhana dengan menggunakan base R.

Menggunakan base R (tanpa library apapun)

Untuk mensubset di R tanpa library, bisa dilakukan dengan data[baris, kolom], artinya kita ingin mengambil baris atau kolom tertentu.

Contoh:

  1. Mengambil 6 baris awal dan semua kolom (untuk mengambil semua kolom, sebelah kanan kamu , bisa dikosongkan atau ditulis seluruhnya)

data[baris, kolom]

grads <- read.csv("recent-grads.csv")

mengambil semua baris dan 6 kolom

grads[ ,1:6]
##     Rank Major_code
## 1      1       2419
## 2      2       2416
## 3      3       2415
## 4      4       2417
## 5      5       2405
## 6      6       2418
## 7      7       6202
## 8      8       5001
## 9      9       2414
## 10    10       2408
## 11    11       2407
## 12    12       2401
## 13    13       2404
## 14    14       5008
## 15    15       2409
## 16    16       2402
## 17    17       2412
## 18    18       2400
## 19    19       2403
## 20    20       3201
## 21    21       2102
## 22    22       1104
## 23    23       2502
## 24    24       2413
## 25    25       6212
## 26    26       2406
## 27    27       5601
## 28    28       6204
## 29    29       2499
## 30    30       5402
## 31    31       2410
## 32    32       2500
## 33    33       6099
## 34    34       2411
## 35    35       6107
## 36    36       6207
## 37    37       5501
## 38    38       6205
## 39    39       2503
## 40    40       5102
## 41    41       6201
## 42    42       3700
## 43    43       2100
## 44    44       5007
## 45    45       6105
## 46    46       2105
## 47    47       3702
## 48    48       3701
## 49    49       3607
## 50    50       5006
## 51    51       2501
## 52    52       6104
## 53    53       4005
## 54    54       2101
## 55    55       4006
## 56    56       2303
## 57    57       5505
## 58    58       6200
## 59    59       1401
## 60    60       6210
## 61    61       6108
## 62    62       3603
## 63    63       6299
## 64    64       1101
## 65    65       1100
## 66    66       2599
## 67    67       2504
## 68    68       3605
## 69    69       5599
## 70    70       6403
## 71    71       5205
## 72    72       1102
## 73    73       5000
## 74    74       3801
## 75    75       5003
## 76    76       5701
## 77    77       6203
## 78    78       6206
## 79    79       5506
## 80    80       5504
## 81    81       3606
## 82    82       2106
## 83    83       3601
## 84    84       3602
## 85    85       2107
## 86    86       5004
## 87    87       6209
## 88    88       3202
## 89    89       6199
## 90    90       5401
## 91    91       5005
## 92    92       5206
## 93    93       1301
## 94    94       1901
## 95    95       5301
## 96    96       6004
## 97    97       1902
## 98    98       5098
## 99    99       1904
## 100  100       1501
## 101  101       2310
## 102  102       3608
## 103  103       5503
## 104  104       4002
## 105  105       6103
## 106  106       2001
## 107  107       5901
## 108  108       1303
## 109  109       3611
## 110  110       4000
## 111  111       5002
## 112  112       1302
## 113  113       1106
## 114  114       2300
## 115  115       6402
## 116  116       2602
## 117  117       4001
## 118  118       2311
## 119  119       6110
## 120  120       2305
## 121  121       2301
## 122  122       6106
## 123  123       3699
## 124  124       3600
## 125  125       5507
## 126  126       1903
## 127  127       6109
## 128  128       6211
## 129  129       2313
## 130  130       2601
## 131  131       2399
## 132  132       4007
## 133  133       3604
## 134  134       2309
## 135  135       6100
## 136  136       4801
## 137  137       2314
## 138  138       3301
## 139  139       2304
## 140  140       4101
## 141  141       3401
## 142  142       6005
## 143  143       5500
## 144  144       1105
## 145  145       2308
## 146  146       5200
## 147  147       6002
## 148  148       2306
## 149  149       6006
## 150  150       6000
## 151  151       2901
## 152  152       5404
## 153  153       1103
## 154  154       6003
## 155  155       2312
## 156  156       5299
## 157  157       5403
## 158  158       3402
## 159  159       4901
## 160  160       6007
## 161  161       2201
## 162  162       1199
## 163  163       5502
## 164  164       6102
## 165  165       2307
## 166  166       2603
## 167  167       6001
## 168  168       3302
## 169  169       3609
## 170  170       5201
## 171  171       5202
## 172  172       5203
## 173  173       3501
##                                                                 Major  Total
## 1                                               PETROLEUM ENGINEERING   2339
## 2                                      MINING AND MINERAL ENGINEERING    756
## 3                                           METALLURGICAL ENGINEERING    856
## 4                           NAVAL ARCHITECTURE AND MARINE ENGINEERING   1258
## 5                                                CHEMICAL ENGINEERING  32260
## 6                                                 NUCLEAR ENGINEERING   2573
## 7                                                   ACTUARIAL SCIENCE   3777
## 8                                          ASTRONOMY AND ASTROPHYSICS   1792
## 9                                              MECHANICAL ENGINEERING  91227
## 10                                             ELECTRICAL ENGINEERING  81527
## 11                                               COMPUTER ENGINEERING  41542
## 12                                              AEROSPACE ENGINEERING  15058
## 13                                             BIOMEDICAL ENGINEERING  14955
## 14                                                  MATERIALS SCIENCE   4279
## 15                          ENGINEERING MECHANICS PHYSICS AND SCIENCE   4321
## 16                                             BIOLOGICAL ENGINEERING   8925
## 17                           INDUSTRIAL AND MANUFACTURING ENGINEERING  18968
## 18                                                GENERAL ENGINEERING  61152
## 19                                          ARCHITECTURAL ENGINEERING   2825
## 20                                                    COURT REPORTING   1148
## 21                                                   COMPUTER SCIENCE 128319
## 22                                                       FOOD SCIENCE     NA
## 23                                  ELECTRICAL ENGINEERING TECHNOLOGY  11565
## 24                        MATERIALS ENGINEERING AND MATERIALS SCIENCE   2993
## 25                      MANAGEMENT INFORMATION SYSTEMS AND STATISTICS  18713
## 26                                                  CIVIL ENGINEERING  53153
## 27                                              CONSTRUCTION SERVICES  18498
## 28                                OPERATIONS LOGISTICS AND E-COMMERCE  11732
## 29                                          MISCELLANEOUS ENGINEERING   9133
## 30                                                      PUBLIC POLICY   5978
## 31                                          ENVIRONMENTAL ENGINEERING   4047
## 32                                           ENGINEERING TECHNOLOGIES   3600
## 33                                            MISCELLANEOUS FINE ARTS   3340
## 34                             GEOLOGICAL AND GEOPHYSICAL ENGINEERING    720
## 35                                                            NURSING 209394
## 36                                                            FINANCE 174506
## 37                                                          ECONOMICS 139247
## 38                                                 BUSINESS ECONOMICS  13302
## 39                                 INDUSTRIAL PRODUCTION TECHNOLOGIES   4631
## 40         NUCLEAR, INDUSTRIAL RADIOLOGY, AND BIOLOGICAL TECHNOLOGIES   2116
## 41                                                         ACCOUNTING 198633
## 42                                                        MATHEMATICS  72397
## 43                                   COMPUTER AND INFORMATION SYSTEMS  36698
## 44                                                            PHYSICS  32142
## 45                                   MEDICAL TECHNOLOGIES TECHNICIANS  15914
## 46                                               INFORMATION SCIENCES  11913
## 47                                    STATISTICS AND DECISION SCIENCE   6251
## 48                                                APPLIED MATHEMATICS   4939
## 49                                                       PHARMACOLOGY   1762
## 50                                                       OCEANOGRAPHY   2418
## 51                              ENGINEERING AND INDUSTRIAL MANAGEMENT   2906
## 52                                         MEDICAL ASSISTING SERVICES  11123
## 53                                   MATHEMATICS AND COMPUTER SCIENCE    609
## 54                           COMPUTER PROGRAMMING AND DATA PROCESSING   4168
## 55                                COGNITIVE SCIENCE AND BIOPSYCHOLOGY   3831
## 56                                          SCHOOL STUDENT COUNSELING    818
## 57                                            INTERNATIONAL RELATIONS  28187
## 58                                                   GENERAL BUSINESS 234590
## 59                                                       ARCHITECTURE  46420
## 60                                             INTERNATIONAL BUSINESS  25894
## 61                PHARMACY PHARMACEUTICAL SCIENCES AND ADMINISTRATION  23551
## 62                                                  MOLECULAR BIOLOGY  18300
## 63                    MISCELLANEOUS BUSINESS & MEDICAL ADMINISTRATION  17947
## 64                              AGRICULTURE PRODUCTION AND MANAGEMENT  14240
## 65                                                GENERAL AGRICULTURE  10399
## 66                             MISCELLANEOUS ENGINEERING TECHNOLOGIES   8804
## 67                        MECHANICAL ENGINEERING RELATED TECHNOLOGIES   4790
## 68                                                           GENETICS   3635
## 69                                      MISCELLANEOUS SOCIAL SCIENCES   3283
## 70                                              UNITED STATES HISTORY   3079
## 71                           INDUSTRIAL AND ORGANIZATIONAL PSYCHOLOGY   3014
## 72                                             AGRICULTURAL ECONOMICS   2439
## 73                                                  PHYSICAL SCIENCES   1436
## 74                                              MILITARY TECHNOLOGIES    124
## 75                                                          CHEMISTRY  66530
## 76  ELECTRICAL, MECHANICAL, AND PRECISION TECHNOLOGIES AND PRODUCTION   2435
## 77                             BUSINESS MANAGEMENT AND ADMINISTRATION 329927
## 78                                   MARKETING AND MARKETING RESEARCH 205211
## 79                                   POLITICAL SCIENCE AND GOVERNMENT 182621
## 80                                                          GEOGRAPHY  18480
## 81                                                       MICROBIOLOGY  15232
## 82                    COMPUTER ADMINISTRATION MANAGEMENT AND SECURITY   8066
## 83                                               BIOCHEMICAL SCIENCES  39107
## 84                                                             BOTANY   1329
## 85                         COMPUTER NETWORKING AND TELECOMMUNICATIONS   7613
## 86                                          GEOLOGY AND EARTH SCIENCE  10972
## 87                           HUMAN RESOURCES AND PERSONNEL MANAGEMENT  24497
## 88                                          PRE-LAW AND LEGAL STUDIES  13528
## 89                           MISCELLANEOUS HEALTH MEDICAL PROFESSIONS  13386
## 90                                              PUBLIC ADMINISTRATION   5629
## 91                                                        GEOSCIENCES   1978
## 92                                                  SOCIAL PSYCHOLOGY   1386
## 93                                              ENVIRONMENTAL SCIENCE  25965
## 94                                                     COMMUNICATIONS 213996
## 95                               CRIMINAL JUSTICE AND FIRE PROTECTION 152824
## 96                                  COMMERCIAL ART AND GRAPHIC DESIGN 103480
## 97                                                         JOURNALISM  72619
## 98                              MULTI-DISCIPLINARY OR GENERAL SCIENCE  62052
## 99                                   ADVERTISING AND PUBLIC RELATIONS  53162
## 100                              AREA ETHNIC AND CIVILIZATION STUDIES  31195
## 101                                           SPECIAL NEEDS EDUCATION  28739
## 102                                                        PHYSIOLOGY  22060
## 103                                                       CRIMINOLOGY  19879
## 104                                                NUTRITION SCIENCES  18909
## 105                        HEALTH AND MEDICAL ADMINISTRATIVE SERVICES  18109
## 106                                        COMMUNICATION TECHNOLOGIES  18035
## 107                          TRANSPORTATION SCIENCES AND TECHNOLOGIES  15150
## 108                                      NATURAL RESOURCES MANAGEMENT  13773
## 109                                                      NEUROSCIENCE  13663
## 110                                   MULTI/INTERDISCIPLINARY STUDIES  12296
## 111                              ATMOSPHERIC SCIENCES AND METEOROLOGY   4043
## 112                                                          FORESTRY   3607
## 113                                                      SOIL SCIENCE    685
## 114                                                 GENERAL EDUCATION 143718
## 115                                                           HISTORY 141951
## 116     FRENCH GERMAN LATIN AND OTHER COMMON FOREIGN LANGUAGE STUDIES  48246
## 117                           INTERCULTURAL AND INTERNATIONAL STUDIES  24650
## 118                       SOCIAL SCIENCE OR HISTORY TEACHER EDUCATION  20198
## 119                                       COMMUNITY AND PUBLIC HEALTH  19735
## 120                                     MATHEMATICS TEACHER EDUCATION  14237
## 121                        EDUCATIONAL ADMINISTRATION AND SUPERVISION    804
## 122                           HEALTH AND MEDICAL PREPARATORY PROGRAMS  12740
## 123                                             MISCELLANEOUS BIOLOGY  10706
## 124                                                           BIOLOGY 280709
## 125                                                         SOCIOLOGY 115433
## 126                                                        MASS MEDIA  52824
## 127                                     TREATMENT THERAPY PROFESSIONS  48491
## 128                                            HOSPITALITY MANAGEMENT  43647
## 129                                      LANGUAGE AND DRAMA EDUCATION  30471
## 130               LINGUISTICS AND COMPARATIVE LANGUAGE AND LITERATURE  16601
## 131                                           MISCELLANEOUS EDUCATION  10150
## 132                                 INTERDISCIPLINARY SOCIAL SCIENCES   9916
## 133                                                           ECOLOGY   9154
## 134                                       SECONDARY TEACHER EDUCATION  17125
## 135                               GENERAL MEDICAL AND HEALTH SERVICES  33599
## 136                                  PHILOSOPHY AND RELIGIOUS STUDIES  54814
## 137                                           ART AND MUSIC EDUCATION  34181
## 138                                   ENGLISH LANGUAGE AND LITERATURE 194673
## 139                                              ELEMENTARY EDUCATION 170862
## 140                     PHYSICAL FITNESS PARKS RECREATION AND LEISURE 125074
## 141                                                      LIBERAL ARTS  71369
## 142                                  FILM VIDEO AND PHOTOGRAPHIC ARTS  38761
## 143                                           GENERAL SOCIAL SCIENCES  12920
## 144                                        PLANT SCIENCE AND AGRONOMY   7416
## 145                            SCIENCE AND COMPUTER TEACHER EDUCATION   6483
## 146                                                        PSYCHOLOGY 393735
## 147                                                             MUSIC  60633
## 148                            PHYSICAL AND HEALTH EDUCATION TEACHING  28213
## 149                                         ART HISTORY AND CRITICISM  21030
## 150                                                         FINE ARTS  74440
## 151                                      FAMILY AND CONSUMER SCIENCES  58001
## 152                                                       SOCIAL WORK  53552
## 153                                                   ANIMAL SCIENCES  21573
## 154                                        VISUAL AND PERFORMING ARTS  16250
## 155                                TEACHER EDUCATION: MULTIPLE LEVELS  14443
## 156                                          MISCELLANEOUS PSYCHOLOGY   9628
## 157                         HUMAN SERVICES AND COMMUNITY ORGANIZATION   9374
## 158                                                        HUMANITIES   6652
## 159                                  THEOLOGY AND RELIGIOUS VOCATIONS  30207
## 160                                                       STUDIO ARTS  16977
## 161                            COSMETOLOGY SERVICES AND CULINARY ARTS  10510
## 162                                         MISCELLANEOUS AGRICULTURE   1488
## 163                                       ANTHROPOLOGY AND ARCHEOLOGY  38844
## 164                     COMMUNICATION DISORDERS SCIENCES AND SERVICES  38279
## 165                                         EARLY CHILDHOOD EDUCATION  37589
## 166                                           OTHER FOREIGN LANGUAGES  11204
## 167                                            DRAMA AND THEATER ARTS  43249
## 168                                          COMPOSITION AND RHETORIC  18953
## 169                                                           ZOOLOGY   8409
## 170                                            EDUCATIONAL PSYCHOLOGY   2854
## 171                                               CLINICAL PSYCHOLOGY   2838
## 172                                             COUNSELING PSYCHOLOGY   4626
## 173                                                   LIBRARY SCIENCE   1098
##        Men  Women
## 1     2057    282
## 2      679     77
## 3      725    131
## 4     1123    135
## 5    21239  11021
## 6     2200    373
## 7     2110   1667
## 8      832    960
## 9    80320  10907
## 10   65511  16016
## 11   33258   8284
## 12   12953   2105
## 13    8407   6548
## 14    2949   1330
## 15    3526    795
## 16    6062   2863
## 17   12453   6515
## 18   45683  15469
## 19    1835    990
## 20     877    271
## 21   99743  28576
## 22      NA     NA
## 23    8181   3384
## 24    2020    973
## 25   13496   5217
## 26   41081  12072
## 27   16820   1678
## 28    7921   3811
## 29    7398   1735
## 30    2639   3339
## 31    2662   1385
## 32    2695    905
## 33    1970   1370
## 34     488    232
## 35   21773 187621
## 36  115030  59476
## 37   89749  49498
## 38    7575   5727
## 39    3477   1154
## 40     528   1588
## 41   94519 104114
## 42   39956  32441
## 43   27392   9306
## 44   23080   9062
## 45    3916  11998
## 46    9005   2908
## 47    2960   3291
## 48    2794   2145
## 49     515   1247
## 50     752   1666
## 51    2400    506
## 52     803  10320
## 53     500    109
## 54    3046   1122
## 55    1667   2164
## 56     119    699
## 57   10345  17842
## 58  132238 102352
## 59   25463  20957
## 60   10624  15270
## 61    8697  14854
## 62    7426  10874
## 63   10285   7662
## 64    9658   4582
## 65    6053   4346
## 66    7043   1761
## 67    4419    371
## 68    1761   1874
## 69    1499   1784
## 70    1756   1323
## 71    1075   1939
## 72    1749    690
## 73     894    542
## 74     124      0
## 75   32923  33607
## 76    1869    566
## 77  173809 156118
## 78   78857 126354
## 79   93880  88741
## 80   11404   7076
## 81    6383   8849
## 82    6607   1459
## 83   18951  20156
## 84     626    703
## 85    5291   2322
## 86    5813   5159
## 87    6184  18313
## 88    4435   9093
## 89    1589  11797
## 90    2947   2682
## 91     809   1169
## 92     413    973
## 93   10787  15178
## 94   70619 143377
## 95   80231  72593
## 96   32041  71439
## 97   23736  48883
## 98   27015  35037
## 99   12862  40300
## 100   8739  22456
## 101   2682  26057
## 102   8422  13638
## 103  10031   9848
## 104   2563  16346
## 105   4266  13843
## 106  11431   6604
## 107  13257   1893
## 108   8617   5156
## 109   4944   8719
## 110   2817   9479
## 111   2744   1299
## 112   3156    451
## 113    476    209
## 114  26893 116825
## 115  78253  63698
## 116  12835  35411
## 117   8575  16075
## 118   9950  10248
## 119   4103  15632
## 120   3872  10365
## 121    280    524
## 122   5521   7219
## 123   4747   5959
## 124 111762 168947
## 125  32510  82923
## 126  24704  28120
## 127  13487  35004
## 128  15204  28443
## 129   3741  26730
## 130   4416  12185
## 131   3654   6496
## 132   2337   7579
## 133   3878   5276
## 134   6820  10305
## 135   7574  26025
## 136  31967  22847
## 137  10732  23449
## 138  58227 136446
## 139  13029 157833
## 140  62181  62893
## 141  22339  49030
## 142  22357  16404
## 143   5079   7841
## 144   4897   2519
## 145   2049   4434
## 146  86648 307087
## 147  29909  30724
## 148  15670  12543
## 149   3240  17790
## 150  24786  49654
## 151   5166  52835
## 152   5137  48415
## 153   5347  16226
## 154   4133  12117
## 155   2734  11709
## 156   1936   7692
## 157    885   8489
## 158   2013   4639
## 159  18616  11591
## 160   4754  12223
## 161   4364   6146
## 162    404   1084
## 163  11376  27468
## 164   1225  37054
## 165   1167  36422
## 166   3472   7732
## 167  14440  28809
## 168   7022  11931
## 169   3050   5359
## 170    522   2332
## 171    568   2270
## 172    931   3695
## 173    134    964
tail(grads) # untuk mengambil 6 baris terakhir dengan fungsi tail()
##     Rank Major_code                    Major Total  Men Women
## 168  168       3302 COMPOSITION AND RHETORIC 18953 7022 11931
## 169  169       3609                  ZOOLOGY  8409 3050  5359
## 170  170       5201   EDUCATIONAL PSYCHOLOGY  2854  522  2332
## 171  171       5202      CLINICAL PSYCHOLOGY  2838  568  2270
## 172  172       5203    COUNSELING PSYCHOLOGY  4626  931  3695
## 173  173       3501          LIBRARY SCIENCE  1098  134   964
##                Major_category ShareWomen Sample_size Employed Full_time
## 168 Humanities & Liberal Arts  0.6295046         151    15053     10121
## 169    Biology & Life Science  0.6372934          47     6259      5043
## 170  Psychology & Social Work  0.8170988           7     2125      1848
## 171  Psychology & Social Work  0.7998591          13     2101      1724
## 172  Psychology & Social Work  0.7987462          21     3777      3154
## 173                 Education  0.8779599           2      742       593
##     Part_time Full_time_year_round Unemployed Unemployment_rate Median P25th
## 168      6612                 7832       1340        0.08174221  27000 20000
## 169      2190                 3602        304        0.04632028  26000 20000
## 170       572                 1211        148        0.06511219  25000 24000
## 171       648                 1293        368        0.14904820  25000 25000
## 172       965                 2738        214        0.05362065  23400 19200
## 173       237                  410         87        0.10494572  22000 20000
##     P75th College_jobs Non_college_jobs Low_wage_jobs
## 168 35000         4855             8100          3466
## 169 39000         2771             2947           743
## 170 34000         1488              615            82
## 171 40000          986              870           622
## 172 26000         2403             1245           308
## 173 22000          288              338           192
head(grads)
##   Rank Major_code                                     Major Total   Men Women
## 1    1       2419                     PETROLEUM ENGINEERING  2339  2057   282
## 2    2       2416            MINING AND MINERAL ENGINEERING   756   679    77
## 3    3       2415                 METALLURGICAL ENGINEERING   856   725   131
## 4    4       2417 NAVAL ARCHITECTURE AND MARINE ENGINEERING  1258  1123   135
## 5    5       2405                      CHEMICAL ENGINEERING 32260 21239 11021
## 6    6       2418                       NUCLEAR ENGINEERING  2573  2200   373
##   Major_category ShareWomen Sample_size Employed Full_time Part_time
## 1    Engineering  0.1205643          36     1976      1849       270
## 2    Engineering  0.1018519           7      640       556       170
## 3    Engineering  0.1530374           3      648       558       133
## 4    Engineering  0.1073132          16      758      1069       150
## 5    Engineering  0.3416305         289    25694     23170      5180
## 6    Engineering  0.1449670          17     1857      2038       264
##   Full_time_year_round Unemployed Unemployment_rate Median P25th  P75th
## 1                 1207         37        0.01838053 110000 95000 125000
## 2                  388         85        0.11724138  75000 55000  90000
## 3                  340         16        0.02409639  73000 50000 105000
## 4                  692         40        0.05012531  70000 43000  80000
## 5                16697       1672        0.06109771  65000 50000  75000
## 6                 1449        400        0.17722641  65000 50000 102000
##   College_jobs Non_college_jobs Low_wage_jobs
## 1         1534              364           193
## 2          350              257            50
## 3          456              176             0
## 4          529              102             0
## 5        18314             4440           972
## 6         1142              657           244
  1. Mengambil semua data dengan syarat Major Category adalah “Business” dan kolom “Major” dan “College_jobs”
grads[grads$Major_category == "Business", c("Major", "College_jobs")]
##                                               Major College_jobs
## 7                                 ACTUARIAL SCIENCE         1768
## 25    MANAGEMENT INFORMATION SYSTEMS AND STATISTICS         6342
## 28              OPERATIONS LOGISTICS AND E-COMMERCE         1466
## 36                                          FINANCE        24243
## 38                               BUSINESS ECONOMICS         1578
## 41                                       ACCOUNTING        11417
## 58                                 GENERAL BUSINESS        29334
## 60                           INTERNATIONAL BUSINESS         3383
## 63  MISCELLANEOUS BUSINESS & MEDICAL ADMINISTRATION         2236
## 77           BUSINESS MANAGEMENT AND ADMINISTRATION        36720
## 78                 MARKETING AND MARKETING RESEARCH        25320
## 87         HUMAN RESOURCES AND PERSONNEL MANAGEMENT         2406
## 128                          HOSPITALITY MANAGEMENT         2325

Membuat variabel/kolom baru

Terkadang, data yang sudah kita load memiliki beberapa tipe data yang tidak sesuai dengan keinginan kita, contoh misalkan kita memiliki variabel Men dan Women yang merupakan jumlah pria dan wanita untuk setiap major dan kita ingin membuat variabel gender_gap untuk melihat perbedaan jenis kelamin pada major tersebut. Untuk membuat variabel baru, dapat dilakukan seperti di bawah ini

grads$gender_gap <- grads$Men - grads$Women

grads[, c("Men", "Women", "gender_gap")]
##        Men  Women gender_gap
## 1     2057    282       1775
## 2      679     77        602
## 3      725    131        594
## 4     1123    135        988
## 5    21239  11021      10218
## 6     2200    373       1827
## 7     2110   1667        443
## 8      832    960       -128
## 9    80320  10907      69413
## 10   65511  16016      49495
## 11   33258   8284      24974
## 12   12953   2105      10848
## 13    8407   6548       1859
## 14    2949   1330       1619
## 15    3526    795       2731
## 16    6062   2863       3199
## 17   12453   6515       5938
## 18   45683  15469      30214
## 19    1835    990        845
## 20     877    271        606
## 21   99743  28576      71167
## 22      NA     NA         NA
## 23    8181   3384       4797
## 24    2020    973       1047
## 25   13496   5217       8279
## 26   41081  12072      29009
## 27   16820   1678      15142
## 28    7921   3811       4110
## 29    7398   1735       5663
## 30    2639   3339       -700
## 31    2662   1385       1277
## 32    2695    905       1790
## 33    1970   1370        600
## 34     488    232        256
## 35   21773 187621    -165848
## 36  115030  59476      55554
## 37   89749  49498      40251
## 38    7575   5727       1848
## 39    3477   1154       2323
## 40     528   1588      -1060
## 41   94519 104114      -9595
## 42   39956  32441       7515
## 43   27392   9306      18086
## 44   23080   9062      14018
## 45    3916  11998      -8082
## 46    9005   2908       6097
## 47    2960   3291       -331
## 48    2794   2145        649
## 49     515   1247       -732
## 50     752   1666       -914
## 51    2400    506       1894
## 52     803  10320      -9517
## 53     500    109        391
## 54    3046   1122       1924
## 55    1667   2164       -497
## 56     119    699       -580
## 57   10345  17842      -7497
## 58  132238 102352      29886
## 59   25463  20957       4506
## 60   10624  15270      -4646
## 61    8697  14854      -6157
## 62    7426  10874      -3448
## 63   10285   7662       2623
## 64    9658   4582       5076
## 65    6053   4346       1707
## 66    7043   1761       5282
## 67    4419    371       4048
## 68    1761   1874       -113
## 69    1499   1784       -285
## 70    1756   1323        433
## 71    1075   1939       -864
## 72    1749    690       1059
## 73     894    542        352
## 74     124      0        124
## 75   32923  33607       -684
## 76    1869    566       1303
## 77  173809 156118      17691
## 78   78857 126354     -47497
## 79   93880  88741       5139
## 80   11404   7076       4328
## 81    6383   8849      -2466
## 82    6607   1459       5148
## 83   18951  20156      -1205
## 84     626    703        -77
## 85    5291   2322       2969
## 86    5813   5159        654
## 87    6184  18313     -12129
## 88    4435   9093      -4658
## 89    1589  11797     -10208
## 90    2947   2682        265
## 91     809   1169       -360
## 92     413    973       -560
## 93   10787  15178      -4391
## 94   70619 143377     -72758
## 95   80231  72593       7638
## 96   32041  71439     -39398
## 97   23736  48883     -25147
## 98   27015  35037      -8022
## 99   12862  40300     -27438
## 100   8739  22456     -13717
## 101   2682  26057     -23375
## 102   8422  13638      -5216
## 103  10031   9848        183
## 104   2563  16346     -13783
## 105   4266  13843      -9577
## 106  11431   6604       4827
## 107  13257   1893      11364
## 108   8617   5156       3461
## 109   4944   8719      -3775
## 110   2817   9479      -6662
## 111   2744   1299       1445
## 112   3156    451       2705
## 113    476    209        267
## 114  26893 116825     -89932
## 115  78253  63698      14555
## 116  12835  35411     -22576
## 117   8575  16075      -7500
## 118   9950  10248       -298
## 119   4103  15632     -11529
## 120   3872  10365      -6493
## 121    280    524       -244
## 122   5521   7219      -1698
## 123   4747   5959      -1212
## 124 111762 168947     -57185
## 125  32510  82923     -50413
## 126  24704  28120      -3416
## 127  13487  35004     -21517
## 128  15204  28443     -13239
## 129   3741  26730     -22989
## 130   4416  12185      -7769
## 131   3654   6496      -2842
## 132   2337   7579      -5242
## 133   3878   5276      -1398
## 134   6820  10305      -3485
## 135   7574  26025     -18451
## 136  31967  22847       9120
## 137  10732  23449     -12717
## 138  58227 136446     -78219
## 139  13029 157833    -144804
## 140  62181  62893       -712
## 141  22339  49030     -26691
## 142  22357  16404       5953
## 143   5079   7841      -2762
## 144   4897   2519       2378
## 145   2049   4434      -2385
## 146  86648 307087    -220439
## 147  29909  30724       -815
## 148  15670  12543       3127
## 149   3240  17790     -14550
## 150  24786  49654     -24868
## 151   5166  52835     -47669
## 152   5137  48415     -43278
## 153   5347  16226     -10879
## 154   4133  12117      -7984
## 155   2734  11709      -8975
## 156   1936   7692      -5756
## 157    885   8489      -7604
## 158   2013   4639      -2626
## 159  18616  11591       7025
## 160   4754  12223      -7469
## 161   4364   6146      -1782
## 162    404   1084       -680
## 163  11376  27468     -16092
## 164   1225  37054     -35829
## 165   1167  36422     -35255
## 166   3472   7732      -4260
## 167  14440  28809     -14369
## 168   7022  11931      -4909
## 169   3050   5359      -2309
## 170    522   2332      -1810
## 171    568   2270      -1702
## 172    931   3695      -2764
## 173    134    964       -830

cara membuat kolom/ variabel baru adalah: nama objek $ nama variabel <- operasi

grads$gender.gap <- grads$Men - grads$Women
grads$Major_category <- as.factor(grads$Major_category)
grads[ , c("Rank", "Major_category", "Men", "Women", "gender.gap")]
##     Rank                      Major_category    Men  Women gender.gap
## 1      1                         Engineering   2057    282       1775
## 2      2                         Engineering    679     77        602
## 3      3                         Engineering    725    131        594
## 4      4                         Engineering   1123    135        988
## 5      5                         Engineering  21239  11021      10218
## 6      6                         Engineering   2200    373       1827
## 7      7                            Business   2110   1667        443
## 8      8                   Physical Sciences    832    960       -128
## 9      9                         Engineering  80320  10907      69413
## 10    10                         Engineering  65511  16016      49495
## 11    11                         Engineering  33258   8284      24974
## 12    12                         Engineering  12953   2105      10848
## 13    13                         Engineering   8407   6548       1859
## 14    14                         Engineering   2949   1330       1619
## 15    15                         Engineering   3526    795       2731
## 16    16                         Engineering   6062   2863       3199
## 17    17                         Engineering  12453   6515       5938
## 18    18                         Engineering  45683  15469      30214
## 19    19                         Engineering   1835    990        845
## 20    20                 Law & Public Policy    877    271        606
## 21    21             Computers & Mathematics  99743  28576      71167
## 22    22     Agriculture & Natural Resources     NA     NA         NA
## 23    23                         Engineering   8181   3384       4797
## 24    24                         Engineering   2020    973       1047
## 25    25                            Business  13496   5217       8279
## 26    26                         Engineering  41081  12072      29009
## 27    27 Industrial Arts & Consumer Services  16820   1678      15142
## 28    28                            Business   7921   3811       4110
## 29    29                         Engineering   7398   1735       5663
## 30    30                 Law & Public Policy   2639   3339       -700
## 31    31                         Engineering   2662   1385       1277
## 32    32                         Engineering   2695    905       1790
## 33    33                                Arts   1970   1370        600
## 34    34                         Engineering    488    232        256
## 35    35                              Health  21773 187621    -165848
## 36    36                            Business 115030  59476      55554
## 37    37                      Social Science  89749  49498      40251
## 38    38                            Business   7575   5727       1848
## 39    39                         Engineering   3477   1154       2323
## 40    40                   Physical Sciences    528   1588      -1060
## 41    41                            Business  94519 104114      -9595
## 42    42             Computers & Mathematics  39956  32441       7515
## 43    43             Computers & Mathematics  27392   9306      18086
## 44    44                   Physical Sciences  23080   9062      14018
## 45    45                              Health   3916  11998      -8082
## 46    46             Computers & Mathematics   9005   2908       6097
## 47    47             Computers & Mathematics   2960   3291       -331
## 48    48             Computers & Mathematics   2794   2145        649
## 49    49              Biology & Life Science    515   1247       -732
## 50    50                   Physical Sciences    752   1666       -914
## 51    51                         Engineering   2400    506       1894
## 52    52                              Health    803  10320      -9517
## 53    53             Computers & Mathematics    500    109        391
## 54    54             Computers & Mathematics   3046   1122       1924
## 55    55              Biology & Life Science   1667   2164       -497
## 56    56                           Education    119    699       -580
## 57    57                      Social Science  10345  17842      -7497
## 58    58                            Business 132238 102352      29886
## 59    59                         Engineering  25463  20957       4506
## 60    60                            Business  10624  15270      -4646
## 61    61                              Health   8697  14854      -6157
## 62    62              Biology & Life Science   7426  10874      -3448
## 63    63                            Business  10285   7662       2623
## 64    64     Agriculture & Natural Resources   9658   4582       5076
## 65    65     Agriculture & Natural Resources   6053   4346       1707
## 66    66                         Engineering   7043   1761       5282
## 67    67                         Engineering   4419    371       4048
## 68    68              Biology & Life Science   1761   1874       -113
## 69    69                      Social Science   1499   1784       -285
## 70    70           Humanities & Liberal Arts   1756   1323        433
## 71    71            Psychology & Social Work   1075   1939       -864
## 72    72     Agriculture & Natural Resources   1749    690       1059
## 73    73                   Physical Sciences    894    542        352
## 74    74 Industrial Arts & Consumer Services    124      0        124
## 75    75                   Physical Sciences  32923  33607       -684
## 76    76 Industrial Arts & Consumer Services   1869    566       1303
## 77    77                            Business 173809 156118      17691
## 78    78                            Business  78857 126354     -47497
## 79    79                      Social Science  93880  88741       5139
## 80    80                      Social Science  11404   7076       4328
## 81    81              Biology & Life Science   6383   8849      -2466
## 82    82             Computers & Mathematics   6607   1459       5148
## 83    83              Biology & Life Science  18951  20156      -1205
## 84    84              Biology & Life Science    626    703        -77
## 85    85             Computers & Mathematics   5291   2322       2969
## 86    86                   Physical Sciences   5813   5159        654
## 87    87                            Business   6184  18313     -12129
## 88    88                 Law & Public Policy   4435   9093      -4658
## 89    89                              Health   1589  11797     -10208
## 90    90                 Law & Public Policy   2947   2682        265
## 91    91                   Physical Sciences    809   1169       -360
## 92    92            Psychology & Social Work    413    973       -560
## 93    93              Biology & Life Science  10787  15178      -4391
## 94    94         Communications & Journalism  70619 143377     -72758
## 95    95                 Law & Public Policy  80231  72593       7638
## 96    96                                Arts  32041  71439     -39398
## 97    97         Communications & Journalism  23736  48883     -25147
## 98    98                   Physical Sciences  27015  35037      -8022
## 99    99         Communications & Journalism  12862  40300     -27438
## 100  100           Humanities & Liberal Arts   8739  22456     -13717
## 101  101                           Education   2682  26057     -23375
## 102  102              Biology & Life Science   8422  13638      -5216
## 103  103                      Social Science  10031   9848        183
## 104  104                              Health   2563  16346     -13783
## 105  105                              Health   4266  13843      -9577
## 106  106             Computers & Mathematics  11431   6604       4827
## 107  107 Industrial Arts & Consumer Services  13257   1893      11364
## 108  108     Agriculture & Natural Resources   8617   5156       3461
## 109  109              Biology & Life Science   4944   8719      -3775
## 110  110                   Interdisciplinary   2817   9479      -6662
## 111  111                   Physical Sciences   2744   1299       1445
## 112  112     Agriculture & Natural Resources   3156    451       2705
## 113  113     Agriculture & Natural Resources    476    209        267
## 114  114                           Education  26893 116825     -89932
## 115  115           Humanities & Liberal Arts  78253  63698      14555
## 116  116           Humanities & Liberal Arts  12835  35411     -22576
## 117  117           Humanities & Liberal Arts   8575  16075      -7500
## 118  118                           Education   9950  10248       -298
## 119  119                              Health   4103  15632     -11529
## 120  120                           Education   3872  10365      -6493
## 121  121                           Education    280    524       -244
## 122  122                              Health   5521   7219      -1698
## 123  123              Biology & Life Science   4747   5959      -1212
## 124  124              Biology & Life Science 111762 168947     -57185
## 125  125                      Social Science  32510  82923     -50413
## 126  126         Communications & Journalism  24704  28120      -3416
## 127  127                              Health  13487  35004     -21517
## 128  128                            Business  15204  28443     -13239
## 129  129                           Education   3741  26730     -22989
## 130  130           Humanities & Liberal Arts   4416  12185      -7769
## 131  131                           Education   3654   6496      -2842
## 132  132                      Social Science   2337   7579      -5242
## 133  133              Biology & Life Science   3878   5276      -1398
## 134  134                           Education   6820  10305      -3485
## 135  135                              Health   7574  26025     -18451
## 136  136           Humanities & Liberal Arts  31967  22847       9120
## 137  137                           Education  10732  23449     -12717
## 138  138           Humanities & Liberal Arts  58227 136446     -78219
## 139  139                           Education  13029 157833    -144804
## 140  140 Industrial Arts & Consumer Services  62181  62893       -712
## 141  141           Humanities & Liberal Arts  22339  49030     -26691
## 142  142                                Arts  22357  16404       5953
## 143  143                      Social Science   5079   7841      -2762
## 144  144     Agriculture & Natural Resources   4897   2519       2378
## 145  145                           Education   2049   4434      -2385
## 146  146            Psychology & Social Work  86648 307087    -220439
## 147  147                                Arts  29909  30724       -815
## 148  148                           Education  15670  12543       3127
## 149  149           Humanities & Liberal Arts   3240  17790     -14550
## 150  150                                Arts  24786  49654     -24868
## 151  151 Industrial Arts & Consumer Services   5166  52835     -47669
## 152  152            Psychology & Social Work   5137  48415     -43278
## 153  153     Agriculture & Natural Resources   5347  16226     -10879
## 154  154                                Arts   4133  12117      -7984
## 155  155                           Education   2734  11709      -8975
## 156  156            Psychology & Social Work   1936   7692      -5756
## 157  157            Psychology & Social Work    885   8489      -7604
## 158  158           Humanities & Liberal Arts   2013   4639      -2626
## 159  159           Humanities & Liberal Arts  18616  11591       7025
## 160  160                                Arts   4754  12223      -7469
## 161  161 Industrial Arts & Consumer Services   4364   6146      -1782
## 162  162     Agriculture & Natural Resources    404   1084       -680
## 163  163           Humanities & Liberal Arts  11376  27468     -16092
## 164  164                              Health   1225  37054     -35829
## 165  165                           Education   1167  36422     -35255
## 166  166           Humanities & Liberal Arts   3472   7732      -4260
## 167  167                                Arts  14440  28809     -14369
## 168  168           Humanities & Liberal Arts   7022  11931      -4909
## 169  169              Biology & Life Science   3050   5359      -2309
## 170  170            Psychology & Social Work    522   2332      -1810
## 171  171            Psychology & Social Work    568   2270      -1702
## 172  172            Psychology & Social Work    931   3695      -2764
## 173  173                           Education    134    964       -830

Pertama yang akan dilakukan sebelum masuk pada pengujian adalah memuat dataset:

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.5
tourism <-read_excel("tourism.xlsx")

Tugas: Berikut ada data set Titanic.csv

Memahami dataset 1. PassangerId : nomor Id penumpang 2. Survived : keterangan selamt (0 = tidak, 1 = ya) 3. Pclass = kelas tiket (1=kelas 1, 2 = kelas 2, dst) 4. Name = nama penumpang 5. Sex = jenis kelamin 6. Age = usia dalam tahun 7. SibSp = jumlah saudara kandung/ pasangan di kapal titanic 8. Parch = mlah orang tua/ anak di kapal titanic 9. Ticket = nomor tiket 10. Fare = harga tiket 11. Cabin = nama kabin 12. Embarked = pelabuhan asal (C=cherbourg, Q = Queenstown, S = Southampton)

  1. Buatkan project dan Rmarkdown baru
  2. Pada Rmarkdown tunjukkan cara mengecek lokasi
  3. Buatkan cara mengimport dataset menggunakan 2 jenis cara yang sudah dijelaskan
  4. Buatkan object baru untuk dataset tersebut
  5. Tunjukkan cara menampilkan dataset
  6. Tunjukkan cara menampilkan data paling atas dan data paling bawah
  7. Buatkan fungsi summary untuk dataset tersebut
  8. Tunjukkan cara merubah variabel sex (jenis kelamis menjadi faktor) dan tunjukkan fungsi summary yang sudah merubah variabel tersebut