print("This is my first code")
## [1] "This is my first code"
fungsi print(): mencetak atau menampilkan hasil atau ingin mengetahui nilai dari suatu objek print(variabel/object)
menulis kode/syntax dapat dilakukan pada chunk cara membuat 1 chunk: ctrl + alt + i
1+2
## [1] 3
ingin membuat operasi penjumlahan:
1+2
## [1] 3
mengeksekusi chunk bisa dilakukan dengan klik tanda segitiga hijau pada sudut kanan atas chunk atau dengan shortcut ctrl + shift + enter untuk mengeksekusi 1 line/baris pada chunk bisa dengan ctrl + enter
1+1
## [1] 2
1+3
## [1] 4
Bahasa R itu sensisitif terhadap kapitalisasi dalam penulisan objek (sensitif terhadap huruf bedar dan huruf kecil)
a <- 2
print(a)
## [1] 2
operator assigment utama pada R (<-) objek <- ekpresi/nilai (memasukkan nilai hasil dari operasi di sebelah kanan ke dalam objek yang berada di sebelah kiri) shortcut : Alt + - ingin memanggil objek tersebut cukup dengan menuliskan nama objeknya atau menggunakan fungsi print()
x <- 5
x
## [1] 5
Terdapat beberapa strutur data di R, yakni
Kita simpulkan: Dimensi Homogen Heterogen 1D Atomic vektor List 2D Matrix data frame
Homogen: object/ variabel tersebut hanya menyimpan 1 tipe data atau 1 jenis data saja. (1 tipe data numeric atau 1 tipe data integer, atau 1 tipe data faktor) Hetogen: obejct/ variabel memiliki lebih dari 1 tipe data (misal dalam object tersebut memiliki tipe data numeric dan karakter)
Dari ke-empat sruktur data yang ada di R, pada bab ini akan dibahas mengenai 2 struktur data, yakni atomic vector dan data frame.
Merupakan sebuah object yang memiliki satu tipe data dan satu dimensi. Pada atomic vector, kita dapat membuat sebuah obyek dengan anggotanya memiliki satu tipe data. Namun, ketika kita menginput data lebih dari satu tipe data, maka secara otomatis akan terkonversi menjadi salah satu tipe data yang lebih umum.
Berikut merupakan beberapa tipe data yang telah diurutkan dari tingkat yang paling umum:
Karakter merupakan tipe data yang paling umum pada R. Untuk membuat obyek dengan tipe data karakter, kita data menambahkan operator " " (kutip dua) pada tiap anggotanya. contoh : kita ingin menunjukkan penggunaaan tipe data karakter pada variabel mata_kuliah
objek/variabel <- nilai/ ekspresi <- : operator assignment atau tanda untuk mendefinisikan objek <- : Alt + - Ctrl + Alt + i
nama <- "idel"
print(nama)
## [1] "idel"
MataKuliah <- 'Belajar R'
R itu dia sangat sensitif terhadap huruf besar dan huruf kecil
MataKuliah
## [1] "Belajar R"
Selain itu, untuk meng-input lebih dari satu anggota pada obyek, bisa dilakukan dengan fungsi c() yang dapat kita artikan sebagai combine.
kar <- c("a", "b", "c")
kar
## [1] "a" "b" "c"
data_mahasiswa <- c("badu", "budi", "indah", "mutia")
data_mahasiswa
## [1] "badu" "budi" "indah" "mutia"
Untuk cek tipe data, dapat dilakukan dengan fungsi class(nama_obyek).
class(kar)
## [1] "character"
class(MataKuliah)
## [1] "character"
class(data_mahasiswa)
## [1] "character"
Tipe data kedua yang paling umum adalah numeric. Numeric merupakan tipe bilangan nyata, sehingga mengizinkan adanya bilangan desimal.
num1 <- 2
num1
## [1] 2
num <- c(1, 2.4, 7)
num
## [1] 1.0 2.4 7.0
class(num)
## [1] "numeric"
class(num)
## [1] "numeric"
Tipe data interger merupakan tipe data bilangan bulat. Untuk menginput bilangan yang berurutan, bisa dilakukan dengan operator :.
int <- c(1:10)
int
## [1] 1 2 3 4 5 6 7 8 9 10
int [2]
## [1] 2
int [c(3,4)]
## [1] 3 4
class(int)
## [1] "integer"
class(int)
## [1] "integer"
Sedangkan, saat anggotanya tidak berurutan, dapat ditambahkan L setelah angkanya
int2 <- c(2L, 5L)
int2
## [1] 2 5
int2 [1]
## [1] 2
class(int2)
## [1] "integer"
Logical merupakan tipe data yang berisi TRUE atau FALSE. Untuk membuat sebuah object dengan tipe data logical, kita bisa menuliskan anggotanya dengan TRUE, FALSE, T, F.
logi <- c(TRUE, FALSE, T, F)
logi
## [1] TRUE FALSE TRUE FALSE
class(logi)
## [1] "logical"
Misal kita memasukkan lebih dari 1 tipe data pada suatu object, seperti di bawah ini:
campur <- c(TRUE, 3, "Bintang")
campur
## [1] "TRUE" "3" "Bintang"
Dari output di atas semua tipe data terkonversi menjadi karakter, terlihat dari semua anggota memiliki petik dua.
class(campur)
## [1] "character"
Setelah dicek menggunakan fungsi class(), didapat hasilnya pun character, hal ini karena R akan mengkonversi menjadi tipe data yang paling umum, yakni character.
Data frame merupakan struktur data yang mempunyai 2 dimensi. Misal kita ingin membuat sebuah data frame dengan nama-nama kolom/variabelnya adalah Divisi, Nama, dan Tinggi dan memasukkan masing-masing 3 anggota ke dalam 3 kolom tersebut.
misal: ingin membuat kolom dengan variabel: divisi, nama, dan tinggi anggota dari kolomnya ada 3 anggota masing-masing kolom divisi: A1, A2, A3 nama: ross, ihaka, robert tinggi: 158, 160, 172
df <- data.frame(Divisi = c("A1","A2","A3"),
Nama = c("Ross", "Ihaka", "Robert"),
Tinggi = c(158, 160, 172))
df
## Divisi Nama Tinggi
## 1 A1 Ross 158
## 2 A2 Ihaka 160
## 3 A3 Robert 172
class(df)
## [1] "data.frame"
Hasil yang didapat adalah kita memiliki 3 baris dan 3 kolom pada data frame df.
contoh <- data.frame(No=c(1,2,3),
Nama=c("bunga", "dinda", "budi"),
jenis.kelamin=c("P", "P", "L"),
usia=c(27, 28, 29))
contoh$jenis.kelamin <- as.factor(contoh$jenis.kelamin)
contoh
## No Nama jenis.kelamin usia
## 1 1 bunga P 27
## 2 2 dinda P 28
## 3 3 budi L 29
tail(contoh)
## No Nama jenis.kelamin usia
## 1 1 bunga P 27
## 2 2 dinda P 28
## 3 3 budi L 29
Seringkali kita memiliki kebutuhan untuk mengubah tipe data yang ada. Misal dari data frame df, kita ingin mengubah variabel Divisi dari tipe character menjadi factor. Hal ini dapat dilakukan dengan:
df$Divisi <- as.factor(df$Divisi)
df
## Divisi Nama Tinggi
## 1 A1 Ross 158
## 2 A2 Ihaka 160
## 3 A3 Robert 172
Saya ingin mengubah tipe data dari kolom Tinggi ke dalam integer
df$Tinggi <- as.integer(df$Tinggi)
df
## Divisi Nama Tinggi
## 1 A1 Ross 158
## 2 A2 Ihaka 160
## 3 A3 Robert 172
df$Tinggi<-as.numeric(df$Tinggi)
df
## Divisi Nama Tinggi
## 1 A1 Ross 158
## 2 A2 Ihaka 160
## 3 A3 Robert 172
Keterangan: Variabel $ berfungsi untuk memanggil variabel pada data frame.
Dari hasil di atas, didapat tipe variabel Nama sudah berubah, yang awalnya factor menjadi character. Adapun untuk mengganti dengan tipe data lainnya, bisa dilakukan dengan fungsi:
Pada bab ini akan ditampilkan bagaimana cara membaca sebuah data dengan tipe .csv (comma-separated values). Untuk membaca file dalam bentuk .csv tidak dibutuhkan library atau package apapun, memanggil file dalam bentuk .csv bisa dilakukan dengan memanggil fungsi read.csv()
getwd()
## [1] "D:/bahan ajar/2021/statistika industri/R programming"
mendefinisikan object dengan nama grads dan menggunakan file format csv yang sudah ada dengan nama recent-grads.csv
grads <- read.csv("D:/bahan ajar/2021/statistika industri/R programming/recent-grads.csv")
grads <- read.csv("recent-grads.csv")
summary(grads)
## Rank Major_code Major Total
## Min. : 1 Min. :1100 Length:173 Min. : 124
## 1st Qu.: 44 1st Qu.:2403 Class :character 1st Qu.: 4550
## Median : 87 Median :3608 Mode :character Median : 15104
## Mean : 87 Mean :3880 Mean : 39370
## 3rd Qu.:130 3rd Qu.:5503 3rd Qu.: 38910
## Max. :173 Max. :6403 Max. :393735
## NA's :1
## Men Women Major_category ShareWomen
## Min. : 119 Min. : 0 Length:173 Min. :0.0000
## 1st Qu.: 2178 1st Qu.: 1778 Class :character 1st Qu.:0.3360
## Median : 5434 Median : 8386 Mode :character Median :0.5340
## Mean : 16723 Mean : 22647 Mean :0.5222
## 3rd Qu.: 14631 3rd Qu.: 22554 3rd Qu.:0.7033
## Max. :173809 Max. :307087 Max. :0.9690
## NA's :1 NA's :1 NA's :1
## Sample_size Employed Full_time Part_time
## Min. : 2.0 Min. : 0 Min. : 111 Min. : 0
## 1st Qu.: 39.0 1st Qu.: 3608 1st Qu.: 3154 1st Qu.: 1030
## Median : 130.0 Median : 11797 Median : 10048 Median : 3299
## Mean : 356.1 Mean : 31193 Mean : 26029 Mean : 8832
## 3rd Qu.: 338.0 3rd Qu.: 31433 3rd Qu.: 25147 3rd Qu.: 9948
## Max. :4212.0 Max. :307933 Max. :251540 Max. :115172
##
## Full_time_year_round Unemployed Unemployment_rate Median
## Min. : 111 Min. : 0 Min. :0.00000 Min. : 22000
## 1st Qu.: 2453 1st Qu.: 304 1st Qu.:0.05031 1st Qu.: 33000
## Median : 7413 Median : 893 Median :0.06796 Median : 36000
## Mean : 19694 Mean : 2416 Mean :0.06819 Mean : 40151
## 3rd Qu.: 16891 3rd Qu.: 2393 3rd Qu.:0.08756 3rd Qu.: 45000
## Max. :199897 Max. :28169 Max. :0.17723 Max. :110000
##
## P25th P75th College_jobs Non_college_jobs
## Min. :18500 Min. : 22000 Min. : 0 Min. : 0
## 1st Qu.:24000 1st Qu.: 42000 1st Qu.: 1675 1st Qu.: 1591
## Median :27000 Median : 47000 Median : 4390 Median : 4595
## Mean :29501 Mean : 51494 Mean : 12323 Mean : 13284
## 3rd Qu.:33000 3rd Qu.: 60000 3rd Qu.: 14444 3rd Qu.: 11783
## Max. :95000 Max. :125000 Max. :151643 Max. :148395
##
## Low_wage_jobs
## Min. : 0
## 1st Qu.: 340
## Median : 1231
## Mean : 3859
## 3rd Qu.: 3466
## Max. :48207
##
grads$Major_category <- as.factor(grads$Major_category)
summary(grads)
## Rank Major_code Major Total
## Min. : 1 Min. :1100 Length:173 Min. : 124
## 1st Qu.: 44 1st Qu.:2403 Class :character 1st Qu.: 4550
## Median : 87 Median :3608 Mode :character Median : 15104
## Mean : 87 Mean :3880 Mean : 39370
## 3rd Qu.:130 3rd Qu.:5503 3rd Qu.: 38910
## Max. :173 Max. :6403 Max. :393735
## NA's :1
## Men Women Major_category
## Min. : 119 Min. : 0 Engineering :29
## 1st Qu.: 2178 1st Qu.: 1778 Education :16
## Median : 5434 Median : 8386 Humanities & Liberal Arts:15
## Mean : 16723 Mean : 22647 Biology & Life Science :14
## 3rd Qu.: 14631 3rd Qu.: 22554 Business :13
## Max. :173809 Max. :307087 Health :12
## NA's :1 NA's :1 (Other) :74
## ShareWomen Sample_size Employed Full_time
## Min. :0.0000 Min. : 2.0 Min. : 0 Min. : 111
## 1st Qu.:0.3360 1st Qu.: 39.0 1st Qu.: 3608 1st Qu.: 3154
## Median :0.5340 Median : 130.0 Median : 11797 Median : 10048
## Mean :0.5222 Mean : 356.1 Mean : 31193 Mean : 26029
## 3rd Qu.:0.7033 3rd Qu.: 338.0 3rd Qu.: 31433 3rd Qu.: 25147
## Max. :0.9690 Max. :4212.0 Max. :307933 Max. :251540
## NA's :1
## Part_time Full_time_year_round Unemployed Unemployment_rate
## Min. : 0 Min. : 111 Min. : 0 Min. :0.00000
## 1st Qu.: 1030 1st Qu.: 2453 1st Qu.: 304 1st Qu.:0.05031
## Median : 3299 Median : 7413 Median : 893 Median :0.06796
## Mean : 8832 Mean : 19694 Mean : 2416 Mean :0.06819
## 3rd Qu.: 9948 3rd Qu.: 16891 3rd Qu.: 2393 3rd Qu.:0.08756
## Max. :115172 Max. :199897 Max. :28169 Max. :0.17723
##
## Median P25th P75th College_jobs
## Min. : 22000 Min. :18500 Min. : 22000 Min. : 0
## 1st Qu.: 33000 1st Qu.:24000 1st Qu.: 42000 1st Qu.: 1675
## Median : 36000 Median :27000 Median : 47000 Median : 4390
## Mean : 40151 Mean :29501 Mean : 51494 Mean : 12323
## 3rd Qu.: 45000 3rd Qu.:33000 3rd Qu.: 60000 3rd Qu.: 14444
## Max. :110000 Max. :95000 Max. :125000 Max. :151643
##
## Non_college_jobs Low_wage_jobs
## Min. : 0 Min. : 0
## 1st Qu.: 1591 1st Qu.: 340
## Median : 4595 Median : 1231
## Mean : 13284 Mean : 3859
## 3rd Qu.: 11783 3rd Qu.: 3466
## Max. :148395 Max. :48207
##
summary(grads$Major_category)
## Agriculture & Natural Resources Arts
## 10 8
## Biology & Life Science Business
## 14 13
## Communications & Journalism Computers & Mathematics
## 4 11
## Education Engineering
## 16 29
## Health Humanities & Liberal Arts
## 12 15
## Industrial Arts & Consumer Services Interdisciplinary
## 7 1
## Law & Public Policy Physical Sciences
## 5 10
## Psychology & Social Work Social Science
## 9 9
Data transformasi merupakan proses mengubah dan memetakan data dari satu bentuk data “mentah” ke dalam format lain dengan maksud membuatnya lebih sesuai dan bernilai untuk berbagai keperluan seperti analitik
Dalam part ini, akan dibahas mengenai transformasi data sederhana dengan menggunakan base R.
Untuk mensubset di R tanpa library, bisa dilakukan dengan data[baris, kolom], artinya kita ingin mengambil baris atau kolom tertentu.
Contoh:
, bisa dikosongkan atau ditulis seluruhnya)data[baris, kolom]
grads <- read.csv("recent-grads.csv")
mengambil semua baris dan 6 kolom
grads[ ,1:6]
## Rank Major_code
## 1 1 2419
## 2 2 2416
## 3 3 2415
## 4 4 2417
## 5 5 2405
## 6 6 2418
## 7 7 6202
## 8 8 5001
## 9 9 2414
## 10 10 2408
## 11 11 2407
## 12 12 2401
## 13 13 2404
## 14 14 5008
## 15 15 2409
## 16 16 2402
## 17 17 2412
## 18 18 2400
## 19 19 2403
## 20 20 3201
## 21 21 2102
## 22 22 1104
## 23 23 2502
## 24 24 2413
## 25 25 6212
## 26 26 2406
## 27 27 5601
## 28 28 6204
## 29 29 2499
## 30 30 5402
## 31 31 2410
## 32 32 2500
## 33 33 6099
## 34 34 2411
## 35 35 6107
## 36 36 6207
## 37 37 5501
## 38 38 6205
## 39 39 2503
## 40 40 5102
## 41 41 6201
## 42 42 3700
## 43 43 2100
## 44 44 5007
## 45 45 6105
## 46 46 2105
## 47 47 3702
## 48 48 3701
## 49 49 3607
## 50 50 5006
## 51 51 2501
## 52 52 6104
## 53 53 4005
## 54 54 2101
## 55 55 4006
## 56 56 2303
## 57 57 5505
## 58 58 6200
## 59 59 1401
## 60 60 6210
## 61 61 6108
## 62 62 3603
## 63 63 6299
## 64 64 1101
## 65 65 1100
## 66 66 2599
## 67 67 2504
## 68 68 3605
## 69 69 5599
## 70 70 6403
## 71 71 5205
## 72 72 1102
## 73 73 5000
## 74 74 3801
## 75 75 5003
## 76 76 5701
## 77 77 6203
## 78 78 6206
## 79 79 5506
## 80 80 5504
## 81 81 3606
## 82 82 2106
## 83 83 3601
## 84 84 3602
## 85 85 2107
## 86 86 5004
## 87 87 6209
## 88 88 3202
## 89 89 6199
## 90 90 5401
## 91 91 5005
## 92 92 5206
## 93 93 1301
## 94 94 1901
## 95 95 5301
## 96 96 6004
## 97 97 1902
## 98 98 5098
## 99 99 1904
## 100 100 1501
## 101 101 2310
## 102 102 3608
## 103 103 5503
## 104 104 4002
## 105 105 6103
## 106 106 2001
## 107 107 5901
## 108 108 1303
## 109 109 3611
## 110 110 4000
## 111 111 5002
## 112 112 1302
## 113 113 1106
## 114 114 2300
## 115 115 6402
## 116 116 2602
## 117 117 4001
## 118 118 2311
## 119 119 6110
## 120 120 2305
## 121 121 2301
## 122 122 6106
## 123 123 3699
## 124 124 3600
## 125 125 5507
## 126 126 1903
## 127 127 6109
## 128 128 6211
## 129 129 2313
## 130 130 2601
## 131 131 2399
## 132 132 4007
## 133 133 3604
## 134 134 2309
## 135 135 6100
## 136 136 4801
## 137 137 2314
## 138 138 3301
## 139 139 2304
## 140 140 4101
## 141 141 3401
## 142 142 6005
## 143 143 5500
## 144 144 1105
## 145 145 2308
## 146 146 5200
## 147 147 6002
## 148 148 2306
## 149 149 6006
## 150 150 6000
## 151 151 2901
## 152 152 5404
## 153 153 1103
## 154 154 6003
## 155 155 2312
## 156 156 5299
## 157 157 5403
## 158 158 3402
## 159 159 4901
## 160 160 6007
## 161 161 2201
## 162 162 1199
## 163 163 5502
## 164 164 6102
## 165 165 2307
## 166 166 2603
## 167 167 6001
## 168 168 3302
## 169 169 3609
## 170 170 5201
## 171 171 5202
## 172 172 5203
## 173 173 3501
## Major Total
## 1 PETROLEUM ENGINEERING 2339
## 2 MINING AND MINERAL ENGINEERING 756
## 3 METALLURGICAL ENGINEERING 856
## 4 NAVAL ARCHITECTURE AND MARINE ENGINEERING 1258
## 5 CHEMICAL ENGINEERING 32260
## 6 NUCLEAR ENGINEERING 2573
## 7 ACTUARIAL SCIENCE 3777
## 8 ASTRONOMY AND ASTROPHYSICS 1792
## 9 MECHANICAL ENGINEERING 91227
## 10 ELECTRICAL ENGINEERING 81527
## 11 COMPUTER ENGINEERING 41542
## 12 AEROSPACE ENGINEERING 15058
## 13 BIOMEDICAL ENGINEERING 14955
## 14 MATERIALS SCIENCE 4279
## 15 ENGINEERING MECHANICS PHYSICS AND SCIENCE 4321
## 16 BIOLOGICAL ENGINEERING 8925
## 17 INDUSTRIAL AND MANUFACTURING ENGINEERING 18968
## 18 GENERAL ENGINEERING 61152
## 19 ARCHITECTURAL ENGINEERING 2825
## 20 COURT REPORTING 1148
## 21 COMPUTER SCIENCE 128319
## 22 FOOD SCIENCE NA
## 23 ELECTRICAL ENGINEERING TECHNOLOGY 11565
## 24 MATERIALS ENGINEERING AND MATERIALS SCIENCE 2993
## 25 MANAGEMENT INFORMATION SYSTEMS AND STATISTICS 18713
## 26 CIVIL ENGINEERING 53153
## 27 CONSTRUCTION SERVICES 18498
## 28 OPERATIONS LOGISTICS AND E-COMMERCE 11732
## 29 MISCELLANEOUS ENGINEERING 9133
## 30 PUBLIC POLICY 5978
## 31 ENVIRONMENTAL ENGINEERING 4047
## 32 ENGINEERING TECHNOLOGIES 3600
## 33 MISCELLANEOUS FINE ARTS 3340
## 34 GEOLOGICAL AND GEOPHYSICAL ENGINEERING 720
## 35 NURSING 209394
## 36 FINANCE 174506
## 37 ECONOMICS 139247
## 38 BUSINESS ECONOMICS 13302
## 39 INDUSTRIAL PRODUCTION TECHNOLOGIES 4631
## 40 NUCLEAR, INDUSTRIAL RADIOLOGY, AND BIOLOGICAL TECHNOLOGIES 2116
## 41 ACCOUNTING 198633
## 42 MATHEMATICS 72397
## 43 COMPUTER AND INFORMATION SYSTEMS 36698
## 44 PHYSICS 32142
## 45 MEDICAL TECHNOLOGIES TECHNICIANS 15914
## 46 INFORMATION SCIENCES 11913
## 47 STATISTICS AND DECISION SCIENCE 6251
## 48 APPLIED MATHEMATICS 4939
## 49 PHARMACOLOGY 1762
## 50 OCEANOGRAPHY 2418
## 51 ENGINEERING AND INDUSTRIAL MANAGEMENT 2906
## 52 MEDICAL ASSISTING SERVICES 11123
## 53 MATHEMATICS AND COMPUTER SCIENCE 609
## 54 COMPUTER PROGRAMMING AND DATA PROCESSING 4168
## 55 COGNITIVE SCIENCE AND BIOPSYCHOLOGY 3831
## 56 SCHOOL STUDENT COUNSELING 818
## 57 INTERNATIONAL RELATIONS 28187
## 58 GENERAL BUSINESS 234590
## 59 ARCHITECTURE 46420
## 60 INTERNATIONAL BUSINESS 25894
## 61 PHARMACY PHARMACEUTICAL SCIENCES AND ADMINISTRATION 23551
## 62 MOLECULAR BIOLOGY 18300
## 63 MISCELLANEOUS BUSINESS & MEDICAL ADMINISTRATION 17947
## 64 AGRICULTURE PRODUCTION AND MANAGEMENT 14240
## 65 GENERAL AGRICULTURE 10399
## 66 MISCELLANEOUS ENGINEERING TECHNOLOGIES 8804
## 67 MECHANICAL ENGINEERING RELATED TECHNOLOGIES 4790
## 68 GENETICS 3635
## 69 MISCELLANEOUS SOCIAL SCIENCES 3283
## 70 UNITED STATES HISTORY 3079
## 71 INDUSTRIAL AND ORGANIZATIONAL PSYCHOLOGY 3014
## 72 AGRICULTURAL ECONOMICS 2439
## 73 PHYSICAL SCIENCES 1436
## 74 MILITARY TECHNOLOGIES 124
## 75 CHEMISTRY 66530
## 76 ELECTRICAL, MECHANICAL, AND PRECISION TECHNOLOGIES AND PRODUCTION 2435
## 77 BUSINESS MANAGEMENT AND ADMINISTRATION 329927
## 78 MARKETING AND MARKETING RESEARCH 205211
## 79 POLITICAL SCIENCE AND GOVERNMENT 182621
## 80 GEOGRAPHY 18480
## 81 MICROBIOLOGY 15232
## 82 COMPUTER ADMINISTRATION MANAGEMENT AND SECURITY 8066
## 83 BIOCHEMICAL SCIENCES 39107
## 84 BOTANY 1329
## 85 COMPUTER NETWORKING AND TELECOMMUNICATIONS 7613
## 86 GEOLOGY AND EARTH SCIENCE 10972
## 87 HUMAN RESOURCES AND PERSONNEL MANAGEMENT 24497
## 88 PRE-LAW AND LEGAL STUDIES 13528
## 89 MISCELLANEOUS HEALTH MEDICAL PROFESSIONS 13386
## 90 PUBLIC ADMINISTRATION 5629
## 91 GEOSCIENCES 1978
## 92 SOCIAL PSYCHOLOGY 1386
## 93 ENVIRONMENTAL SCIENCE 25965
## 94 COMMUNICATIONS 213996
## 95 CRIMINAL JUSTICE AND FIRE PROTECTION 152824
## 96 COMMERCIAL ART AND GRAPHIC DESIGN 103480
## 97 JOURNALISM 72619
## 98 MULTI-DISCIPLINARY OR GENERAL SCIENCE 62052
## 99 ADVERTISING AND PUBLIC RELATIONS 53162
## 100 AREA ETHNIC AND CIVILIZATION STUDIES 31195
## 101 SPECIAL NEEDS EDUCATION 28739
## 102 PHYSIOLOGY 22060
## 103 CRIMINOLOGY 19879
## 104 NUTRITION SCIENCES 18909
## 105 HEALTH AND MEDICAL ADMINISTRATIVE SERVICES 18109
## 106 COMMUNICATION TECHNOLOGIES 18035
## 107 TRANSPORTATION SCIENCES AND TECHNOLOGIES 15150
## 108 NATURAL RESOURCES MANAGEMENT 13773
## 109 NEUROSCIENCE 13663
## 110 MULTI/INTERDISCIPLINARY STUDIES 12296
## 111 ATMOSPHERIC SCIENCES AND METEOROLOGY 4043
## 112 FORESTRY 3607
## 113 SOIL SCIENCE 685
## 114 GENERAL EDUCATION 143718
## 115 HISTORY 141951
## 116 FRENCH GERMAN LATIN AND OTHER COMMON FOREIGN LANGUAGE STUDIES 48246
## 117 INTERCULTURAL AND INTERNATIONAL STUDIES 24650
## 118 SOCIAL SCIENCE OR HISTORY TEACHER EDUCATION 20198
## 119 COMMUNITY AND PUBLIC HEALTH 19735
## 120 MATHEMATICS TEACHER EDUCATION 14237
## 121 EDUCATIONAL ADMINISTRATION AND SUPERVISION 804
## 122 HEALTH AND MEDICAL PREPARATORY PROGRAMS 12740
## 123 MISCELLANEOUS BIOLOGY 10706
## 124 BIOLOGY 280709
## 125 SOCIOLOGY 115433
## 126 MASS MEDIA 52824
## 127 TREATMENT THERAPY PROFESSIONS 48491
## 128 HOSPITALITY MANAGEMENT 43647
## 129 LANGUAGE AND DRAMA EDUCATION 30471
## 130 LINGUISTICS AND COMPARATIVE LANGUAGE AND LITERATURE 16601
## 131 MISCELLANEOUS EDUCATION 10150
## 132 INTERDISCIPLINARY SOCIAL SCIENCES 9916
## 133 ECOLOGY 9154
## 134 SECONDARY TEACHER EDUCATION 17125
## 135 GENERAL MEDICAL AND HEALTH SERVICES 33599
## 136 PHILOSOPHY AND RELIGIOUS STUDIES 54814
## 137 ART AND MUSIC EDUCATION 34181
## 138 ENGLISH LANGUAGE AND LITERATURE 194673
## 139 ELEMENTARY EDUCATION 170862
## 140 PHYSICAL FITNESS PARKS RECREATION AND LEISURE 125074
## 141 LIBERAL ARTS 71369
## 142 FILM VIDEO AND PHOTOGRAPHIC ARTS 38761
## 143 GENERAL SOCIAL SCIENCES 12920
## 144 PLANT SCIENCE AND AGRONOMY 7416
## 145 SCIENCE AND COMPUTER TEACHER EDUCATION 6483
## 146 PSYCHOLOGY 393735
## 147 MUSIC 60633
## 148 PHYSICAL AND HEALTH EDUCATION TEACHING 28213
## 149 ART HISTORY AND CRITICISM 21030
## 150 FINE ARTS 74440
## 151 FAMILY AND CONSUMER SCIENCES 58001
## 152 SOCIAL WORK 53552
## 153 ANIMAL SCIENCES 21573
## 154 VISUAL AND PERFORMING ARTS 16250
## 155 TEACHER EDUCATION: MULTIPLE LEVELS 14443
## 156 MISCELLANEOUS PSYCHOLOGY 9628
## 157 HUMAN SERVICES AND COMMUNITY ORGANIZATION 9374
## 158 HUMANITIES 6652
## 159 THEOLOGY AND RELIGIOUS VOCATIONS 30207
## 160 STUDIO ARTS 16977
## 161 COSMETOLOGY SERVICES AND CULINARY ARTS 10510
## 162 MISCELLANEOUS AGRICULTURE 1488
## 163 ANTHROPOLOGY AND ARCHEOLOGY 38844
## 164 COMMUNICATION DISORDERS SCIENCES AND SERVICES 38279
## 165 EARLY CHILDHOOD EDUCATION 37589
## 166 OTHER FOREIGN LANGUAGES 11204
## 167 DRAMA AND THEATER ARTS 43249
## 168 COMPOSITION AND RHETORIC 18953
## 169 ZOOLOGY 8409
## 170 EDUCATIONAL PSYCHOLOGY 2854
## 171 CLINICAL PSYCHOLOGY 2838
## 172 COUNSELING PSYCHOLOGY 4626
## 173 LIBRARY SCIENCE 1098
## Men Women
## 1 2057 282
## 2 679 77
## 3 725 131
## 4 1123 135
## 5 21239 11021
## 6 2200 373
## 7 2110 1667
## 8 832 960
## 9 80320 10907
## 10 65511 16016
## 11 33258 8284
## 12 12953 2105
## 13 8407 6548
## 14 2949 1330
## 15 3526 795
## 16 6062 2863
## 17 12453 6515
## 18 45683 15469
## 19 1835 990
## 20 877 271
## 21 99743 28576
## 22 NA NA
## 23 8181 3384
## 24 2020 973
## 25 13496 5217
## 26 41081 12072
## 27 16820 1678
## 28 7921 3811
## 29 7398 1735
## 30 2639 3339
## 31 2662 1385
## 32 2695 905
## 33 1970 1370
## 34 488 232
## 35 21773 187621
## 36 115030 59476
## 37 89749 49498
## 38 7575 5727
## 39 3477 1154
## 40 528 1588
## 41 94519 104114
## 42 39956 32441
## 43 27392 9306
## 44 23080 9062
## 45 3916 11998
## 46 9005 2908
## 47 2960 3291
## 48 2794 2145
## 49 515 1247
## 50 752 1666
## 51 2400 506
## 52 803 10320
## 53 500 109
## 54 3046 1122
## 55 1667 2164
## 56 119 699
## 57 10345 17842
## 58 132238 102352
## 59 25463 20957
## 60 10624 15270
## 61 8697 14854
## 62 7426 10874
## 63 10285 7662
## 64 9658 4582
## 65 6053 4346
## 66 7043 1761
## 67 4419 371
## 68 1761 1874
## 69 1499 1784
## 70 1756 1323
## 71 1075 1939
## 72 1749 690
## 73 894 542
## 74 124 0
## 75 32923 33607
## 76 1869 566
## 77 173809 156118
## 78 78857 126354
## 79 93880 88741
## 80 11404 7076
## 81 6383 8849
## 82 6607 1459
## 83 18951 20156
## 84 626 703
## 85 5291 2322
## 86 5813 5159
## 87 6184 18313
## 88 4435 9093
## 89 1589 11797
## 90 2947 2682
## 91 809 1169
## 92 413 973
## 93 10787 15178
## 94 70619 143377
## 95 80231 72593
## 96 32041 71439
## 97 23736 48883
## 98 27015 35037
## 99 12862 40300
## 100 8739 22456
## 101 2682 26057
## 102 8422 13638
## 103 10031 9848
## 104 2563 16346
## 105 4266 13843
## 106 11431 6604
## 107 13257 1893
## 108 8617 5156
## 109 4944 8719
## 110 2817 9479
## 111 2744 1299
## 112 3156 451
## 113 476 209
## 114 26893 116825
## 115 78253 63698
## 116 12835 35411
## 117 8575 16075
## 118 9950 10248
## 119 4103 15632
## 120 3872 10365
## 121 280 524
## 122 5521 7219
## 123 4747 5959
## 124 111762 168947
## 125 32510 82923
## 126 24704 28120
## 127 13487 35004
## 128 15204 28443
## 129 3741 26730
## 130 4416 12185
## 131 3654 6496
## 132 2337 7579
## 133 3878 5276
## 134 6820 10305
## 135 7574 26025
## 136 31967 22847
## 137 10732 23449
## 138 58227 136446
## 139 13029 157833
## 140 62181 62893
## 141 22339 49030
## 142 22357 16404
## 143 5079 7841
## 144 4897 2519
## 145 2049 4434
## 146 86648 307087
## 147 29909 30724
## 148 15670 12543
## 149 3240 17790
## 150 24786 49654
## 151 5166 52835
## 152 5137 48415
## 153 5347 16226
## 154 4133 12117
## 155 2734 11709
## 156 1936 7692
## 157 885 8489
## 158 2013 4639
## 159 18616 11591
## 160 4754 12223
## 161 4364 6146
## 162 404 1084
## 163 11376 27468
## 164 1225 37054
## 165 1167 36422
## 166 3472 7732
## 167 14440 28809
## 168 7022 11931
## 169 3050 5359
## 170 522 2332
## 171 568 2270
## 172 931 3695
## 173 134 964
tail(grads) # untuk mengambil 6 baris terakhir dengan fungsi tail()
## Rank Major_code Major Total Men Women
## 168 168 3302 COMPOSITION AND RHETORIC 18953 7022 11931
## 169 169 3609 ZOOLOGY 8409 3050 5359
## 170 170 5201 EDUCATIONAL PSYCHOLOGY 2854 522 2332
## 171 171 5202 CLINICAL PSYCHOLOGY 2838 568 2270
## 172 172 5203 COUNSELING PSYCHOLOGY 4626 931 3695
## 173 173 3501 LIBRARY SCIENCE 1098 134 964
## Major_category ShareWomen Sample_size Employed Full_time
## 168 Humanities & Liberal Arts 0.6295046 151 15053 10121
## 169 Biology & Life Science 0.6372934 47 6259 5043
## 170 Psychology & Social Work 0.8170988 7 2125 1848
## 171 Psychology & Social Work 0.7998591 13 2101 1724
## 172 Psychology & Social Work 0.7987462 21 3777 3154
## 173 Education 0.8779599 2 742 593
## Part_time Full_time_year_round Unemployed Unemployment_rate Median P25th
## 168 6612 7832 1340 0.08174221 27000 20000
## 169 2190 3602 304 0.04632028 26000 20000
## 170 572 1211 148 0.06511219 25000 24000
## 171 648 1293 368 0.14904820 25000 25000
## 172 965 2738 214 0.05362065 23400 19200
## 173 237 410 87 0.10494572 22000 20000
## P75th College_jobs Non_college_jobs Low_wage_jobs
## 168 35000 4855 8100 3466
## 169 39000 2771 2947 743
## 170 34000 1488 615 82
## 171 40000 986 870 622
## 172 26000 2403 1245 308
## 173 22000 288 338 192
head(grads)
## Rank Major_code Major Total Men Women
## 1 1 2419 PETROLEUM ENGINEERING 2339 2057 282
## 2 2 2416 MINING AND MINERAL ENGINEERING 756 679 77
## 3 3 2415 METALLURGICAL ENGINEERING 856 725 131
## 4 4 2417 NAVAL ARCHITECTURE AND MARINE ENGINEERING 1258 1123 135
## 5 5 2405 CHEMICAL ENGINEERING 32260 21239 11021
## 6 6 2418 NUCLEAR ENGINEERING 2573 2200 373
## Major_category ShareWomen Sample_size Employed Full_time Part_time
## 1 Engineering 0.1205643 36 1976 1849 270
## 2 Engineering 0.1018519 7 640 556 170
## 3 Engineering 0.1530374 3 648 558 133
## 4 Engineering 0.1073132 16 758 1069 150
## 5 Engineering 0.3416305 289 25694 23170 5180
## 6 Engineering 0.1449670 17 1857 2038 264
## Full_time_year_round Unemployed Unemployment_rate Median P25th P75th
## 1 1207 37 0.01838053 110000 95000 125000
## 2 388 85 0.11724138 75000 55000 90000
## 3 340 16 0.02409639 73000 50000 105000
## 4 692 40 0.05012531 70000 43000 80000
## 5 16697 1672 0.06109771 65000 50000 75000
## 6 1449 400 0.17722641 65000 50000 102000
## College_jobs Non_college_jobs Low_wage_jobs
## 1 1534 364 193
## 2 350 257 50
## 3 456 176 0
## 4 529 102 0
## 5 18314 4440 972
## 6 1142 657 244
grads[grads$Major_category == "Business", c("Major", "College_jobs")]
## Major College_jobs
## 7 ACTUARIAL SCIENCE 1768
## 25 MANAGEMENT INFORMATION SYSTEMS AND STATISTICS 6342
## 28 OPERATIONS LOGISTICS AND E-COMMERCE 1466
## 36 FINANCE 24243
## 38 BUSINESS ECONOMICS 1578
## 41 ACCOUNTING 11417
## 58 GENERAL BUSINESS 29334
## 60 INTERNATIONAL BUSINESS 3383
## 63 MISCELLANEOUS BUSINESS & MEDICAL ADMINISTRATION 2236
## 77 BUSINESS MANAGEMENT AND ADMINISTRATION 36720
## 78 MARKETING AND MARKETING RESEARCH 25320
## 87 HUMAN RESOURCES AND PERSONNEL MANAGEMENT 2406
## 128 HOSPITALITY MANAGEMENT 2325
Terkadang, data yang sudah kita load memiliki beberapa tipe data yang tidak sesuai dengan keinginan kita, contoh misalkan kita memiliki variabel Men dan Women yang merupakan jumlah pria dan wanita untuk setiap major dan kita ingin membuat variabel gender_gap untuk melihat perbedaan jenis kelamin pada major tersebut. Untuk membuat variabel baru, dapat dilakukan seperti di bawah ini
grads$gender_gap <- grads$Men - grads$Women
grads[, c("Men", "Women", "gender_gap")]
## Men Women gender_gap
## 1 2057 282 1775
## 2 679 77 602
## 3 725 131 594
## 4 1123 135 988
## 5 21239 11021 10218
## 6 2200 373 1827
## 7 2110 1667 443
## 8 832 960 -128
## 9 80320 10907 69413
## 10 65511 16016 49495
## 11 33258 8284 24974
## 12 12953 2105 10848
## 13 8407 6548 1859
## 14 2949 1330 1619
## 15 3526 795 2731
## 16 6062 2863 3199
## 17 12453 6515 5938
## 18 45683 15469 30214
## 19 1835 990 845
## 20 877 271 606
## 21 99743 28576 71167
## 22 NA NA NA
## 23 8181 3384 4797
## 24 2020 973 1047
## 25 13496 5217 8279
## 26 41081 12072 29009
## 27 16820 1678 15142
## 28 7921 3811 4110
## 29 7398 1735 5663
## 30 2639 3339 -700
## 31 2662 1385 1277
## 32 2695 905 1790
## 33 1970 1370 600
## 34 488 232 256
## 35 21773 187621 -165848
## 36 115030 59476 55554
## 37 89749 49498 40251
## 38 7575 5727 1848
## 39 3477 1154 2323
## 40 528 1588 -1060
## 41 94519 104114 -9595
## 42 39956 32441 7515
## 43 27392 9306 18086
## 44 23080 9062 14018
## 45 3916 11998 -8082
## 46 9005 2908 6097
## 47 2960 3291 -331
## 48 2794 2145 649
## 49 515 1247 -732
## 50 752 1666 -914
## 51 2400 506 1894
## 52 803 10320 -9517
## 53 500 109 391
## 54 3046 1122 1924
## 55 1667 2164 -497
## 56 119 699 -580
## 57 10345 17842 -7497
## 58 132238 102352 29886
## 59 25463 20957 4506
## 60 10624 15270 -4646
## 61 8697 14854 -6157
## 62 7426 10874 -3448
## 63 10285 7662 2623
## 64 9658 4582 5076
## 65 6053 4346 1707
## 66 7043 1761 5282
## 67 4419 371 4048
## 68 1761 1874 -113
## 69 1499 1784 -285
## 70 1756 1323 433
## 71 1075 1939 -864
## 72 1749 690 1059
## 73 894 542 352
## 74 124 0 124
## 75 32923 33607 -684
## 76 1869 566 1303
## 77 173809 156118 17691
## 78 78857 126354 -47497
## 79 93880 88741 5139
## 80 11404 7076 4328
## 81 6383 8849 -2466
## 82 6607 1459 5148
## 83 18951 20156 -1205
## 84 626 703 -77
## 85 5291 2322 2969
## 86 5813 5159 654
## 87 6184 18313 -12129
## 88 4435 9093 -4658
## 89 1589 11797 -10208
## 90 2947 2682 265
## 91 809 1169 -360
## 92 413 973 -560
## 93 10787 15178 -4391
## 94 70619 143377 -72758
## 95 80231 72593 7638
## 96 32041 71439 -39398
## 97 23736 48883 -25147
## 98 27015 35037 -8022
## 99 12862 40300 -27438
## 100 8739 22456 -13717
## 101 2682 26057 -23375
## 102 8422 13638 -5216
## 103 10031 9848 183
## 104 2563 16346 -13783
## 105 4266 13843 -9577
## 106 11431 6604 4827
## 107 13257 1893 11364
## 108 8617 5156 3461
## 109 4944 8719 -3775
## 110 2817 9479 -6662
## 111 2744 1299 1445
## 112 3156 451 2705
## 113 476 209 267
## 114 26893 116825 -89932
## 115 78253 63698 14555
## 116 12835 35411 -22576
## 117 8575 16075 -7500
## 118 9950 10248 -298
## 119 4103 15632 -11529
## 120 3872 10365 -6493
## 121 280 524 -244
## 122 5521 7219 -1698
## 123 4747 5959 -1212
## 124 111762 168947 -57185
## 125 32510 82923 -50413
## 126 24704 28120 -3416
## 127 13487 35004 -21517
## 128 15204 28443 -13239
## 129 3741 26730 -22989
## 130 4416 12185 -7769
## 131 3654 6496 -2842
## 132 2337 7579 -5242
## 133 3878 5276 -1398
## 134 6820 10305 -3485
## 135 7574 26025 -18451
## 136 31967 22847 9120
## 137 10732 23449 -12717
## 138 58227 136446 -78219
## 139 13029 157833 -144804
## 140 62181 62893 -712
## 141 22339 49030 -26691
## 142 22357 16404 5953
## 143 5079 7841 -2762
## 144 4897 2519 2378
## 145 2049 4434 -2385
## 146 86648 307087 -220439
## 147 29909 30724 -815
## 148 15670 12543 3127
## 149 3240 17790 -14550
## 150 24786 49654 -24868
## 151 5166 52835 -47669
## 152 5137 48415 -43278
## 153 5347 16226 -10879
## 154 4133 12117 -7984
## 155 2734 11709 -8975
## 156 1936 7692 -5756
## 157 885 8489 -7604
## 158 2013 4639 -2626
## 159 18616 11591 7025
## 160 4754 12223 -7469
## 161 4364 6146 -1782
## 162 404 1084 -680
## 163 11376 27468 -16092
## 164 1225 37054 -35829
## 165 1167 36422 -35255
## 166 3472 7732 -4260
## 167 14440 28809 -14369
## 168 7022 11931 -4909
## 169 3050 5359 -2309
## 170 522 2332 -1810
## 171 568 2270 -1702
## 172 931 3695 -2764
## 173 134 964 -830
cara membuat kolom/ variabel baru adalah: nama objek $ nama variabel <- operasi
grads$gender.gap <- grads$Men - grads$Women
grads$Major_category <- as.factor(grads$Major_category)
grads[ , c("Rank", "Major_category", "Men", "Women", "gender.gap")]
## Rank Major_category Men Women gender.gap
## 1 1 Engineering 2057 282 1775
## 2 2 Engineering 679 77 602
## 3 3 Engineering 725 131 594
## 4 4 Engineering 1123 135 988
## 5 5 Engineering 21239 11021 10218
## 6 6 Engineering 2200 373 1827
## 7 7 Business 2110 1667 443
## 8 8 Physical Sciences 832 960 -128
## 9 9 Engineering 80320 10907 69413
## 10 10 Engineering 65511 16016 49495
## 11 11 Engineering 33258 8284 24974
## 12 12 Engineering 12953 2105 10848
## 13 13 Engineering 8407 6548 1859
## 14 14 Engineering 2949 1330 1619
## 15 15 Engineering 3526 795 2731
## 16 16 Engineering 6062 2863 3199
## 17 17 Engineering 12453 6515 5938
## 18 18 Engineering 45683 15469 30214
## 19 19 Engineering 1835 990 845
## 20 20 Law & Public Policy 877 271 606
## 21 21 Computers & Mathematics 99743 28576 71167
## 22 22 Agriculture & Natural Resources NA NA NA
## 23 23 Engineering 8181 3384 4797
## 24 24 Engineering 2020 973 1047
## 25 25 Business 13496 5217 8279
## 26 26 Engineering 41081 12072 29009
## 27 27 Industrial Arts & Consumer Services 16820 1678 15142
## 28 28 Business 7921 3811 4110
## 29 29 Engineering 7398 1735 5663
## 30 30 Law & Public Policy 2639 3339 -700
## 31 31 Engineering 2662 1385 1277
## 32 32 Engineering 2695 905 1790
## 33 33 Arts 1970 1370 600
## 34 34 Engineering 488 232 256
## 35 35 Health 21773 187621 -165848
## 36 36 Business 115030 59476 55554
## 37 37 Social Science 89749 49498 40251
## 38 38 Business 7575 5727 1848
## 39 39 Engineering 3477 1154 2323
## 40 40 Physical Sciences 528 1588 -1060
## 41 41 Business 94519 104114 -9595
## 42 42 Computers & Mathematics 39956 32441 7515
## 43 43 Computers & Mathematics 27392 9306 18086
## 44 44 Physical Sciences 23080 9062 14018
## 45 45 Health 3916 11998 -8082
## 46 46 Computers & Mathematics 9005 2908 6097
## 47 47 Computers & Mathematics 2960 3291 -331
## 48 48 Computers & Mathematics 2794 2145 649
## 49 49 Biology & Life Science 515 1247 -732
## 50 50 Physical Sciences 752 1666 -914
## 51 51 Engineering 2400 506 1894
## 52 52 Health 803 10320 -9517
## 53 53 Computers & Mathematics 500 109 391
## 54 54 Computers & Mathematics 3046 1122 1924
## 55 55 Biology & Life Science 1667 2164 -497
## 56 56 Education 119 699 -580
## 57 57 Social Science 10345 17842 -7497
## 58 58 Business 132238 102352 29886
## 59 59 Engineering 25463 20957 4506
## 60 60 Business 10624 15270 -4646
## 61 61 Health 8697 14854 -6157
## 62 62 Biology & Life Science 7426 10874 -3448
## 63 63 Business 10285 7662 2623
## 64 64 Agriculture & Natural Resources 9658 4582 5076
## 65 65 Agriculture & Natural Resources 6053 4346 1707
## 66 66 Engineering 7043 1761 5282
## 67 67 Engineering 4419 371 4048
## 68 68 Biology & Life Science 1761 1874 -113
## 69 69 Social Science 1499 1784 -285
## 70 70 Humanities & Liberal Arts 1756 1323 433
## 71 71 Psychology & Social Work 1075 1939 -864
## 72 72 Agriculture & Natural Resources 1749 690 1059
## 73 73 Physical Sciences 894 542 352
## 74 74 Industrial Arts & Consumer Services 124 0 124
## 75 75 Physical Sciences 32923 33607 -684
## 76 76 Industrial Arts & Consumer Services 1869 566 1303
## 77 77 Business 173809 156118 17691
## 78 78 Business 78857 126354 -47497
## 79 79 Social Science 93880 88741 5139
## 80 80 Social Science 11404 7076 4328
## 81 81 Biology & Life Science 6383 8849 -2466
## 82 82 Computers & Mathematics 6607 1459 5148
## 83 83 Biology & Life Science 18951 20156 -1205
## 84 84 Biology & Life Science 626 703 -77
## 85 85 Computers & Mathematics 5291 2322 2969
## 86 86 Physical Sciences 5813 5159 654
## 87 87 Business 6184 18313 -12129
## 88 88 Law & Public Policy 4435 9093 -4658
## 89 89 Health 1589 11797 -10208
## 90 90 Law & Public Policy 2947 2682 265
## 91 91 Physical Sciences 809 1169 -360
## 92 92 Psychology & Social Work 413 973 -560
## 93 93 Biology & Life Science 10787 15178 -4391
## 94 94 Communications & Journalism 70619 143377 -72758
## 95 95 Law & Public Policy 80231 72593 7638
## 96 96 Arts 32041 71439 -39398
## 97 97 Communications & Journalism 23736 48883 -25147
## 98 98 Physical Sciences 27015 35037 -8022
## 99 99 Communications & Journalism 12862 40300 -27438
## 100 100 Humanities & Liberal Arts 8739 22456 -13717
## 101 101 Education 2682 26057 -23375
## 102 102 Biology & Life Science 8422 13638 -5216
## 103 103 Social Science 10031 9848 183
## 104 104 Health 2563 16346 -13783
## 105 105 Health 4266 13843 -9577
## 106 106 Computers & Mathematics 11431 6604 4827
## 107 107 Industrial Arts & Consumer Services 13257 1893 11364
## 108 108 Agriculture & Natural Resources 8617 5156 3461
## 109 109 Biology & Life Science 4944 8719 -3775
## 110 110 Interdisciplinary 2817 9479 -6662
## 111 111 Physical Sciences 2744 1299 1445
## 112 112 Agriculture & Natural Resources 3156 451 2705
## 113 113 Agriculture & Natural Resources 476 209 267
## 114 114 Education 26893 116825 -89932
## 115 115 Humanities & Liberal Arts 78253 63698 14555
## 116 116 Humanities & Liberal Arts 12835 35411 -22576
## 117 117 Humanities & Liberal Arts 8575 16075 -7500
## 118 118 Education 9950 10248 -298
## 119 119 Health 4103 15632 -11529
## 120 120 Education 3872 10365 -6493
## 121 121 Education 280 524 -244
## 122 122 Health 5521 7219 -1698
## 123 123 Biology & Life Science 4747 5959 -1212
## 124 124 Biology & Life Science 111762 168947 -57185
## 125 125 Social Science 32510 82923 -50413
## 126 126 Communications & Journalism 24704 28120 -3416
## 127 127 Health 13487 35004 -21517
## 128 128 Business 15204 28443 -13239
## 129 129 Education 3741 26730 -22989
## 130 130 Humanities & Liberal Arts 4416 12185 -7769
## 131 131 Education 3654 6496 -2842
## 132 132 Social Science 2337 7579 -5242
## 133 133 Biology & Life Science 3878 5276 -1398
## 134 134 Education 6820 10305 -3485
## 135 135 Health 7574 26025 -18451
## 136 136 Humanities & Liberal Arts 31967 22847 9120
## 137 137 Education 10732 23449 -12717
## 138 138 Humanities & Liberal Arts 58227 136446 -78219
## 139 139 Education 13029 157833 -144804
## 140 140 Industrial Arts & Consumer Services 62181 62893 -712
## 141 141 Humanities & Liberal Arts 22339 49030 -26691
## 142 142 Arts 22357 16404 5953
## 143 143 Social Science 5079 7841 -2762
## 144 144 Agriculture & Natural Resources 4897 2519 2378
## 145 145 Education 2049 4434 -2385
## 146 146 Psychology & Social Work 86648 307087 -220439
## 147 147 Arts 29909 30724 -815
## 148 148 Education 15670 12543 3127
## 149 149 Humanities & Liberal Arts 3240 17790 -14550
## 150 150 Arts 24786 49654 -24868
## 151 151 Industrial Arts & Consumer Services 5166 52835 -47669
## 152 152 Psychology & Social Work 5137 48415 -43278
## 153 153 Agriculture & Natural Resources 5347 16226 -10879
## 154 154 Arts 4133 12117 -7984
## 155 155 Education 2734 11709 -8975
## 156 156 Psychology & Social Work 1936 7692 -5756
## 157 157 Psychology & Social Work 885 8489 -7604
## 158 158 Humanities & Liberal Arts 2013 4639 -2626
## 159 159 Humanities & Liberal Arts 18616 11591 7025
## 160 160 Arts 4754 12223 -7469
## 161 161 Industrial Arts & Consumer Services 4364 6146 -1782
## 162 162 Agriculture & Natural Resources 404 1084 -680
## 163 163 Humanities & Liberal Arts 11376 27468 -16092
## 164 164 Health 1225 37054 -35829
## 165 165 Education 1167 36422 -35255
## 166 166 Humanities & Liberal Arts 3472 7732 -4260
## 167 167 Arts 14440 28809 -14369
## 168 168 Humanities & Liberal Arts 7022 11931 -4909
## 169 169 Biology & Life Science 3050 5359 -2309
## 170 170 Psychology & Social Work 522 2332 -1810
## 171 171 Psychology & Social Work 568 2270 -1702
## 172 172 Psychology & Social Work 931 3695 -2764
## 173 173 Education 134 964 -830
Pertama yang akan dilakukan sebelum masuk pada pengujian adalah memuat dataset:
library(readxl)
## Warning: package 'readxl' was built under R version 4.0.5
tourism <-read_excel("tourism.xlsx")
Tugas: Berikut ada data set Titanic.csv
Memahami dataset 1. PassangerId : nomor Id penumpang 2. Survived : keterangan selamt (0 = tidak, 1 = ya) 3. Pclass = kelas tiket (1=kelas 1, 2 = kelas 2, dst) 4. Name = nama penumpang 5. Sex = jenis kelamin 6. Age = usia dalam tahun 7. SibSp = jumlah saudara kandung/ pasangan di kapal titanic 8. Parch = mlah orang tua/ anak di kapal titanic 9. Ticket = nomor tiket 10. Fare = harga tiket 11. Cabin = nama kabin 12. Embarked = pelabuhan asal (C=cherbourg, Q = Queenstown, S = Southampton)