Setelah pada postingan sebelumnya sudah sedikit dibahas mengenai cara import data dari file CSV menggunakan fungsi built-in read.csv()
dan read.csv2()
, pada pembahasan kali ini akan mengulas cara import data dari text (~.txt) file . Text file juga sering digunakan untuk menyimpan data dalam external file selain CSV.
Penggunaan text (~.txt) file yang biasa disebut juga dengan flat file atau plain text dalam penyimpanan data sudah sangat sering dimanfaatkan oleh praktisi data. Selain dalam format CSV, penyimpanan data dalam bentuk text file juga sangat sering ditemui. Karena data yang disimpan dalam format CSV atau text file biasanya membutuhkan disk space yang relatif lebih kecil dan lebih mudah dibandingkan dengan media penyimpanan lain.
Kemudahan yang dimaksud tentunya karena pembuatannya yang bisa dilakukan di hampir semua komputer yang memiliki text editor (misalnya notepad di windows). Selain itu juga karena kemudahan dalam membagikan antar komputer, misalnya di kantor kepada kolega.
read.table()
dan read.delim()
Pada umunya penggunaan read.table()
dan read.delim()
mirip dengan penggunaan read.csv()
. Namun tentu saja ada perbedaan mendasar pada fungsi-fungsi ini.
read.table()
Fungsi read.table()
biasanya digunakan untuk import data dari text file.
read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#", allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
Anda dapat melihat keterangan seperti di atas dengan mengetik ?read.table
di console.
dtf <- read.table(file = '/folder/lokasi/file.txt', header = FALSE, sep = '')
Fungsi di atas akan import data dari file.txt
menjadi dataframe di R. Baris pertama adalah data, bukan nama kolom. Jika baris pertama pada file.txt
adalah nama kolom, maka gunakan header = TRUE
atau header = T
, dengan T
adalah singkatan untuk TRUE
dan F
untuk FALSE
. Pemisah antar kolom/separator atau disebut juga delimiter pada file tersebut adalah spasi. Jika delimiter yang digunakan adalah tanda koma (,
), maka gunakan sep = ','
.
dtf <- read.table(file = '/folder/lokasi/file.txt', header = T, sep = ',')
read.delim()
Fungsi | read.csv() |
read.csv2() |
read.table() |
read.delim() |
---|---|---|---|---|
File yang didukung | ~.csv | ~.csv | ~.csv, ~.txt | ~.csv, ~.txt |
Default Delimiter sep = |
"," |
";" |
"" (spasi) |
"\t" (tab) |
Default header = |
TRUE | TRUE | FALSE | TRUE |
Jika Anda memiliki masalah atau menemukan kesalahan ketik atau apa pun, jangan ragu untuk menghubungi saya.