Beberapa terminologi yang akan sering digunakan dalam buku ini:
Beberapa tahun yang lalu, kalau anda melihat huruf “R”, maka anda akan memikirkan alfabet ke 18. Tapi saat ini “R” juga bisa berarti bahasa pemrograman yang trendi. R kini telah memiliki lebih dari 4000 paket tambahan (add-on package) atau biasa disebut package saja, masing-masing package tersebut umumnya memiliki miling list dengan anggota ribuan, selain itu juga ada banyak sekali R group di social media seperti Google+, LinkedIn, dan Twitter. Situs R-evolution menampilkan jumlah package yang diunggah tiap tahun dan grafik para pengembang yang membuat lebih dari 10 package.
Saat ini juga rutin diadakan pertemuan pengguna R di berbagai negara yang disebut R Meetup. Saat ini telah diadakan 155 pertemuan dengan jumlah peserta 46.607, di 127 kota di 31 negara, menurut situs R user group.
R yang awalnya diperuntukkan untuk analisis statistik, saat ini telah berkembang aplikasinya hingga dapat melakukan manipulasi data GIS serta menampilkannya. Ditambah lagi dengan era data analysis atau akrab disebut big data, maka perkembangan R menjadi tidak terbendung lagi.
Aplikasi R yang terus meluas didukung oleh berkembangnya bahasa pemrograman lainnya, seperti python, Ruby dll. Salah satu contohnya adalah R markdown. Bahasa markup (markup language) yang lebih mudah dari LaTeX atau html sekalipun. Dengan menggunakan R markdown, saat ini anda bahwa bisa membuat blogpost atau naskah buku dengan R, seperti halnya naskah yang sedang anda baca saat ini. Penjelasan lebih detail mengenai Markdown akan saya jelaskan dalam bagian yang lain.
Mengapa orang menggunakan R?
R means:
+ free and user-oriented
+ reproducible and extensible
+ multiplatform
+ publication quality
Alasan utama pasti karena gratis (free). Tidak hanya gratis tapi juga open source. Apa artinya? Kita tidak hanya bisa membuat paket tambahan saja, tetapi juga bisa memodifikasi kode dasar R. Tentunya ini diperuntukkan bagi yang memahami dasar pemrograman atau yang memang profesinya sebagai pengembang (developer). Namun demikian, dengan banyaknya paket tambahan R, maka mestinya sudah banyak pula tutorial untuk membuatnya. Bahkan saat ini, saya memperhatikan, kebanyakan mahasiswa master atau PhD di luar negeri yang menggunakaan statistik dan R dalam risetnya, membuat sendiri paket tambahannya.
Alasan kedua adalah karena R multi platform. Anda bisa mengunduh dan menginstalasi R untuk tiga sistem operasi terbesar: Linux, Mac OS, dan Windows. R per hari ini (03 September 2014) sudah memasuki versi 3.1.1.
Menurut situs R project R adalah bahasa dan lingkungan untuk komputasi statistik dan grafis. R adalah proyek berjenis open source GNU, mirip dengan bahasa “S” yang dikembangkan oleh Bell Laboratories (dulu dikenal sebagai AT&T, sekarang bernama Lucent Technologies) oleh John Chambers dkk. Sekarang anda tahu kan bahwa R bukanlah satu-satunya bahasa pemrograman yang bernama unik.
Perintah dasar dalam bahasa R telah menyediakan berbagai tool untuk pemodelan statistik linear dan nonlinear, analisis time-series, klasifikasi, analisis klaster, dan analisis grafis. Kemampuan ini terus berkembang dengan adanya ribuan paket tambahan yang diunggah ke server CRAN tiap tahunnya.
Testimoni dari para pengembang dan pengguna R menyebutkan bahwa salah satu kelebihannya adalah sifatnya yang dapat diulang (reproducible) dan mampu menghasilkan keluaran grafis berkualitas tinggi untuk keperluan publikasi ilmiah.
Jadi mengapa anda tidak belajar mulai sekarang. Anda tidak akan sendiri karena kesulitan anda pasti ada jawabnya.
R bukan hanya sebuah bahasa pemrograman. Ia adalah lingkungan pengembangan terintegrasi (integrated development environment atau sering disingkat IDE). Beberapa komponen penyusun R dapat dijelaskan secara singkat sebagai berikut:
R base: ini adalah inti dari instalasi R. Tanpa menginstalasi komponen ini, R tidak akan berjalan dalam sistem anda. R base sudah memiliki tool yang lengkap untuk keperluan analisis statistik umum. Jadi tanpa package tambahan, anda sudah dapat mulai menggunakannya.
R IDE: adalah piranti lunak (aplikasi) terintegrasi. Ada dua jenis yang bisa anda pilih: apakah R Studio atau R Commander. Masing-masing memiliki kelebihan dan kelemahan. Tapi dalam buku ini, kita akan memakai R Studio. R Studio dapat membantu anda menulis skrip kode, menjalankannya, mengevaluasinya, dan membuat visualisasinya.
Package tambahan: ini adalah pengembangan dari kode dasar R base. Tiap package memiliki kemampuan spesifik, tergantung kepada si pembuatnya. Terdapat ribuan package di server CRAN saat ini. Akan sangat membingungkan. Untuk itu tiap package yang diunggah di CRAN, wajib memiliki dokumentasi atau manual book. Dokumentasi tersebut memiliki spesifikasi minimum agar seragam, yang memudahkan para pengguna, yaitu kita.
Sekarang mulailah “pekerjaan kotor kita”, yaitu menginstalasi R ke dalam PC atau laptop kita. Untuk itu coba perhatikan beberapa hal berikut ini:
Spesifikasi komputer/laptop: Tidak ada spesifikasi khusus untuk R, tetapi prinsip utamanya adalah makin besar data yang anda gunakan, makin kompleks analisis yang anda lakukan, akan memerlukan spesifikasi prosesor dan RAM yang makin besar. Jadi ini akan sangat bergantung kepada kebutuhan anda. Untuk keperluan pembelajaran gunakan saja komputer yang anda miliki sekarang.
Sistem operasi (OS): Seperti yang telah saya sampaikan sebelumnya, R berjalan di semua OS: Linux (bisa Ubuntu, Fedora dll), Mac OS, dan tentunya Windows. Jangan kuatir, yang manapun OS yang anda pakai, spesifikasi R nya akan sama persis.
Apa saja yang perlu anda unduh dan install:
CRAN mirror di dalam kotak “Getting Started”. Cari server di Indonesia. Ada dua, silahkan anda pilih:
Products > RStudio > klik tombol Download RStudio Desktop. Secara otomatis R Studio akan membaca OS yang anda pakai dan proses pengunduhan akan segera dimulai.Atau
Setelah proses pengunduhan selesai, jalankan file program instalasinya:
xRstudioxx.deb dan ikuti perintahnya.xRstudioxx.dmg dan ikuti perintahnyaxRstudioxx.exe dan ikuti perintahnya