1 Môi trường phát triển R

R là một ngôn ngữ phát triển thống kê được phát triển từ năm 1993. Tuy nhiên mãi cho đến những năm gần đây, bộ công cụ hỗ trợ cho việc lập trình trên R khá đơn sơ với 1 cửa sổ edit code thuần tuý như notepad (không hỗ trợ auto-complete và cũng không highlight syntax) và 1 cửa sổ console. Mỗi 1 chart hay figure được tạo ra thì lại mở bung ra 1 cửa sổ mới nữa và thông thường với 1 phân tích gồm hàng chục cửa sổ bung đầy màn hình. Người lập trình bằng R chỉ có thể ganh thị với các bộ công cụ phát triển như Visual Studio, Netbean hay Eclipse. Đây cũng có thể là một phần lí do mà R không phổ biến rộng rãi trong 1 thời gian dài (Bên cạnh đó, R cũng là 1 ngôn ngữ “lạ”" và khó tiếp cận).

Cùng với cơn sốt phân tích dữ liệu bùng phát 1 vài năm trở lại đây, sự ra đời của RStudio có thể được xem là 1 bước ngoặt lớn trong với ngôn ngữ lập trình chuyên dành cho phân tích dữ liệu R. Lần đầu tiên, 1 bộ công cụ cung cấp môi trường phát triển ứng dụng hoàn chỉnh (IDE) và hoàn toàn miễn phí đã giải quyết được những vấn đề khó khăn cho người phát triển ứng dụng và mang R đến gần với số đông hơn. Bài viết trình bày cách cài đặt RStudio cả 2 phiên bản: desktop applicationserver edition

2 Cài đặt RStudio Desktop trên Windows 7

RStudio Desktop là phiên bản dùng cho việc phân tích dữ liệu, được cài đặt trên máy tính cá nhân với hệ điều hành Windows:

Giao diện RStudio Desktop

Giao diện RStudio Desktop

3 Cài đặt RStudio Server Community trên CentOS 7

Bên cạnh việc cung cấp các gói cài đặt dùng cho máy tính cá nhân, RStudio còn cung cấp phiên bản Server với hai version: community (hoàn toàn miễn phí) và commercial (trả phí theo năm, giảm giá cho giáo dục và doanh nghiệp vừa và nhỏ). Bằng việc sử dụng các trình duyệt thông dụng, người dùng tiến hành phát triển ứng dụng trên 1 RStudio web application gần như tương tự RStudio desktop application. Hình thức cloud này thường được áp dụng cho các tổ chức có quy mô trung bình trở lên, khi mà tài nguyên cần được tập trung và quản lý chặt chẽ, khối lượng tính toán lớn cần đến CPU và RAM lớn hơn quy mô thông thường của cá nhân. Tất cả những gì người phát triển cần thiết để phát triển R là trình duyệt web thông thường. Phiên bản commercial mở rộng hơn các tính năng về bảo mật và theo dõi hệ thống dành cho các administrator. Việc cài đặt RStudio server edition được tiến hành bởi các quản trị hệ thống Linux (chưa có phiên server edition cho Windows). Người dùng được cấp tài khoản để đăng nhập và sử dụng hệ thống. Dưới đây trình bày bash script để cài đặt RStudio server editioncho CentOS 7.

3.1 Cài đặt trên CentOS

  • Cập nhật hệ thống
sudo yum install -y
  • Download và cập nhật EPEL repo
sudo wget http://dl.fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-5.noarch.rpm
sudo rpm -ivh epel-release-7-5.noarch.rpm
  • Cài đặt R
sudo yum install R
  • Download và cài đặt RStudio, link download RStudio có thể cập nhật ở link sau
wget https://download2.rstudio.org/rstudio-server-rhel-0.99.491-x86_64.rpm
yum install --nogpgcheck rstudio-server-rhel-0.99.491-x86_64.rpm
  • Tiến hành thiết lập liên quan đến Fire wall. Mặc định RStudio sử dụng port 8787. Người sử dụng có thể truy cập, đăng nhập và sử dụng sử dụng địa chỉ :. RStudio server edition sử dụng các tài khoản được tạo trên Centos và không sử dụng các tài khoản hệ thống uid < 100. Do đó ta tiến hành tạo tài khoản trên Centos và cấp mật khẩu để người dùng có thể sử dụng.
useradd duytho
passwd duytho
  • Người dùng có thể login vào hệ thống với tài khoản duytho
Giao diện đăng nhập RStudio sử dụng Chrome

Giao diện đăng nhập RStudio sử dụng Chrome

  • Sau khi đăng nhập thành công
Giao diện RStudio trên web sau khi đăng nhập

Giao diện RStudio trên web sau khi đăng nhập

3.2 Lưu ý

  • Việc cài đặt các package của R từ RStudio trên Linux có thể phức tạp hơn trên môi trường Windows. Do đó trong trường hợp cần cái đặt các package thư viện, cần lưu ý các thông báo lỗi nếu không cài được, xác định nguyên nhân và nhờ quản trị hệ thống cài đặt thêm các gói thư viện hỗ trợ của Linux.
  • R sử dụng trên Linux xử lý Unicode tốt hơn trên Windows
  • Đọc thêm quản trị RStudio Server ở link sau