1. TẠO BIẾN TRONG R

x <- 10

ten <- "Gốt"

is_pretty <- TRUE

2. CÁC KIỂU DỮ LIỆU CƠ BẢN

Kiểu dữ liệu Ví dụ Mô tả
numeric 3.14; 10; -2,5 Số thực
integer 10; 20; 200 Số nguyên
Character “Hello”, “a”, “hi hi” Chuỗi ký tự
logical TRUE; FALSE Boolean (đúng/sai)
factor factor(c(“low,”,medium”, “high”)) Dữ liệu phân loại (danh mục)

3. HÀM KIỂM TRA DỮ LIỆU

Hàm Ý nghĩa
class(x) Kiểu dữ liệu (giao diện R dùng)
typeof(x) Kiểu dữ liệu bên trong
is.numeric(x) Trả về TRUE/FALSE
is.character(x) TRUE nếu là chuỗi
is.logical(x) TRUE nếu là TRUE/FALSE
is.factor(x) TRUE nếu là phân loại

4. THỰC HÀNH

4.1 KIỂU SỐ THỰC

a <- 10.6 
class(a) # kiểm tra kiểu dữ liệu
## [1] "numeric"
typeof(a) # kiểm tra dữ liệu bên trong
## [1] "double"
# Kết quả là 'double" là kiểu số thực
is.numeric(a) # kiểm tra biến có phải là số hay không
## [1] TRUE
is.character(a) # kiểm tra biến có phải là chuỗi hay không
## [1] FALSE
is.logical(a) # kiểm tra biến có phải kiểu boolean hay không
## [1] FALSE
is.factor(a) # kiểm tra biến có phải là factor hay không
## [1] FALSE

4.2 KIỂU FACTOR

emotion <- c("happy", "sad", "sad", "excited", "tierd")
b <- factor(emotion)
class(b) # kiểm tra kiểu dữ liệu
## [1] "factor"
typeof(b) # kiểm tra dữ liệu bên trong
## [1] "integer"
# Kết quả là 'double" là kiểu số thực

Trong R, factor được lưu bên trong dưới dạng các số nguyên (integer), mỗi số nguyên này đại diện cho một level (mức phân loại) của factor đó.

Giá trị emotion Level số (internal integer)
excited 1
happy 2
sad 3
tierd 4

Lưu ý: Các level được sắp xếp theo thứ tự bảng chữ cái (alphabetical order) theo mặc định.

is.numeric(b) # kiểm tra biến có phải là số hay không
## [1] FALSE
is.character(b) # kiểm tra biến có phải là chuỗi hay không
## [1] FALSE
is.logical(b) # kiểm tra biến có phải kiểu boolean hay không
## [1] FALSE
is.factor(b) # kiểm tra biến có phải là factor hay không
## [1] TRUE