#Khoá học sử dụng R - Ngày 1 ##Đọc dữ liệu và đặt tên dữ liệu là bw

bw=read.csv("/Users/puccabeo/Desktop/DỮ LIỆU R/DỮ LIỆU THỰC HÀNH (TS Thạch gửi)/birthwt.csv")

Liệt kê 6 quan sát cuối cùng của bảng dữ liệu

tail(bw)
##     id low age lwt race smoke ptl ht ui ftv  bwt
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495

Tìm số lượng biến số và quan sát

dim(bw)
## [1] 189  11

Liệt kê 10 quan sát đầu tiên của bảng dữ liệu

head(bw,10)
##    id low age lwt race smoke ptl ht ui ftv  bwt
## 1  85   0  19 182    2     0   0  0  1   0 2523
## 2  86   0  33 155    3     0   0  0  0   3 2551
## 3  87   0  20 105    1     1   0  0  0   1 2557
## 4  88   0  21 108    1     1   0  0  1   2 2594
## 5  89   0  18 107    1     1   0  0  1   0 2600
## 6  91   0  21 124    3     0   0  0  0   0 2622
## 7  92   0  22 118    1     0   0  0  0   1 2637
## 8  93   0  17 103    3     0   0  0  0   1 2637
## 9  94   0  29 123    1     1   0  0  0   1 2663
## 10 95   0  26 113    1     1   0  0  0   0 2665

##Tạo biến mới mwt cân nặng của mẹ bằng kg

bw$mwt=bw$lwt*0.453592

Tạo biến factor mới “Ethnicity” với điều kiện nếu Race=1 thì là white, =2 là black, bằng 3 là other, nếu không thì là NA

bw$ethnicity=ifelse(bw$race==1,"White",ifelse(bw$race==2,"Black",ifelse(bw$race==3,"Other",NA)))

sau khi tạo bảng để phân tích 1 2 3 Black 0 26 0 Other 0 0 67 White 96 0 0