Vien Phuong Nam ngay 1

#Khóa học sử dụng R ngày 1 ##Việc 3: Đọc file dữ liệu Yêu cầu đọc dữ liệu birthwt.csv vào R

Việc 4: Thông tin về dữ liệu bw

Đọc 6 dòng đầu

head(bw)

##   id low age lwt race smoke ptl ht ui ftv  bwt
## 1 85   0  19 182    2     0   0  0  1   0 2523
## 2 86   0  33 155    3     0   0  0  0   3 2551
## 3 87   0  20 105    1     1   0  0  0   1 2557
## 4 88   0  21 108    1     1   0  0  1   2 2594
## 5 89   0  18 107    1     1   0  0  1   0 2600
## 6 91   0  21 124    3     0   0  0  0   0 2622

Hỏi ChatGPT đọc 10 dòng cuối: Prompt:Cho biết lệnh R để đọc 10 dòng cuối của dữ liệu bw 2 ?

tail(bw, 10)

##     id low age lwt race smoke ptl ht ui ftv  bwt
## 180 71   1  17 120    2     0   0  0  0   2 2438
## 181 75   1  26 154    3     0   1  1  0   1 2442
## 182 76   1  20 105    3     0   0  0  0   3 2450
## 183 77   1  26 190    1     1   0  0  0   0 2466
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495

Việc 5: Tạo biến số

5.1 tạo biến mwt (kg)

bw$mwt = bw$lwt*0.45

5.2 Tạo biến ethnicity

bw$ethnicity[bw$race == 1] = "white"
bw$ethnicity[bw$race == 2] = "black"
bw$ethnicity[bw$race == 3] = "other"

5.3 Tạo tập tin bw3 bao gồm cân nặng thấp

bw3 = subset (bw, low == 1)

###5.5. Tạo tập tin bw 4 bw4 = subset(bw, low == 1 & smoke == 1 & race == 1)

5.6: Nhờ chatGPT tạo biến ethnicity

bw$ethnicity4 <- factor(bw$race,
                        levels = c(1, 2, 3),
                        labels = c("white", "black", "other"))