Việc 1. Tải R, RStudio về máy tính và cài đặt

Việc 2. Cài đặt các gói lệnh (packages) cần thiết (nếu chưa cài đặt)

Việc 3. Đọc dữ liệu “birthwt.csv” vào R và gọi dữ liệu là “bw”

bw = read.csv ("C:\\Users\\Administrator\\Desktop\\birthwt.csv")

Việc 4. Thông tin về dữ liệu bw này

4.1. Có bao nhiêu biến số (variable) và quan sát (observation)

dim (bw)
## [1] 189  11

4.2. Liệt kê 6 quan sát đầu tiên của dữ liệu

head (bw, 6)
##   id low age lwt race smoke ptl ht ui ftv  bwt
## 1 85   0  19 182    2     0   0  0  1   0 2523
## 2 86   0  33 155    3     0   0  0  0   3 2551
## 3 87   0  20 105    1     1   0  0  0   1 2557
## 4 88   0  21 108    1     1   0  0  1   2 2594
## 5 89   0  18 107    1     1   0  0  1   0 2600
## 6 91   0  21 124    3     0   0  0  0   0 2622

4.3. Hỏi chatGPT đọc 10 dòng cuối

tail (bw, 10)
##     id low age lwt race smoke ptl ht ui ftv  bwt
## 180 71   1  17 120    2     0   0  0  0   2 2438
## 181 75   1  26 154    3     0   1  1  0   1 2442
## 182 76   1  20 105    3     0   0  0  0   3 2450
## 183 77   1  26 190    1     1   0  0  0   0 2466
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495

5. Biên tập dữ liệu

5.1. Tạo biến số mới mwt là cân nặng của mẹ tính bằng kg

bw$mwt = bw$lwt*0.45

5.2. Tạo biến số mới ethnicity là biến factor với điều kiện

bw$ethnicity [bw$race == 1] = "white"
bw$ethnicity [bw$race == 2] = "black"
bw$ethnicity [bw$race == 3] = "other"
table (bw$ethnicity, bw$race)
##        
##          1  2  3
##   black  0 26  0
##   other  0  0 67
##   white 96  0  0

5.3. Tạo 1 tập dữ liệu bw1 chỉ gồm 3 biến số id, low và bwt

bw1 = bw [c("id", "low", "bwt")]

5.4. Tạo 1 tập dữ liệu bw3 chỉ gồm những thai phụ có cân nặng thấp (low = 1)

bw3 = subset (bw, low==1)

5.5. Tạo 1 tập dữ liệu bw4 chỉ gồm những thai phụ có cân nặng thấp (low = 1) và có hút thuốc trong lúc mang thai (smoke = 1)

bw4 = subset (bw, low==1 & smoke==1)

5.6. Sử dụng ChatGPT tạo tập dữ liệu bw5 như việc 5.5