việc 3: đọc dữ liệu vào R

bw= read.csv("C:\\Users\\nx2li\\Desktop\\R - Nhat\\DỮ LIỆU THỰC HÀNH (TS Thạch gửi)\\birthwt.csv")

việc 4: kiểm tra dữ liệu R

4.1: quan sát biến số

dim(bw)
## [1] 189  11

4.2: 6 dòng đầu tiên của dữ liệu

head(bw)
##   id low age lwt race smoke ptl ht ui ftv  bwt
## 1 85   0  19 182    2     0   0  0  1   0 2523
## 2 86   0  33 155    3     0   0  0  0   3 2551
## 3 87   0  20 105    1     1   0  0  0   1 2557
## 4 88   0  21 108    1     1   0  0  1   2 2594
## 5 89   0  18 107    1     1   0  0  1   0 2600
## 6 91   0  21 124    3     0   0  0  0   0 2622

4.3: hỏi chatGPT

prombt: cho biết lệnh R để kiểm 10 dòng cuối của dữ liệu bw

tail(bw,10)
##     id low age lwt race smoke ptl ht ui ftv  bwt
## 180 71   1  17 120    2     0   0  0  0   2 2438
## 181 75   1  26 154    3     0   1  1  0   1 2442
## 182 76   1  20 105    3     0   0  0  0   3 2450
## 183 77   1  26 190    1     1   0  0  0   0 2466
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495

việc 5: biên tập dữ liệu trong R

5.1 tạo biến số mwt(kg)

bw$mwt= bw$lwt *0.45

5.2 tạo biến số ethnicity

lệnh 1

 bw$ethnicity[bw$race==1]="white"
 bw$ethnicity[bw$race==2]="black"
bw$ethnicity[bw$race==3]="other"

lệnh 2

bw$ethnicity3 = factor(bw$race,
                       levels=c(1,2,3),
                       labels=c("white","black","other"))

lệnh 3

bw$ethnicity2 <- ifelse(bw$race == 1, "white",
                       ifelse(bw$race == 2, "black", "other"))

###5.3: tạo tập tin bw1

bw1=bw[, c("id","low","bwt")]

5.4 tạo tập tin bw3. gồm bé cân nặng thấp

bw3=subset(bw,low==1)

5.5 tạo tập tin bw4. bé cân nặng thấp, mẹ hút thuốc và da trắng

bw4=subset(bw, low==1 & smoke==1 & ethnicity=="white")