#K hoá học sử dụng R- Ngày 1 ## Việc 3: đọc dữ liệu Yêu cầu đọc dữ liệu birthwt.crv vào R t= file.choose()
bw=read.csv("/Users/trinhvananh/Desktop/R/DỮ LIỆU THỰC HÀNH (TS Thạch gửi)/birthwt.csv")
##Việc 4: kiểm tra dữ liệu
###4.1. Tìm quan sát và biến số
dim(bw)
## [1] 189 11
head(bw)
## id low age lwt race smoke ptl ht ui ftv bwt
## 1 85 0 19 182 2 0 0 0 1 0 2523
## 2 86 0 33 155 3 0 0 0 0 3 2551
## 3 87 0 20 105 1 1 0 0 0 1 2557
## 4 88 0 21 108 1 1 0 0 1 2 2594
## 5 89 0 18 107 1 1 0 0 1 0 2600
## 6 91 0 21 124 3 0 0 0 0 0 2622
###4.3. Hỏi chatGPT đọc 10 dòng cuối
tail(bw, 10)
## id low age lwt race smoke ptl ht ui ftv bwt
## 180 71 1 17 120 2 0 0 0 0 2 2438
## 181 75 1 26 154 3 0 1 1 0 1 2442
## 182 76 1 20 105 3 0 0 0 0 3 2450
## 183 77 1 26 190 1 1 0 0 0 0 2466
## 184 78 1 14 101 3 1 1 0 0 0 2466
## 185 79 1 28 95 1 1 0 0 0 2 2466
## 186 81 1 14 100 3 0 0 0 0 2 2495
## 187 82 1 23 94 3 1 0 0 0 0 2495
## 188 83 1 17 142 2 0 0 1 0 0 2495
## 189 84 1 21 130 1 1 0 1 0 3 2495
## Việc 5: Biên tập dữ liệu
###5.1. Tạo biến số mới mwt là cân nặng của mẹ tính bằng kg
bw$mwt2= bw$lwt*0.45
head(bw)
## id low age lwt race smoke ptl ht ui ftv bwt mwt2
## 1 85 0 19 182 2 0 0 0 1 0 2523 81.90
## 2 86 0 33 155 3 0 0 0 0 3 2551 69.75
## 3 87 0 20 105 1 1 0 0 0 1 2557 47.25
## 4 88 0 21 108 1 1 0 0 1 2 2594 48.60
## 5 89 0 18 107 1 1 0 0 1 0 2600 48.15
## 6 91 0 21 124 3 0 0 0 0 0 2622 55.80
###5.2. tạo biến ethnicity
### 5.3.tạo tập tin bw1
bw1=bw[,c("id", "low", "bwt")]
###5.4 Tạo 1 tập dữ liệu bw3 chỉ gồm những thai phụ có cân nặng thấp (low = 1)
bw3= subset(bw, low==1)
###5.5 Tạo 1 tập dữ liệu bw4 chỉ gồm những thai phụ có cân nặng thấp (low = 1) và có hút thuốc trong lúc mang thai (smoke = 1).
bw4= subset(bw, low==1 & smoke==1)
head(bw4)
## id low age lwt race smoke ptl ht ui ftv bwt mwt2
## 131 4 1 28 120 3 1 1 0 1 0 709 54.00
## 133 11 1 34 187 2 1 0 1 0 0 1135 84.15
## 140 20 1 21 165 1 1 0 1 0 1 1790 74.25
## 141 22 1 32 105 1 1 0 0 0 0 1818 47.25
## 142 23 1 19 91 1 1 2 0 1 0 1885 40.95
## 145 26 1 25 92 1 1 0 0 0 0 1928 41.40