###Việc 1->3: Yêu cầu đọc dữ liệu birthwt.csv vào R input bằng cách vào Code -> Insert Chunk ở trên NHỚ LÀ VIẾT Ở ĐÂY KO CÓ DẤU > NHƯ Ở CONSOLE
bw = read.csv("C:/Users/LENOVO/OneDrive - The University of Melbourne/Documents/HỌC NGHIÊN CỨU VIỆN PHƯƠNG NAM/DỮ LIỆU THỰC HÀNH (TS Thạch gửi)/birthwt.csv")
Để kiếm link đường dẫn thì có 3 cách: 1) File -> import dataset -> From excel (ít nhất nó sẽ ra đường dẫn cho mình copy vô read.csv) 2) t = file.choose () (một số máy có thể bị lag ko thấy tên file) 3) Vô File của máy tính copy path tới file đó
Test thử file đã đọc đúng chưa (5 dữ liệu đầu tiên):
head(bw)
###Việc 4: kiểm tra dữ liệu ####4.1: Tìm số quan sát và biến số
dim(bw)
## [1] 189 11
[1] 189 11 189 dòng -> 189 cá nhân luôn (nó ko đếm dòng đầu) 11 cột (lúc nào cũng phải mở head đầu tiên để check coi mấy dưới đúng không) ####4.3: Hỏi CHATGPT đọc 10 dữ liẹu cuối
tail(bw,10)
####5.1: Tạo biến số mới mwt là cân nặng của mẹ tính bằng kg.
bw$mwt = bw$lwt * 0.453592
####5.2 Tạo biến số mới ethnicity là biến factor. Cái này là completely replace số 1,2,3 với label white,black,other luôn:
bw$race = factor (bw$race, levels = c(1,2,3), labels = c ('white', 'black', 'others'))