Phiên thực hành ngày 14/10/2021
Thẻ File:
Thẻ edit: find
Thẻ Data:
Thẻ Graphics: Vẽ biểu đồ
Thẻ Statistics: Phân tích thống kê
Thẻ User: Tạo ra đường dẫn riêng ít dùng
Thẻ Windown: Trong Stata có bao nhiêu cửa sổ, lỡ tay tắt có thể mở lại.
Variables - biến số, command - viết câu lệnh trực tiếp, cửa sổ chính - to nhất ở giữa, history hoặc review - bên trái.
Open: mở dữ liệu Save: Lưu trữ Log: Ghi nhớ lại kết quả Do file: Stata chạy lại lệnh đã lưu Data editor bảng có cây bút / aka gõ edit trong cmd
gõ di trước khi tính toán
Căn bậc hai: sqrt(x)
Căn bậc ba: x^(1/n)
Dấu bằng: == (một dấu = thì chỉ kết nối hai vế lại)
Dấu khác: !=
Dấu xuống hàng: ** (dấu backward)
Dấu hoặc: | (Shift + **)
Dấu và: &
Khi trả kết quả ra 1: thỏa / 0: không thỏa
Lưu trữ cửa sổ kết quả: nhấn nút Log - NHỚ THỰC HIỆN TỪ ĐẦU TRƯỚC KHI NHẬP
hoặc có thể thoải mái rồi lưu sau cũng được.
không lưu nữa thì đóng log lại hoặc thoát khỏi Stata thì tự động đóng.
khi mở lại log có 3 tùy chọn:
View: chỉ nhìn
Append: kết nối kết quả cũ vào kết quả mới
Replace: thay thế bởi kết quả cũ không dùng kết quả mới
Lưu cửa sổ kết quả: .smcl ( lệnh: log using "Ổ đĩa:file.smcl), tắt (log close)
Lưu cửa sổ câu lệnh: .do
Lưu cửa sổ biến số: .dta
Nhập trực tiếp: gõ vào command là edit
Đổi tên biến số ở cửa sổ properties khi để con trỏ chuột ở bảng dữ liệu hoặc nhập lệnh rename tên_biến_cũ tên_biến_mới
Ghi chú nhãn của biến gõ vào Lable ở cửa sổ Properties hoặc nhập lệnh lable variable biến_số “tên nhãn biến số thực tế”
Gán nhãn mã hóa cho giá trị ví dụ giới tính nam/nữ -> 1/2.
vào properties chọn value lable -> bấm vào dấu 3 chấm -> create lable với tên là gt -> gõ trong cửa sổ 1-nu/2-nam.
Sau đó ở value lable nhấn vào hình tam giác chọn gt.
Làm đúng sẽ có màu xanh (màu xanh của hi vọng, hi vọng các bạn làm được mã hóa ^^)
Tạo nhãn giá trị: lable define tên_nhãn 1 “nu” 2 “nam” lable values tên_biến tên_nhãn
Tạo biến số mới gen tên_biến_mới = điều kiện vd: gen tuoi = 2021 - namsinh
Tách dữ liệu vd: tuổi trên 55
gen tren55 = tuoi > 55 tab1 tren55
bao nhieu nguoi cao huyet ap và thua can
gen both = caoha==1 $ thuacan==1
gen caoha = hamax>=140| hamin>=90
tab1 caoha
gen thuacan = (cannang/(chieucao/100)^2) >= 25
tab1 thuacan
Nhập trực tiếp: tên_data <- edit(data.frame())
trong cửa sổ nhập liệu có thể đổi tên biến số và định dạng biến số (numberic hay character) nhưng mà cũng chỉ để làm quen, không ai đi lấy dao mổ trâu giết gà!
Tách chiết dữ liệu trong R Tách là tách ra khỏi bộ dữ liệu: *subset(tên_data, tên_biến điều kiện) vd: subset(khaosat, tuoi>=25)
Sẽ thấy R đơn giản hơn Stata, một số lệnh cơ bản trong R: https://youtu.be/WQwrBV-QGFQ