HƯỚNG DẪN SỬ DỤNG STATA

Phiên thực hành ngày 14/10/2021

Giới thiệu: Stata

Thẻ File:

Thẻ edit: find

Thẻ Data:

Thẻ Graphics: Vẽ biểu đồ

Thẻ Statistics: Phân tích thống kê

Thẻ User: Tạo ra đường dẫn riêng ít dùng

Thẻ Windown: Trong Stata có bao nhiêu cửa sổ, lỡ tay tắt có thể mở lại.

Các cửa sổ:

Variables - biến số, command - viết câu lệnh trực tiếp, cửa sổ chính - to nhất ở giữa, history hoặc review - bên trái.

Các công cục:

Open: mở dữ liệu Save: Lưu trữ Log: Ghi nhớ lại kết quả Do file: Stata chạy lại lệnh đã lưu Data editor bảng có cây bút / aka gõ edit trong cmd

Stata không dùng chữ in hoa

Dấu tính toán

di trước khi tính toán

Căn bậc hai: sqrt(x)

Căn bậc ba: x^(1/n)

Dấu bằng: == (một dấu = thì chỉ kết nối hai vế lại)

Dấu khác: !=

Dấu xuống hàng: ** (dấu backward)

Dấu hoặc: | (Shift + **)

Dấu và: &

Khi trả kết quả ra 1: thỏa / 0: không thỏa

Lưu trữ cửa sổ kết quả: nhấn nút Log - NHỚ THỰC HIỆN TỪ ĐẦU TRƯỚC KHI NHẬP

hoặc có thể thoải mái rồi lưu sau cũng được.

không lưu nữa thì đóng log lại hoặc thoát khỏi Stata thì tự động đóng.

khi mở lại log có 3 tùy chọn:

  • View: chỉ nhìn

  • Append: kết nối kết quả cũ vào kết quả mới

  • Replace: thay thế bởi kết quả cũ không dùng kết quả mới

Các đuôi file cơ bản trong Stata:

Lưu cửa sổ kết quả: .smcl ( lệnh: log using "Ổ đĩa:file.smcl), tắt (log close)

Lưu cửa sổ câu lệnh: .do

Lưu cửa sổ biến số: .dta

NHẬP LIỆU

Stata:

Nhập trực tiếp: gõ vào command là edit

Đổi tên biến số ở cửa sổ properties khi để con trỏ chuột ở bảng dữ liệu hoặc nhập lệnh rename tên_biến_cũ tên_biến_mới

Ghi chú nhãn của biến gõ vào Lable ở cửa sổ Properties hoặc nhập lệnh lable variable biến_số “tên nhãn biến số thực tế”

Gán nhãn mã hóa cho giá trị ví dụ giới tính nam/nữ -> 1/2.

vào properties chọn value lable -> bấm vào dấu 3 chấm -> create lable với tên là gt -> gõ trong cửa sổ 1-nu/2-nam.

Sau đó ở value lable nhấn vào hình tam giác chọn gt.

Làm đúng sẽ có màu xanh (màu xanh của hi vọng, hi vọng các bạn làm được mã hóa ^^)

Lệnh:

Tạo nhãn giá trị: lable define tên_nhãn 1 “nu” 2 “nam” lable values tên_biến tên_nhãn

Tạo biến số mới gen tên_biến_mới = điều kiện vd: gen tuoi = 2021 - namsinh

Tách dữ liệu vd: tuổi trên 55

gen tren55 = tuoi > 55 tab1 tren55

bao nhieu nguoi cao huyet ap và thua can

gen both = caoha==1 $ thuacan==1

gen caoha = hamax>=140| hamin>=90

tab1 caoha

gen thuacan = (cannang/(chieucao/100)^2) >= 25

tab1 thuacan

R:

Nhập trực tiếp: tên_data <- edit(data.frame())

trong cửa sổ nhập liệu có thể đổi tên biến số và định dạng biến số (numberic hay character) nhưng mà cũng chỉ để làm quen, không ai đi lấy dao mổ trâu giết gà!

Tách chiết dữ liệu trong R Tách là tách ra khỏi bộ dữ liệu: *subset(tên_data, tên_biến điều kiện) vd: subset(khaosat, tuoi>=25)

Sẽ thấy R đơn giản hơn Stata, một số lệnh cơ bản trong R: https://youtu.be/WQwrBV-QGFQ

Thường khi xử lí số liệu thì nên làm sạch và mã hóa ở Excel hoặc phần miềm khác trước khi đưa vào Stata hoặc R.