Giới thiệu chung

1) Tổng quan về khoá học Stata

  • Làm quen với giao diện phần mềm Stata, cách sử dụng Do - file
  • Quản lý và làm sạch dữ liệu
  • Thống kê mô tả: tần số, tỷ lệ, trung bình, nhỏ nhất, lớn nhất,…
  • Kiểm định cơ bản: chi-square, t-test, hồi quy logistic,…
  • Cách vẽ một vài biểu đồ thường dùng trong phân tích dữ liệu

2) Cấu trúc từng buổi học

  • Giới thiệu các câu lệnh và chức năng
  • Thực hiện chạy các câu lệnh trực tiếp trên giao diện Stata
  • Học viên chia sẻ màn hình và thực hành các bài tập dựa trên nội dung của buổi học

Bài 1 - Quản lý tệp dữ liệu trong stata

I. Mục tiêu buổi học

  • Nhận diện và sử dụng thành thạo các thành phần trong giao diện STATA
  • Nhập và xuất dữ liệu từ các định dạng như Excel, CSV… vào STATA
  • Tạo, chỉnh sửa và chạy lệnh thông qua do-file
  • Kiểm tra và mô tả cấu trúc dữ liệu ban đầu để chuẩn bị cho phân tích

II. Giới thiệu về Stata

1) Lịch sử, đặc điểm của Stata

  • Phần mềm thống kê được phát triển từ năm 1985 bởi StataCorp
  • Một chương trình thống kê mạnh, sử dụng trong phân tích định lượng và thống kê
  • Dùng phổ biến trong kinh tế, xã hội học, chính trị, dịch tễ học…
  • Nhiều người mới bắt đầu/lâu năm ưa thích vì dễ học, giao diện thân thiện và dễ sử dụng
  • Cung cấp hệ thống quản lý dữ liệu và khả năng phân tích thống kê

2) Thế mạnh

  • Giao diện dễ sử dụng.
  • Câu lệnh dễ hiểu.
  • Phân tích thống kê mạnh mẽ từ cơ bản đến nâng cao, đặc biệt là hồi quy.
  • Quản lý dữ liệu linh hoạt.

III. Giao diện STATA

Thanh công cụ
Review
Results
Command
Variable
Properties
  • Gồm các mục như File, Edit, Data, Graphics, Statistics, User, Help….
  • Cho phép truy cập các chức năng thông qua giao diện đồ họa mà không cần gõ lệnh.
  • Ghi lại các lệnh đã dùng, có thể nhấp để chạy lại dễ dàng.
  • Hiển thị đầu ra của lệnh: bảng, kết quả thống kê, thông báo lỗi…
  • Nơi nhập lệnh STATA để thực hiện phân tích.
  • Danh sách các biến trong dữ liệu, bao gồm tên, nhãn và loại biến.
  • Cung cấp thông tin chi tiết về tập dữ liệu hoặc từng biến cụ thể.
  • Giao diện Stata

    IV. Nhập - Xuất - Lưu dữ liệu

    Import (Nhập)
    Export (Xuất)
    Save (Lưu)
    • Bước 1: File trên thanh công cụ -> Import
    • Bước 2: Chọn Browse để chọn file dữ liệu cần nhập
    • Bước 3: Chọn “Import first row as variables name” để nhận dòng đầu tiên là tên biến
    • Nhap du lieu

  • Bước 1: File trên thanh công cụ -> Export -> Chọn định dạng phù hợp (excel/csv/…)
  • Bước 2: Chọn nơi lưu và đặt tên file
  • Nên dùng khi đã xử lý, làm sạch dữ liệu
  • Xuat du lieu

  • Bước 1: File trên thanh công cụ -> Save/Save as -> Nhập tên file
  • Bước 2: Chọn định dạng ở File Format là Stata Data (*.dta) -> OK
  • Dùng cho mỗi lần xử lý dữ liệu hoặc sau khi hoàn thành xử lý dữ liệu
  • Luu du lieu

    V. Do - file

    Giao diện Do - file
    Open Do - file
    Cách dùng
    Comments
    • Lưu lại quy trình phân tích.

    • Tái sử dụng các lệnh nhiều lần

    • Dễ dàng chia sẻ với những người khác để họ hiểu và lặp lại quy trình phân tích của bạn.

    • Chạy lệnh hàng loạt chỉ bằng một cú nhấp chuột.

    • Giúp giải thích các bước để việc đọc hiểu câu lệnh trở nên dễ dàng hơn

    • Dofile

  • Chọn “New Do-file Editor” để mở cửa sổ do-file

  • Mo Dofile

    Cach dung dofile

  • Dấu *: Chỉ dùng ở đầu câu, Stata sẽ bỏ qua phần còn lại của dòng đó.

  • _Mở rộng: Dấu // dùng ở đầu câu hoặc cuối câu. Stata chỉ bỏ qua nội dung sau // khi chạy trực tiếp tên Do - file. Chạy trực tiếp trênn ô Command sẽ cảnh báo lỗi.

    Dofile

  • VI.Cấu trúc của một bộ dữ liệu

    Các loại biến
    • Biến chuỗi/dạng văn bản: string (str18)
    • Biến số thập phân: numeric (float)
    • Biến số nguyên: numeric (int). Thường trong khoảng từ -32767 đến 32740
    • Biến số nguyên rất nhỏ: numeric (byte). Thường trong khoảng -127 đến 100
    • Giá trị bị thiếu (missing): Dấu .
    • Bo du lieu

    VII. Câu lệnh

    1) Hiển thị đường dẫn thư mục hiện tại

    • pwd
    • Kết quả C:\Users\Ngoc\Documents\Projects\

    2) Mô tả chi tiết bộ dữ liệu

    • codebook

      Codebook

    • describe, full

    3) Chỉ xem bộ dữ liệu

    • browse hoặc br

    4) Xem và sửa bộ dữ liệu

    • edit hoặc ed

    5) Xoá dữ liệu trước đó

    • clear
    • Sử dụng khi muốn chuyển bộ dữ liệu

    Bài tập

    Bài tập 1

    • Tạo một thư mục StataExercise trên máy tính của bạn
    • Import/Nhập file excel Dữ liệu khảo sát phụ nữ (NLSW 1988) practice1_nlsw88.xlsx vào Stata. Tải file practice1_nlsw88.xlsx (.xlsx)
    • Lưu dữ liệu vào thư mục StataExercise

    Bài tập 2

    Mở bộ dữ liệu Thông tin xe hơi sẵn có trên Stata. Copy câu lệnh sysuse auto, clear. Mô tả bộ dữ liệu:
    Có tổng số bao nhiêu biến? 
    Có tổng số bao nhiêu bản ghi?
    Có bao nhiêu biến dạng chuỗi/văn bản? Liệt kê tên biến
    Có tổng số bao nhiêu biến số nguyên? Bao nhiêu biến số `int` và `byte`. Liệt kê tên biến 
    Có bao nhiêu biến số thập phân? Liệt kê tên biến
    Biến nào có giá trị bị thiếu (missing)? Liệt kê tên biến và số lượng missing
    • Tạo 1 comment với dấu *. Nội dung: “Buổi 1 - Stata - Tên học viên”
    • Export file dữ liệu Thông tin xe hơi dưới dạng file excel vào thư mục StataExercise
    • Lưu các câu lệnh đã sử dụng vào do-file
    • Lưu do-file vào thư mục StataExercise
    Link có thời hạn sử dụng đến 30/7/2025 Tài liệu được xây dựng vởi Daihub