1. Giới thiệu data

Dữ liệu khảo sát về thói quen hút thuốc lá ở Vương quốc Anh. Bộ dữ liệu này có thể được sử dụng để phân tích đặc điểm dân cư của người hút thuốc và các loại thuốc lá được sử dụng.

Bộ dữ liệu chứa 1691 quan sát trên 12 biến

Chúng ta sẽ phân tích xem giới tính có ảnh hưởng đến việc hút thuốc hay không dựa vào hai biến định tính là gender và smoke:

2. Lập bảng tần số

Tần số và tần suất biến gender

## 
## Female   Male 
##    965    726
## 
##    Female      Male 
## 0.5706682 0.4293318
  • Từ kết quả trên ta có thể thấy được trong 1691 lượt tham gia khảo sát có 965 người có giới tính là nữ (chiếm 57,07%) và 726 người có giới tính là nam (chiếm 42,93%)

Tần số và tần suất biến smoke

## 
##   No  Yes 
## 1270  421
## 
##        No       Yes 
## 0.7510349 0.2489651
  • Kết quả cho thấy trong 1691 lượt tham gia khảo sát có 421 câu trả lời là có hút thuốc (24,9%) và 1270 câu trả lời là không (75,1%).

Bảng tần số, tần suất và Vẽ đồ thị cho hai biến gender và biến smoke

##         
##           No Yes
##   Female 731 234
##   Male   539 187
##         
##                 No       Yes
##   Female 0.4322886 0.1383797
##   Male   0.3187463 0.1105855

Thông qua kết quả trên ta thấy

  • Trong nhóm người không hút thuốc có 731 người là nữ (43,23%) và 539 người là nam (31,87%)

  • Trong nhóm người có câu trả lời “có hút thuốc” có 234 người là nữ (13,84%) và 187 người là nam (11,06%)

3. Ước lượng tỷ lệ

4. Relative Risk

##         
##            No  Yes  Sum
##   Female  731  234  965
##   Male    539  187  726
##   Sum    1270  421 1691
## [1] 1.020324

5. Odd Ratio

## [1] 1.083813