Mô tả: Dữ liệu CigarettesSW của gói AER là một dữ liệu bảng về mức tiêu thụ thuốc lá của 48 tiểu bang lục địa Hoa kỳ, trong đó gồm 9 biến.
state: Yếu tố chỉ trạng thái.
year: Yếu tố chỉ năm.
cpi: Chỉ số giá tiêu dùng.
population: dân số.
packs: Số gói bình quân đầu người.
income: Thu nhập cá nhân.
tax: Thuế tiêu thụ đặc biệt trung bình của tiểu bang, liên bang và địa phương cho năm tài chính.
price: Giá trong năm tài chính, bao gồm thuế bán hàng.
taxs: Thuế bán hàng.
library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data(CigarettesSW)
### Gán dữ liệu CigarettesSW vào d
d <- CigarettesSW
### Quan tâm đến năm 1985 để lọc dữ liệu năm 1985 ta dùng lệnh trên R, sau đó ta có kết quả:
c1985 <- d[d$year == '1985',]
c1985
## state year cpi population packs income tax price taxs
## 1 AL 1985 1.076 3973000 116.48628 46014968 32.50000 102.18167 33.34834
## 2 AR 1985 1.076 2327000 128.53459 26210736 37.00000 101.47500 37.00000
## 3 AZ 1985 1.076 3184000 104.52261 43956936 31.00000 108.57875 36.17042
## 4 CA 1985 1.076 26444000 100.36304 447102816 26.00000 107.83734 32.10400
## 5 CO 1985 1.076 3209000 112.96354 49466672 31.00000 94.26666 31.00000
## 6 CT 1985 1.076 3201000 109.27835 60063368 42.00000 128.02499 51.48333
## 7 DE 1985 1.076 618000 143.85114 9927301 30.00000 102.49166 30.00000
## 8 FL 1985 1.076 11352000 122.18112 166919248 37.00000 115.29000 42.49000
## 9 GA 1985 1.076 5963000 127.23462 78364336 28.00000 97.02517 28.84183
## 10 IA 1985 1.076 2830000 113.74558 37902896 34.00000 101.84200 37.91700
## 11 ID 1985 1.076 994000 103.01811 11577261 25.10000 102.89933 29.05767
## 12 IL 1985 1.076 11401000 123.20848 176786352 28.00001 104.44025 28.91526
## 13 IN 1985 1.076 5460000 137.63737 71751616 26.50000 96.18000 31.08000
## 14 KS 1985 1.076 2428000 116.68040 34784360 32.00000 98.92291 34.88125
## 15 KY 1985 1.076 3695000 186.03519 42703144 19.00000 87.00125 23.14292
## 16 LA 1985 1.076 4409000 127.55727 53431900 32.00000 108.39400 36.16900
## 17 MA 1985 1.076 5881000 115.67760 98328688 42.00000 112.20834 42.00000
## 18 MD 1985 1.076 4414000 120.97871 74851664 29.00000 91.96667 29.00000
## 19 ME 1985 1.076 1163000 128.11694 14575292 36.00000 107.04750 41.09750
## 20 MI 1985 1.076 9077000 128.00485 133728040 37.00000 104.91417 37.83083
## 21 MN 1985 1.076 4185000 112.90323 63152360 34.00000 113.64967 40.43300
## 22 MO 1985 1.076 5001000 130.37393 69341920 29.00000 99.33817 29.85484
## 23 MS 1985 1.076 2588000 117.04018 25678534 27.58333 105.29333 33.54333
## 24 MT 1985 1.076 822000 104.25790 9785230 32.00000 99.29166 32.00000
## 25 NC 1985 1.076 6255000 155.28377 79104656 18.00000 84.96799 21.26800
## 26 ND 1985 1.076 677000 105.46529 8672948 34.00000 106.80800 38.10800
## 27 NE 1985 1.076 1585000 107.38171 21778072 34.00000 104.60667 38.02333
## 28 NH 1985 1.076 997000 197.99399 15767469 33.00000 95.50000 33.00000
## 29 NJ 1985 1.076 7566000 116.52128 133549208 41.00000 110.41666 41.00000
## 30 NM 1985 1.076 1439000 88.74218 17258916 28.00000 102.77800 31.95300
## 31 NV 1985 1.076 951000 141.95584 14581495 31.00000 114.18850 37.46350
## 32 NY 1985 1.076 17794000 116.66292 297728512 37.00000 109.99783 37.88117
## 33 OH 1985 1.076 10736000 127.59874 153455776 30.00000 100.42374 34.78208
## 34 OK 1985 1.076 3272000 127.13937 43395580 34.00000 101.46808 34.82642
## 35 OR 1985 1.076 2673000 119.45380 36205164 35.00000 97.03333 35.00000
## 36 PA 1985 1.076 11772000 117.70303 170033840 34.00000 109.07401 40.17400
## 37 RI 1985 1.076 967000 132.78178 14229156 39.00000 100.94167 39.00000
## 38 SC 1985 1.076 3304000 127.20944 38536176 23.00000 90.64125 27.31625
## 39 SD 1985 1.076 698000 106.59026 8340000 31.00000 97.08334 31.00000
## 40 TN 1985 1.076 4716000 129.83459 57749668 29.00000 101.94550 34.77050
## 41 TX 1985 1.076 16275000 115.10293 231003152 35.25000 107.38000 39.38000
## 42 UT 1985 1.076 1643000 68.04626 19462380 28.00000 110.19584 34.23750
## 43 VA 1985 1.076 5716000 134.00980 87361632 18.50000 91.61533 22.02367
## 44 VT 1985 1.076 530000 145.28302 6887097 33.00000 100.98334 33.00000
## 45 WA 1985 1.076 4401000 96.22813 64846548 39.00000 129.46109 47.46942
## 46 WI 1985 1.076 4748000 107.87700 65732720 41.00000 114.59000 46.45667
## 47 WV 1985 1.076 1907000 112.84740 20852964 33.00000 108.91125 38.18625
## 48 WY 1985 1.076 500000 129.39999 7116756 24.00000 93.46667 24.00000
### Quan tâm đến năm 1995 để lọc dữ liệu năm 1995 ta dùng lệnh trên R, sau đó ta có kết quả:
c1995 <- d[!d$year == '1985',]
c1995
## state year cpi population packs income tax price taxs
## 49 AL 1995 1.524 4262731 101.08543 83903280 40.50000 158.3713 41.90467
## 50 AR 1995 1.524 2480121 111.04297 45995496 55.50000 175.5425 63.85917
## 51 AZ 1995 1.524 4306908 71.95417 88870496 65.33333 198.6075 74.79082
## 52 CA 1995 1.524 31493524 56.85931 771470144 61.00000 210.5047 74.77133
## 53 CO 1995 1.524 3738061 82.58292 92946544 44.00000 167.3500 44.00000
## 54 CT 1995 1.524 3265293 79.47219 104315120 74.00000 218.2805 86.35550
## 55 DE 1995 1.524 718265 124.46660 18237436 48.00000 165.6000 48.00000
## 56 FL 1995 1.524 14185403 93.07455 333525344 57.90000 187.7172 68.52551
## 57 GA 1995 1.524 7188538 97.47462 159800448 36.00000 156.5731 37.43142
## 58 IA 1995 1.524 2840860 92.40160 60170928 60.00000 190.8900 69.09000
## 59 ID 1995 1.524 1165000 74.84978 22868920 52.00000 179.6375 60.55417
## 60 IL 1995 1.524 11884935 83.26508 304767456 68.00001 198.4762 79.23450
## 61 IN 1995 1.524 5791819 134.25835 126525008 39.50000 154.5338 46.85875
## 62 KS 1995 1.524 2586942 88.75344 56626672 48.00000 175.2100 56.34333
## 63 KY 1995 1.524 3855248 172.64778 74079712 27.00000 145.9797 35.26300
## 64 LA 1995 1.524 4327978 105.17613 84572688 44.00000 167.7953 50.45367
## 65 MA 1995 1.524 6062335 76.62064 170051568 75.00000 217.1050 85.33833
## 66 MD 1995 1.524 5023650 77.47355 135115456 60.00000 186.0338 68.85875
## 67 ME 1995 1.524 1237438 102.46978 25045934 61.00000 197.2307 72.16400
## 68 MI 1995 1.524 9659871 81.38825 231594240 99.00000 240.8497 112.63300
## 69 MN 1995 1.524 4605445 82.94530 113216856 72.00000 220.3487 86.41534
## 70 MO 1995 1.524 5324610 122.45028 117639672 41.00000 157.2301 42.38842
## 71 MS 1995 1.524 2690788 105.58245 46241956 42.00000 169.2294 53.07108
## 72 MT 1995 1.524 868522 87.15957 16296835 42.00000 156.2167 42.00000
## 73 NC 1995 1.524 7185403 121.53806 157633568 29.00000 149.9940 34.76900
## 74 ND 1995 1.524 641548 79.80697 12243384 68.00000 192.2487 78.88200
## 75 NE 1995 1.524 1635142 87.27071 36293064 58.00000 182.1750 66.67500
## 76 NH 1995 1.524 1145604 156.33675 28649564 49.00000 166.6417 49.00000
## 77 NJ 1995 1.524 7965523 80.37137 233208576 64.00000 203.0872 75.49550
## 78 NM 1995 1.524 1682417 64.66887 31716160 45.00000 176.1462 53.38792
## 79 NV 1995 1.524 1525777 93.52612 39377292 59.00000 206.5992 72.51583
## 80 NY 1995 1.524 18150928 70.81732 503163328 80.00000 221.8580 88.53300
## 81 OH 1995 1.524 11155493 111.38010 255312928 48.00000 165.8913 55.89958
## 82 OK 1995 1.524 3265547 108.68011 63333300 47.00000 170.1350 55.10167
## 83 OR 1995 1.524 3141421 92.15575 71209312 62.00000 190.3000 62.00000
## 84 PA 1995 1.524 12044780 95.64309 285923232 55.00000 176.1632 64.97150
## 85 RI 1995 1.524 989203 92.59980 23786644 80.00000 224.4592 94.68425
## 86 SC 1995 1.524 3699943 108.08275 72050072 31.00000 152.8187 38.27708
## 87 SD 1995 1.524 728251 97.21923 14454129 47.00000 168.0380 53.46300
## 88 TN 1995 1.524 5241168 122.32005 114259984 37.00000 167.0670 49.37533
## 89 TX 1995 1.524 18679706 73.07931 402096768 65.00000 198.2023 76.21900
## 90 UT 1995 1.524 1976774 49.27220 37278220 50.50000 180.9763 59.11792
## 91 VA 1995 1.524 6601392 105.38687 161441792 26.50001 166.6613 34.43626
## 92 VT 1995 1.524 582827 122.33475 12448607 44.00000 175.6387 52.36375
## 93 WA 1995 1.524 5431024 65.53092 129680832 80.50000 239.1093 96.14267
## 94 WI 1995 1.524 5137004 92.46635 115959680 62.00000 201.3813 71.58958
## 95 WV 1995 1.524 1820560 115.56883 32611268 41.00000 166.5172 50.42550
## 96 WY 1995 1.524 478447 112.23814 10293195 36.00000 158.5417 36.00000
### Cung cấp một bảng tóm tắt thống kê về dữ liệu 'Chỉ số giá tiêu dùng', ta dùng câu lệnh trên R, sau đó có được kết quả lần lượt là giá trị nhỏ nhất,giá trị phần tư thứ nhất,giá trị trung bình, giá trị trung vị, giá trị của phần tư thứ ba, giá trị lớn nhất
summary(d$cpi)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.076 1.076 1.300 1.300 1.524 1.524
### Phân tổ cho dữ liệu 'Giá' không đều và đặt tên theo từng tổ 'nhỏ','vừa','lớn' sau đó gán vào biến slcoded, ta được kết quả là:
d$slcoded <- cut(d$price, breaks = c(84.8, 134, 192, 241),labels = c('nhỏ','vừa','lớn'))
d$slcoded
## [1] nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ
## [20] nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ
## [39] nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ nhỏ vừa vừa lớn lớn vừa lớn vừa vừa vừa
## [58] vừa vừa lớn vừa vừa vừa vừa lớn vừa lớn lớn lớn vừa vừa vừa vừa lớn vừa vừa
## [77] lớn vừa lớn lớn vừa vừa vừa vừa lớn vừa vừa vừa lớn vừa vừa vừa lớn lớn vừa
## [96] vừa
## Levels: nhỏ vừa lớn
### Tạo bảng tần số cho dữ lệu 'Giá' được chia thành tổ không đều ở trên, ta dùng câu lệnh trên R, sau đó ta được kết quả là những lần xuất hiện của từng tổ 'nhỏ','vừa,'lớn'
table(d$slcoded)
##
## nhỏ vừa lớn
## 48 32 16
### Dùng để tính giá trị trung bình của biến 'Giá'
mean(d$price)
## [1] 143.4479
### Dùng để tính phương sai dựa vào dữ liệu của biến 'Giá', sau đó ta có được kết quả: phương sai quá lớn, cho thấy các số trong dữ liệu của biến 'Giá' nằm cách xa giá trị trung bình và có biến động lớn
var(d$price)
## [1] 1926.108
### Dùng để tính độ lệch chuẩn của biến'Giá', Độ lệch chuẩn là thước đo độ phân tán hoặc trải rộng của các điểm dữ liệu xung quanh giá trị trung bình.
sd(d$price)
## [1] 43.88744
### tính tổng các giá trị trong cột'Giá'của tập dữ liệu "d". Nó cộng tất cả các giá trị riêng lẻ trong cột để cung cấp tổng số tiền.
sum(d$price)
## [1] 13771
### Được sử dụng để tính phân vị thứ 30 của cột "Giá" của tập dữ liệu. Sau đó ta có được kết quả sẽ lưu trữ giá trị tương ứng với phân vị thứ 30 của cột "giá" trong tập dữ liệu "d". Giá trị này cho biết điểm giới hạn mà dưới đó 30% giá trong tập dữ liệu giảm xuống
quantile(d$price, .3)
## 30%
## 105.1038
### Tạo bảng tần số cho 2 tổ 1985 và 1995 của biến 'Năm'
table(d$year)
##
## 1985 1995
## 48 48
### Tính phương sai của cột 'Giá' trong tập dữ liệu d cho từng năm
aggregate(d$price, list(d$year), FUN = 'var')
## Group.1 x
## 1 1985 79.11167
## 2 1995 578.38733
### Tính độ lệch chuẩn của cột 'Giá' trong tập dữ liệu d cho từng năm
aggregate(d$price, list(d$year), FUN = 'sd')
## Group.1 x
## 1 1985 8.894474
## 2 1995 24.049685
### Tính tổng của cột 'Giá' trong tập dữ d cho từng năm
aggregate(d$price, list(d$year), FUN = 'sum')
## Group.1 x
## 1 1985 4975.039
## 2 1995 8795.964
### Tính giá trung bình của cột 'Giá'trong tập dữ liệu d cho từng năm
aggregate(d$price, list(d$year), FUN = 'mean')
## Group.1 x
## 1 1985 103.6466
## 2 1995 183.2492
### Để tính toán thống kê tóm tắt của cột "giá" trong tập dữ liệu "d" được nhóm theo các giá trị duy nhất trong cột "năm ". Nó sẽ cung cấp các tóm tắt thống kê như tối thiểu, phần tư thứ nhất, trung bình, trung vị, phần tư thứ 3 và tối đa cho mỗi nhóm.
aggregate(d$price, list(d$year), FUN = 'summary')
## Group.1 x.Min. x.1st Qu. x.Median x.Mean x.3rd Qu. x.Max.
## 1 1985 84.96799 98.46302 102.63483 103.64664 108.66187 129.46109
## 2 1995 145.97968 166.61054 176.15470 183.24924 198.50900 240.84967
Mô tả: Dữ liệu CigarettesSW của gói AER là một dữ liệu bảng về mức tiêu thụ thuốc lá của 48 tiểu bang lục địa Hoa kỳ, trong đó gồm 9 biến.
state: Yếu tố chỉ trạng thái.
year: Yếu tố chỉ năm.
cpi: Chỉ số giá tiêu dùng.
population: dân số.
packs: Số gói bình quân đầu người.
income: Thu nhập cá nhân.
tax: Thuế tiêu thụ đặc biệt trung bình của tiểu bang, liên bang và địa phương cho năm tài chính.
price: Giá trong năm tài chính, bao gồm thuế bán hàng.
taxs: Thuế bán hàng.
library(AER)
data(CigarettesSW)
### Gán dữ liệu CigarettesSW vào d
d <- CigarettesSW
### Cấu trúc của dataset(CigarettesSW)
str(d)
## 'data.frame': 96 obs. of 9 variables:
## $ state : Factor w/ 48 levels "AL","AR","AZ",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ year : Factor w/ 2 levels "1985","1995": 1 1 1 1 1 1 1 1 1 1 ...
## $ cpi : num 1.08 1.08 1.08 1.08 1.08 ...
## $ population: num 3973000 2327000 3184000 26444000 3209000 ...
## $ packs : num 116 129 105 100 113 ...
## $ income : num 4.60e+07 2.62e+07 4.40e+07 4.47e+08 4.95e+07 ...
## $ tax : num 32.5 37 31 26 31 ...
## $ price : num 102.2 101.5 108.6 107.8 94.3 ...
## $ taxs : num 33.3 37 36.2 32.1 31 ...
### Đặt tên cho các biến trong dataset
names(d) <- c('S','YE','C','PO','PA','IN','T','PR','TA')
Tới đây đã xong một số việc.
### Hiển thị những dòng đầu của dữ liệu d
head(d)
## S YE C PO PA IN T PR TA
## 1 AL 1985 1.076 3973000 116.4863 46014968 32.5 102.18167 33.34834
## 2 AR 1985 1.076 2327000 128.5346 26210736 37.0 101.47500 37.00000
## 3 AZ 1985 1.076 3184000 104.5226 43956936 31.0 108.57875 36.17042
## 4 CA 1985 1.076 26444000 100.3630 447102816 26.0 107.83734 32.10400
## 5 CO 1985 1.076 3209000 112.9635 49466672 31.0 94.26666 31.00000
## 6 CT 1985 1.076 3201000 109.2784 60063368 42.0 128.02499 51.48333
### Gán biến 'Giá'(PR) trong data(d) vào vol
Vol <- d$PR
Vol
## [1] 102.18167 101.47500 108.57875 107.83734 94.26666 128.02499 102.49166
## [8] 115.29000 97.02517 101.84200 102.89933 104.44025 96.18000 98.92291
## [15] 87.00125 108.39400 112.20834 91.96667 107.04750 104.91417 113.64967
## [22] 99.33817 105.29333 99.29166 84.96799 106.80800 104.60667 95.50000
## [29] 110.41666 102.77800 114.18850 109.99783 100.42374 101.46808 97.03333
## [36] 109.07401 100.94167 90.64125 97.08334 101.94550 107.38000 110.19584
## [43] 91.61533 100.98334 129.46109 114.59000 108.91125 93.46667 158.37134
## [50] 175.54251 198.60750 210.50467 167.35001 218.28050 165.60001 187.71718
## [57] 156.57307 190.89000 179.63751 198.47617 154.53375 175.21001 145.97968
## [64] 167.79535 217.10501 186.03375 197.23065 240.84967 220.34866 157.23009
## [71] 169.22940 156.21667 149.99400 192.24867 182.17500 166.64166 203.08717
## [78] 176.14624 206.59917 221.85800 165.89125 170.13499 190.30000 176.16316
## [85] 224.45924 152.81874 168.03799 167.06700 198.20233 180.97626 166.66125
## [92] 175.63875 239.10934 201.38126 166.51718 158.54166
### Xem giá trị thứ 34 của biến 'Giá'
Vol[34]
## [1] 101.4681
### Lấy những giá trị từ 50 đến 90 của biến 'Giá',sử dụng câu lệnh trên R,sau đó được kết quả là:
Vol15 <- Vol[Vol > 50 & Vol < 90]
Vol15
## [1] 87.00125 84.96799
### Lấy những giá trị trong biến 'Giá' >50 hoặc biến 'Thuế tiêu thụ đặc biệt' <80, ta dùng câu lệnh trong R, sau đó ta có được kết quả là:
Voll <- d[d$PR > 50 |d$T < 80,]
Voll
## S YE C PO PA IN T PR TA
## 1 AL 1985 1.076 3973000 116.48628 46014968 32.50000 102.18167 33.34834
## 2 AR 1985 1.076 2327000 128.53459 26210736 37.00000 101.47500 37.00000
## 3 AZ 1985 1.076 3184000 104.52261 43956936 31.00000 108.57875 36.17042
## 4 CA 1985 1.076 26444000 100.36304 447102816 26.00000 107.83734 32.10400
## 5 CO 1985 1.076 3209000 112.96354 49466672 31.00000 94.26666 31.00000
## 6 CT 1985 1.076 3201000 109.27835 60063368 42.00000 128.02499 51.48333
## 7 DE 1985 1.076 618000 143.85114 9927301 30.00000 102.49166 30.00000
## 8 FL 1985 1.076 11352000 122.18112 166919248 37.00000 115.29000 42.49000
## 9 GA 1985 1.076 5963000 127.23462 78364336 28.00000 97.02517 28.84183
## 10 IA 1985 1.076 2830000 113.74558 37902896 34.00000 101.84200 37.91700
## 11 ID 1985 1.076 994000 103.01811 11577261 25.10000 102.89933 29.05767
## 12 IL 1985 1.076 11401000 123.20848 176786352 28.00001 104.44025 28.91526
## 13 IN 1985 1.076 5460000 137.63737 71751616 26.50000 96.18000 31.08000
## 14 KS 1985 1.076 2428000 116.68040 34784360 32.00000 98.92291 34.88125
## 15 KY 1985 1.076 3695000 186.03519 42703144 19.00000 87.00125 23.14292
## 16 LA 1985 1.076 4409000 127.55727 53431900 32.00000 108.39400 36.16900
## 17 MA 1985 1.076 5881000 115.67760 98328688 42.00000 112.20834 42.00000
## 18 MD 1985 1.076 4414000 120.97871 74851664 29.00000 91.96667 29.00000
## 19 ME 1985 1.076 1163000 128.11694 14575292 36.00000 107.04750 41.09750
## 20 MI 1985 1.076 9077000 128.00485 133728040 37.00000 104.91417 37.83083
## 21 MN 1985 1.076 4185000 112.90323 63152360 34.00000 113.64967 40.43300
## 22 MO 1985 1.076 5001000 130.37393 69341920 29.00000 99.33817 29.85484
## 23 MS 1985 1.076 2588000 117.04018 25678534 27.58333 105.29333 33.54333
## 24 MT 1985 1.076 822000 104.25790 9785230 32.00000 99.29166 32.00000
## 25 NC 1985 1.076 6255000 155.28377 79104656 18.00000 84.96799 21.26800
## 26 ND 1985 1.076 677000 105.46529 8672948 34.00000 106.80800 38.10800
## 27 NE 1985 1.076 1585000 107.38171 21778072 34.00000 104.60667 38.02333
## 28 NH 1985 1.076 997000 197.99399 15767469 33.00000 95.50000 33.00000
## 29 NJ 1985 1.076 7566000 116.52128 133549208 41.00000 110.41666 41.00000
## 30 NM 1985 1.076 1439000 88.74218 17258916 28.00000 102.77800 31.95300
## 31 NV 1985 1.076 951000 141.95584 14581495 31.00000 114.18850 37.46350
## 32 NY 1985 1.076 17794000 116.66292 297728512 37.00000 109.99783 37.88117
## 33 OH 1985 1.076 10736000 127.59874 153455776 30.00000 100.42374 34.78208
## 34 OK 1985 1.076 3272000 127.13937 43395580 34.00000 101.46808 34.82642
## 35 OR 1985 1.076 2673000 119.45380 36205164 35.00000 97.03333 35.00000
## 36 PA 1985 1.076 11772000 117.70303 170033840 34.00000 109.07401 40.17400
## 37 RI 1985 1.076 967000 132.78178 14229156 39.00000 100.94167 39.00000
## 38 SC 1985 1.076 3304000 127.20944 38536176 23.00000 90.64125 27.31625
## 39 SD 1985 1.076 698000 106.59026 8340000 31.00000 97.08334 31.00000
## 40 TN 1985 1.076 4716000 129.83459 57749668 29.00000 101.94550 34.77050
## 41 TX 1985 1.076 16275000 115.10293 231003152 35.25000 107.38000 39.38000
## 42 UT 1985 1.076 1643000 68.04626 19462380 28.00000 110.19584 34.23750
## 43 VA 1985 1.076 5716000 134.00980 87361632 18.50000 91.61533 22.02367
## 44 VT 1985 1.076 530000 145.28302 6887097 33.00000 100.98334 33.00000
## 45 WA 1985 1.076 4401000 96.22813 64846548 39.00000 129.46109 47.46942
## 46 WI 1985 1.076 4748000 107.87700 65732720 41.00000 114.59000 46.45667
## 47 WV 1985 1.076 1907000 112.84740 20852964 33.00000 108.91125 38.18625
## 48 WY 1985 1.076 500000 129.39999 7116756 24.00000 93.46667 24.00000
## 49 AL 1995 1.524 4262731 101.08543 83903280 40.50000 158.37134 41.90467
## 50 AR 1995 1.524 2480121 111.04297 45995496 55.50000 175.54251 63.85917
## 51 AZ 1995 1.524 4306908 71.95417 88870496 65.33333 198.60750 74.79082
## 52 CA 1995 1.524 31493524 56.85931 771470144 61.00000 210.50467 74.77133
## 53 CO 1995 1.524 3738061 82.58292 92946544 44.00000 167.35001 44.00000
## 54 CT 1995 1.524 3265293 79.47219 104315120 74.00000 218.28050 86.35550
## 55 DE 1995 1.524 718265 124.46660 18237436 48.00000 165.60001 48.00000
## 56 FL 1995 1.524 14185403 93.07455 333525344 57.90000 187.71718 68.52551
## 57 GA 1995 1.524 7188538 97.47462 159800448 36.00000 156.57307 37.43142
## 58 IA 1995 1.524 2840860 92.40160 60170928 60.00000 190.89000 69.09000
## 59 ID 1995 1.524 1165000 74.84978 22868920 52.00000 179.63751 60.55417
## 60 IL 1995 1.524 11884935 83.26508 304767456 68.00001 198.47617 79.23450
## 61 IN 1995 1.524 5791819 134.25835 126525008 39.50000 154.53375 46.85875
## 62 KS 1995 1.524 2586942 88.75344 56626672 48.00000 175.21001 56.34333
## 63 KY 1995 1.524 3855248 172.64778 74079712 27.00000 145.97968 35.26300
## 64 LA 1995 1.524 4327978 105.17613 84572688 44.00000 167.79535 50.45367
## 65 MA 1995 1.524 6062335 76.62064 170051568 75.00000 217.10501 85.33833
## 66 MD 1995 1.524 5023650 77.47355 135115456 60.00000 186.03375 68.85875
## 67 ME 1995 1.524 1237438 102.46978 25045934 61.00000 197.23065 72.16400
## 68 MI 1995 1.524 9659871 81.38825 231594240 99.00000 240.84967 112.63300
## 69 MN 1995 1.524 4605445 82.94530 113216856 72.00000 220.34866 86.41534
## 70 MO 1995 1.524 5324610 122.45028 117639672 41.00000 157.23009 42.38842
## 71 MS 1995 1.524 2690788 105.58245 46241956 42.00000 169.22940 53.07108
## 72 MT 1995 1.524 868522 87.15957 16296835 42.00000 156.21667 42.00000
## 73 NC 1995 1.524 7185403 121.53806 157633568 29.00000 149.99400 34.76900
## 74 ND 1995 1.524 641548 79.80697 12243384 68.00000 192.24867 78.88200
## 75 NE 1995 1.524 1635142 87.27071 36293064 58.00000 182.17500 66.67500
## 76 NH 1995 1.524 1145604 156.33675 28649564 49.00000 166.64166 49.00000
## 77 NJ 1995 1.524 7965523 80.37137 233208576 64.00000 203.08717 75.49550
## 78 NM 1995 1.524 1682417 64.66887 31716160 45.00000 176.14624 53.38792
## 79 NV 1995 1.524 1525777 93.52612 39377292 59.00000 206.59917 72.51583
## 80 NY 1995 1.524 18150928 70.81732 503163328 80.00000 221.85800 88.53300
## 81 OH 1995 1.524 11155493 111.38010 255312928 48.00000 165.89125 55.89958
## 82 OK 1995 1.524 3265547 108.68011 63333300 47.00000 170.13499 55.10167
## 83 OR 1995 1.524 3141421 92.15575 71209312 62.00000 190.30000 62.00000
## 84 PA 1995 1.524 12044780 95.64309 285923232 55.00000 176.16316 64.97150
## 85 RI 1995 1.524 989203 92.59980 23786644 80.00000 224.45924 94.68425
## 86 SC 1995 1.524 3699943 108.08275 72050072 31.00000 152.81874 38.27708
## 87 SD 1995 1.524 728251 97.21923 14454129 47.00000 168.03799 53.46300
## 88 TN 1995 1.524 5241168 122.32005 114259984 37.00000 167.06700 49.37533
## 89 TX 1995 1.524 18679706 73.07931 402096768 65.00000 198.20233 76.21900
## 90 UT 1995 1.524 1976774 49.27220 37278220 50.50000 180.97626 59.11792
## 91 VA 1995 1.524 6601392 105.38687 161441792 26.50001 166.66125 34.43626
## 92 VT 1995 1.524 582827 122.33475 12448607 44.00000 175.63875 52.36375
## 93 WA 1995 1.524 5431024 65.53092 129680832 80.50000 239.10934 96.14267
## 94 WI 1995 1.524 5137004 92.46635 115959680 62.00000 201.38126 71.58958
## 95 WV 1995 1.524 1820560 115.56883 32611268 41.00000 166.51718 50.42550
## 96 WY 1995 1.524 478447 112.23814 10293195 36.00000 158.54166 36.00000
### Chia dữ liệu 'Giá' thành 4 tổ, ta dùng câu lệnh trên R, sau đó biến 'Giá' sẽ được xếp 4 tổ các tổ được xếp từ giá trị bé đến giá trị lớn.
cut(Vol,4)
## [1] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (124,163]
## [7] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [13] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [19] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [25] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [31] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [37] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124] (84.8,124]
## [43] (84.8,124] (84.8,124] (124,163] (84.8,124] (84.8,124] (84.8,124]
## [49] (124,163] (163,202] (163,202] (202,241] (163,202] (202,241]
## [55] (163,202] (163,202] (124,163] (163,202] (163,202] (163,202]
## [61] (124,163] (163,202] (124,163] (163,202] (202,241] (163,202]
## [67] (163,202] (202,241] (202,241] (124,163] (163,202] (124,163]
## [73] (124,163] (163,202] (163,202] (163,202] (202,241] (163,202]
## [79] (202,241] (202,241] (163,202] (163,202] (163,202] (163,202]
## [85] (202,241] (124,163] (163,202] (163,202] (163,202] (163,202]
## [91] (163,202] (163,202] (202,241] (163,202] (163,202] (124,163]
## Levels: (84.8,124] (124,163] (163,202] (202,241]
### Tạo bảng tần số cho dữ lệu 'Giá' được chia thành 4 tổ ở trên, ta dùng câu lệnh trên R, sau đó ta được kết quả là những lần xuất hiện của từng tổ được chia ở trên.
table(cut(Vol,4))
##
## (84.8,124] (124,163] (163,202] (202,241]
## 46 11 29 10
### Bảng giá theo chỉ số tiêu dùng
table(cut(Vol,4),d$C)
##
## 1.07599997520447 1.5239999294281
## (84.8,124] 46 0
## (124,163] 2 9
## (163,202] 0 29
## (202,241] 0 10
### Chia dữ liệu 'Thu nhập cá nhân' thành 8 tổ, ta dùng câu lệnh trên R
cut(d$IN,8)
## [1] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [4] (3.89e+08,4.85e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [7] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08]
## [10] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08]
## [13] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [16] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [19] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08]
## [22] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [25] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [28] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08]
## [31] (6.12e+06,1.02e+08] (2.94e+08,3.89e+08] (1.02e+08,1.98e+08]
## [34] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08]
## [37] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [40] (6.12e+06,1.02e+08] (1.98e+08,2.94e+08] (6.12e+06,1.02e+08]
## [43] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [46] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [49] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [52] (6.76e+08,7.72e+08] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08]
## [55] (6.12e+06,1.02e+08] (2.94e+08,3.89e+08] (1.02e+08,1.98e+08]
## [58] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (2.94e+08,3.89e+08]
## [61] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [64] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] (1.02e+08,1.98e+08]
## [67] (6.12e+06,1.02e+08] (1.98e+08,2.94e+08] (1.02e+08,1.98e+08]
## [70] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [73] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [76] (6.12e+06,1.02e+08] (1.98e+08,2.94e+08] (6.12e+06,1.02e+08]
## [79] (6.12e+06,1.02e+08] (4.85e+08,5.8e+08] (1.98e+08,2.94e+08]
## [82] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (1.98e+08,2.94e+08]
## [85] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## [88] (1.02e+08,1.98e+08] (3.89e+08,4.85e+08] (6.12e+06,1.02e+08]
## [91] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08] (1.02e+08,1.98e+08]
## [94] (1.02e+08,1.98e+08] (6.12e+06,1.02e+08] (6.12e+06,1.02e+08]
## 8 Levels: (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] ... (6.76e+08,7.72e+08]
### Tạo bảng tần số cho dữ lệu 'Thu nhập cá nhân' được chia thành 8 tổ ở trên, ta dùng câu lệnh trên R, sau đó ta được kết quả là những lần xuất hiện của từng tổ được chia ở trên.
table(cut(d$IN,8))
##
## (6.12e+06,1.02e+08] (1.02e+08,1.98e+08] (1.98e+08,2.94e+08] (2.94e+08,3.89e+08]
## 66 18 5 3
## (3.89e+08,4.85e+08] (4.85e+08,5.8e+08] (5.8e+08,6.76e+08] (6.76e+08,7.72e+08]
## 2 1 0 1
### Bảng 'thu nhập cá nhân' theo chỉ số tiêu dùng
table(cut(d$IN,8),d$C)
##
## 1.07599997520447 1.5239999294281
## (6.12e+06,1.02e+08] 39 27
## (1.02e+08,1.98e+08] 6 12
## (1.98e+08,2.94e+08] 1 4
## (2.94e+08,3.89e+08] 1 2
## (3.89e+08,4.85e+08] 1 1
## (4.85e+08,5.8e+08] 0 1
## (5.8e+08,6.76e+08] 0 0
## (6.76e+08,7.72e+08] 0 1