Tập dữ liệu Natural Gas được lấy từ 6 tiểu bang của Hoa Kỳ trong giai đoạn 1967–1989.

Dữ liệu có 10 biến:

state: tên viết tắt của tiểu bang

statecode: mã số của tiểu bang NY:35, FL:10, MI:23, TX:44, UT:45, CA:5

year: năm thu thập dữ liệu

consumption:lượng tiêu thụ khí đốt

price: giá khí đốt

eprice: giá điện

oprice: giá của dầu nhiên liệu chưng cất

lprice: giá của khí dầu mỏ hóa lỏng

heating: nhiệt độ

income: thhu nhập bình quân đầu người

#Lấy dữ liệu từ package
library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data("NaturalGas")
#Gán dữ liệu vào n
n <- NaturalGas
#Xem cấu trúc dữ liệu
str(NaturalGas)
## 'data.frame':    138 obs. of  10 variables:
##  $ state      : Factor w/ 6 levels "CA","FL","MI",..: 4 4 4 4 4 4 4 4 4 4 ...
##  $ statecode  : Factor w/ 6 levels "5","10","23",..: 4 4 4 4 4 4 4 4 4 4 ...
##  $ year       : Factor w/ 23 levels "1967","1968",..: 1 2 3 4 5 6 7 8 9 10 ...
##  $ consumption: int  313656 319282 331326 346533 352085 363412 342608 341032 327384 339949 ...
##  $ price      : num  1.42 1.38 1.37 1.4 1.5 1.62 1.74 2 2.54 2.87 ...
##  $ eprice     : num  2.98 2.91 2.84 2.87 3.07 3.26 3.51 4.66 5.13 5.37 ...
##  $ oprice     : num  7.4 7.77 7.96 8.33 8.8 ...
##  $ lprice     : num  1.47 1.42 1.38 1.37 1.4 1.5 1.62 1.74 2 2.54 ...
##  $ heating    : int  6262 6125 6040 6085 5907 6248 5450 5858 5583 6238 ...
##  $ income     : num  10904 11370 11579 11587 11657 ...
#Xem các quan sát đầu của dữ liệu 
head(n)
##   state statecode year consumption price eprice oprice lprice heating   income
## 1    NY        35 1967      313656  1.42   2.98   7.40   1.47    6262 10903.75
## 2    NY        35 1968      319282  1.38   2.91   7.77   1.42    6125 11370.02
## 3    NY        35 1969      331326  1.37   2.84   7.96   1.38    6040 11578.68
## 4    NY        35 1970      346533  1.40   2.87   8.33   1.37    6085 11586.77
## 5    NY        35 1971      352085  1.50   3.07   8.80   1.40    5907 11657.42
## 6    NY        35 1972      363412  1.62   3.26   8.85   1.50    6248 11860.80
#Đặt tên biến
names(n) <- c('s','sc','y','c','p','ep','op','lp','h','i')
#Gán biến c vào consump
consump <- n$c
consump
##   [1] 313656 319282 331326 346533 352085 363412 342608 341032 327384 339949
##  [11] 325603 330968 313027 333902 336813 343029 321949 337253 320073 336712
##  [21] 334417 357260 364713   9430  11318  11636  14702  13242  12837  16295
##  [31]  14793  15209  16839  18220  21619  17518  15134  16357  13622  15372
##  [41]  14866  13533  13860  14566  14891  13089 302472 315694 333264 340033
##  [51] 343773 355266 341607 346116 334866 339417 299199 328260 369378 387279
##  [61] 361752 358778 340732 338996 341026 330240 314293 348512 361667 201407
##  [71] 211763 220728 232189 237387 240662 241478 222603 232320 235637 269964
##  [81] 274849 315857 224800 209045 221383 214479 230311 212676 194602 210738
##  [91] 209957 230099  38935  40779  43948  44637  49849  48855  48647  50347
## [101]  59736  66417  35558  47783  60462  57639  54789  45957  54938  54639
## [111]  58727  57654  41536  42241  45168 522122 517636 562127 552544 630998
## [121] 637289 615719 580009 631398 599631 541728 537412 590732 529342 488353
## [131] 537194 498601 472151 527495 464307 503473 497138 514276
#Lượng tiêu thụ từ 10000 đến 30000
consump13 <- consump[consump>10000 & consump<30000]
#Gán biến p vào gia
gia <- n$p
#Lượng tiêu thụ trên 30000 và giá khí gas trên 5
consumpgia <- n[n$c>30000 & n$p>5,]
consumpgia
##      s sc    y      c    p    ep    op   lp    h        i
## 15  NY 35 1981 336813 5.50  9.34 51.73 4.95 6046 12664.78
## 16  NY 35 1982 343029 6.51  9.84 50.62 5.50 6004 12701.17
## 17  NY 35 1983 321949 7.87 10.38 48.99 6.51 5763 13008.04
## 18  NY 35 1984 337253 7.64 10.67 50.44 7.87 5839 13739.73
## 19  NY 35 1985 320073 7.74 10.86 48.64 7.64 5810 14134.09
## 20  NY 35 1986 336712 7.46 10.55 39.78 7.74 5752 14534.71
## 21  NY 35 1987 334417 6.88 10.52 37.22 7.46 5765 15047.09
## 22  NY 35 1988 357260 6.50 10.48 37.69 6.88 6134 15946.92
## 23  NY 35 1989 364713 7.22 10.78 41.82 6.50 6258 16425.33
## 63  MI 23 1983 340732 5.84  6.67 46.48 4.79 6802 11364.90
## 64  MI 23 1984 338996 5.97  6.96 45.84 5.84 6834 12042.05
## 65  MI 23 1985 341026 6.29  7.38 44.62 5.97 6855 12545.18
## 66  MI 23 1986 330240 5.74  7.56 35.36 6.29 6643 12927.16
## 67  MI 23 1987 314293 5.46  7.31 33.84 5.74 6188 13001.78
## 68  MI 23 1988 348512 5.34  7.29 33.84 5.46 6912 13293.04
## 69  MI 23 1989 361667 5.19  7.53 37.28 5.34 7240 13596.79
## 85  TX 44 1982 221383 5.21  6.80 43.86 4.20 2005 11685.30
## 86  TX 44 1983 214479 5.55  7.26 40.02 5.21 2393 11439.51
## 87  TX 44 1984 230311 5.82  7.40 42.41 5.55 1931 11812.37
## 88  TX 44 1985 212676 5.77  7.50 40.72 5.82 2220 12075.33
## 89  TX 44 1986 194602 5.31  6.90 26.62 5.77 1829 11718.34
## 90  TX 44 1987 210738 5.21  6.72 27.32 5.31 2089 11541.24
## 91  TX 44 1988 209957 5.37  6.88 25.69 5.21 2079 11964.96
## 92  TX 44 1989 230099 5.55  6.98 31.57 5.37 2199 12238.59
## 110 UT 45 1984  54639 5.68  7.43 36.41 4.26 7389  9353.67
## 114 UT 45 1988  42241 5.11  7.81 22.48 4.97 6408  9915.62
## 115 UT 45 1989  45168 5.14  7.39 31.63 5.11 6495 10194.32
## 132 CA  5 1983 498601 5.41  6.76 46.08 4.43 2487 13339.57
## 133 CA  5 1984 472151 5.84  7.10 44.68 5.41 2486 13953.85
## 134 CA  5 1985 527495 5.72  7.78 30.58 5.84 2694 14368.46
## 135 CA  5 1986 464307 5.14  7.95 44.15 5.72 2192 14580.77
## 136 CA  5 1987 503473 5.26  8.03 35.24 5.14 2502 14915.05
## 137 CA  5 1988 497138 5.64  8.69 34.02 5.26 2366 15340.38
## 138 CA  5 1989 514276 5.59  9.45 44.44 5.64 2420 15532.93
#Tạo bảng, chia dữ liệu comsump thành 5 tổ
table(cut(consump,5))
## 
##  (8.8e+03,1.35e+05] (1.35e+05,2.61e+05] (2.61e+05,3.86e+05] (3.86e+05,5.12e+05] 
##                  46                  20                  48                   7 
## (5.12e+05,6.38e+05] 
##                  17
#Lập bảng tần số của consump(lượng tiêu thụ) theo sc(mã số bang)
table(cut(consump,5),n$sc)
##                      
##                        5 10 23 35 44 45
##   (8.8e+03,1.35e+05]   0 23  0  0  0 23
##   (1.35e+05,2.61e+05]  0  0  0  0 20  0
##   (2.61e+05,3.86e+05]  0  0 22 23  3  0
##   (3.86e+05,5.12e+05]  6  0  1  0  0  0
##   (5.12e+05,6.38e+05] 17  0  0  0  0  0