Tập dữ liệu Natural Gas được lấy từ 6 tiểu bang của Hoa Kỳ trong giai đoạn 1967–1989.
Dữ liệu có 10 biến:
state: tên viết tắt của tiểu bang
statecode: mã số của tiểu bang NY:35, FL:10, MI:23, TX:44, UT:45, CA:5
year: năm thu thập dữ liệu
consumption:lượng tiêu thụ khí đốt
price: giá khí đốt
eprice: giá điện
oprice: giá của dầu nhiên liệu chưng cất
lprice: giá của khí dầu mỏ hóa lỏng
heating: nhiệt độ
income: thhu nhập bình quân đầu người
#Lấy dữ liệu từ package
library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data("NaturalGas")
#Gán dữ liệu vào n
n <- NaturalGas
#Xem cấu trúc dữ liệu
str(NaturalGas)
## 'data.frame': 138 obs. of 10 variables:
## $ state : Factor w/ 6 levels "CA","FL","MI",..: 4 4 4 4 4 4 4 4 4 4 ...
## $ statecode : Factor w/ 6 levels "5","10","23",..: 4 4 4 4 4 4 4 4 4 4 ...
## $ year : Factor w/ 23 levels "1967","1968",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ consumption: int 313656 319282 331326 346533 352085 363412 342608 341032 327384 339949 ...
## $ price : num 1.42 1.38 1.37 1.4 1.5 1.62 1.74 2 2.54 2.87 ...
## $ eprice : num 2.98 2.91 2.84 2.87 3.07 3.26 3.51 4.66 5.13 5.37 ...
## $ oprice : num 7.4 7.77 7.96 8.33 8.8 ...
## $ lprice : num 1.47 1.42 1.38 1.37 1.4 1.5 1.62 1.74 2 2.54 ...
## $ heating : int 6262 6125 6040 6085 5907 6248 5450 5858 5583 6238 ...
## $ income : num 10904 11370 11579 11587 11657 ...
#Xem các quan sát đầu của dữ liệu
head(n)
## state statecode year consumption price eprice oprice lprice heating income
## 1 NY 35 1967 313656 1.42 2.98 7.40 1.47 6262 10903.75
## 2 NY 35 1968 319282 1.38 2.91 7.77 1.42 6125 11370.02
## 3 NY 35 1969 331326 1.37 2.84 7.96 1.38 6040 11578.68
## 4 NY 35 1970 346533 1.40 2.87 8.33 1.37 6085 11586.77
## 5 NY 35 1971 352085 1.50 3.07 8.80 1.40 5907 11657.42
## 6 NY 35 1972 363412 1.62 3.26 8.85 1.50 6248 11860.80
#Đặt tên biến
names(n) <- c('s','sc','y','c','p','ep','op','lp','h','i')
#Gán biến c vào consump
consump <- n$c
consump
## [1] 313656 319282 331326 346533 352085 363412 342608 341032 327384 339949
## [11] 325603 330968 313027 333902 336813 343029 321949 337253 320073 336712
## [21] 334417 357260 364713 9430 11318 11636 14702 13242 12837 16295
## [31] 14793 15209 16839 18220 21619 17518 15134 16357 13622 15372
## [41] 14866 13533 13860 14566 14891 13089 302472 315694 333264 340033
## [51] 343773 355266 341607 346116 334866 339417 299199 328260 369378 387279
## [61] 361752 358778 340732 338996 341026 330240 314293 348512 361667 201407
## [71] 211763 220728 232189 237387 240662 241478 222603 232320 235637 269964
## [81] 274849 315857 224800 209045 221383 214479 230311 212676 194602 210738
## [91] 209957 230099 38935 40779 43948 44637 49849 48855 48647 50347
## [101] 59736 66417 35558 47783 60462 57639 54789 45957 54938 54639
## [111] 58727 57654 41536 42241 45168 522122 517636 562127 552544 630998
## [121] 637289 615719 580009 631398 599631 541728 537412 590732 529342 488353
## [131] 537194 498601 472151 527495 464307 503473 497138 514276
#Lượng tiêu thụ từ 10000 đến 30000
consump13 <- consump[consump>10000 & consump<30000]
#Gán biến p vào gia
gia <- n$p
#Lượng tiêu thụ trên 30000 và giá khí gas trên 5
consumpgia <- n[n$c>30000 & n$p>5,]
consumpgia
## s sc y c p ep op lp h i
## 15 NY 35 1981 336813 5.50 9.34 51.73 4.95 6046 12664.78
## 16 NY 35 1982 343029 6.51 9.84 50.62 5.50 6004 12701.17
## 17 NY 35 1983 321949 7.87 10.38 48.99 6.51 5763 13008.04
## 18 NY 35 1984 337253 7.64 10.67 50.44 7.87 5839 13739.73
## 19 NY 35 1985 320073 7.74 10.86 48.64 7.64 5810 14134.09
## 20 NY 35 1986 336712 7.46 10.55 39.78 7.74 5752 14534.71
## 21 NY 35 1987 334417 6.88 10.52 37.22 7.46 5765 15047.09
## 22 NY 35 1988 357260 6.50 10.48 37.69 6.88 6134 15946.92
## 23 NY 35 1989 364713 7.22 10.78 41.82 6.50 6258 16425.33
## 63 MI 23 1983 340732 5.84 6.67 46.48 4.79 6802 11364.90
## 64 MI 23 1984 338996 5.97 6.96 45.84 5.84 6834 12042.05
## 65 MI 23 1985 341026 6.29 7.38 44.62 5.97 6855 12545.18
## 66 MI 23 1986 330240 5.74 7.56 35.36 6.29 6643 12927.16
## 67 MI 23 1987 314293 5.46 7.31 33.84 5.74 6188 13001.78
## 68 MI 23 1988 348512 5.34 7.29 33.84 5.46 6912 13293.04
## 69 MI 23 1989 361667 5.19 7.53 37.28 5.34 7240 13596.79
## 85 TX 44 1982 221383 5.21 6.80 43.86 4.20 2005 11685.30
## 86 TX 44 1983 214479 5.55 7.26 40.02 5.21 2393 11439.51
## 87 TX 44 1984 230311 5.82 7.40 42.41 5.55 1931 11812.37
## 88 TX 44 1985 212676 5.77 7.50 40.72 5.82 2220 12075.33
## 89 TX 44 1986 194602 5.31 6.90 26.62 5.77 1829 11718.34
## 90 TX 44 1987 210738 5.21 6.72 27.32 5.31 2089 11541.24
## 91 TX 44 1988 209957 5.37 6.88 25.69 5.21 2079 11964.96
## 92 TX 44 1989 230099 5.55 6.98 31.57 5.37 2199 12238.59
## 110 UT 45 1984 54639 5.68 7.43 36.41 4.26 7389 9353.67
## 114 UT 45 1988 42241 5.11 7.81 22.48 4.97 6408 9915.62
## 115 UT 45 1989 45168 5.14 7.39 31.63 5.11 6495 10194.32
## 132 CA 5 1983 498601 5.41 6.76 46.08 4.43 2487 13339.57
## 133 CA 5 1984 472151 5.84 7.10 44.68 5.41 2486 13953.85
## 134 CA 5 1985 527495 5.72 7.78 30.58 5.84 2694 14368.46
## 135 CA 5 1986 464307 5.14 7.95 44.15 5.72 2192 14580.77
## 136 CA 5 1987 503473 5.26 8.03 35.24 5.14 2502 14915.05
## 137 CA 5 1988 497138 5.64 8.69 34.02 5.26 2366 15340.38
## 138 CA 5 1989 514276 5.59 9.45 44.44 5.64 2420 15532.93
#Tạo bảng, chia dữ liệu comsump thành 5 tổ
table(cut(consump,5))
##
## (8.8e+03,1.35e+05] (1.35e+05,2.61e+05] (2.61e+05,3.86e+05] (3.86e+05,5.12e+05]
## 46 20 48 7
## (5.12e+05,6.38e+05]
## 17
#Lập bảng tần số của consump(lượng tiêu thụ) theo sc(mã số bang)
table(cut(consump,5),n$sc)
##
## 5 10 23 35 44 45
## (8.8e+03,1.35e+05] 0 23 0 0 0 23
## (1.35e+05,2.61e+05] 0 0 0 0 20 0
## (2.61e+05,3.86e+05] 0 0 22 23 3 0
## (3.86e+05,5.12e+05] 6 0 1 0 0 0
## (5.12e+05,6.38e+05] 17 0 0 0 0 0