1 Bài tập tuần 7

1.1 Tìm 10 indicator

1.1.1 Cancer

library(WDI)
## Warning: package 'WDI' was built under R version 4.2.3
library(DT)
## Warning: package 'DT' was built under R version 4.2.3
wdi1 <- WDIsearch('cancer')
SH <- WDI( indicator = 'SH.DYN.NCOM.ZS')
SH1 <- na.omit(SH)
datatable(SH1) 
  • Đây là một chỉ số về tỷ lệ tử vong do bệnh tim mạch, ung thư, tiểu đường hoặc bệnh phổi mãn tính giữa độ tuổi 30 và 70 (%). Chỉ số này cho biết phần trăm người 30 tuổi sẽ chết trước khi đến tuổi 70 do bất kỳ bệnh tim mạch, ung thư, tiểu đường hoặc bệnh phổi mãn tính nào.

1.1.2 Interest

wdi2 <- WDIsearch('interest')
DI <- WDI( indicator = 'DT.INR.DECT.04.YR.SA.US')
DI1 <- na.omit(DI)
datatable(DI1)
  • Đây là một chỉ số về lãi nợ nước ngoài, công và tư, hiện hành, 4 năm hoặc ít hơn, lãi suất trung bình, USD. Chỉ số này cho biết lãi suất trung bình của các khoản nợ nước ngoài có thời hạn đáo hạn 4 năm hoặc ít hơn, bao gồm cả lãi suất của các khoản vay của chính phủ và lãi suất của các khoản vay của các đơn vị tư nhân.

1.1.3 Tax

wdi3 <- WDIsearch('tax')
GB <- WDI( indicator = 'GB.TAX.CMAR.ZS')
GB1 <- na.omit(GB)
datatable(GB1)
  • Đây là một chỉ số về mức thuế biên cao nhất, thuế doanh nghiệp (%). Chỉ số này cho biết mức thuế cao nhất được áp dụng cho thu nhập chịu thuế của các doanh nghiệp, theo lịch biểu của các mức thuế.

1.1.4 Income

wdi4 <- WDIsearch('income')
IN <- WDI( indicator = '3.0.IncShr.q1')
IN1 <- na.omit(IN)
datatable(IN1)
  • Đây là một chỉ số về tỷ lệ thu nhập của phân vị thứ nhất. Chỉ số này cho biết phần trăm thu nhập gia đình được nắm giữ bởi phân vị thấp nhất (0-20 phần trăm)

1.1.5 GDP

wdi5 <- WDIsearch('GDP')
GDP <- WDI( indicator = 'BN.GSR.FCTY.CD.ZS')
GDP1 <- na.omit(GDP)
datatable(GDP1)
  • Đây là một chỉ số về thu nhập thuần từ nước ngoài, hiện hành (% GDP). Chỉ số này cho biết tổng thu nhập thuần từ nước ngoài, bao gồm lãi, lương, tiền trợ cấp và các khoản chuyển nhượng khác, theo tỷ lệ phần trăm của GDP.

1.1.6 Child

wdi6 <- WDIsearch('child')
CC <- WDI( indicator = 'CC.CUF.STUN')
CC1 <- na.omit(CC)
datatable(CC1)
  • Đây là một chỉ số về tỷ lệ học sinh tiểu học bị suy dinh dưỡng (%). Chỉ số này cho biết phần trăm học sinh tiểu học có chiều cao thấp hơn so với trung bình của độ tuổi của họ, theo định nghĩa của Tổ chức Y tế Thế giới.

1.1.7 Unemployment

wdi7 <- WDIsearch('unemployment')
JI <- WDI( indicator = 'JI.UEM.1524.ZS')
JI1 <- na.omit(JI)
datatable(JI1)
  • Đây là một chỉ số về thất nghiệp, tổng số, giới tính 15-24 (% của lực lượng lao động giới tính 15-24) (ước tính ILO). Chỉ số này cho biết phần trăm lượng lao động ở cả hai giới tính, độ tuổi 15-24 không có việc làm nhưng có thể và đang tìm kiếm việc làm.

1.1.8 Invest

wdi8 <- WDIsearch('invest')
IV <- WDI( indicator = 'GFDD.AI.34')
IV1 <- na.omit(IV)
datatable(IV1)
  • Đây là một chỉ số về tỷ lệ đầu tư được tài trợ bởi ngân hàng (%). Chỉ số này cho biết tỷ lệ phần trăm các khoản mua sắm tài sản cố định được tài trợ từ các khoản vay ngân hàng, theo ước tính từ Khảo sát Doanh nghiệp của Ngân hàng Thế giới.

1.1.9 Temperature

wdi9 <- WDIsearch('temperature')
TE <- WDI( indicator = 'EN.CLC.MDAT.ZS')
TE1 <- na.omit(TE)
datatable(TE1)
  • Đây là một chỉ số về tỷ lệ hạn hán, lũ lụt, nhiệt độ cực đoan (% dân số, trung bình 1990-2009). Chỉ số này cho biết tỷ lệ phần trăm dân số bị ảnh hưởng bởi các thiên tai được phân loại là hạn hán, lũ lụt, hoặc nhiệt độ cực đoan hàng năm. Một hạn hán là một khoảng thời gian dài có thiếu hụt nước ở một khu vực do lượng mưa thấp hơn bình thường. Dân số bị ảnh hưởng là số người bị thương, mất nhà cửa hoặc cần sự giúp đỡ ngay lập tức trong một thời gian khẩn cấp do thiên tai; nó cũng có thể bao gồm những người bị di dời hoặc sơ tán.

1.1.10 Cost

wdi10 <- WDIsearch('cost')
GF <- WDI( indicator = 'GFDD.EI.07')
GF1 <- na.omit(GF)
datatable(GF1)
  • Đây là một chỉ số về tỷ lệ chi phí thu nhập của ngân hàng (%). Chỉ số này cho biết tỷ lệ phần trăm chi phí hoạt động của một ngân hàng so với tổng thu nhập lãi ròng và thu nhập hoạt động khác. Dữ liệu thô được lấy từ Bankscope và Orbis. Công thức được áp dụng cho Bankscope là data2090 / (data2080 + data2085) và một phương pháp tương đương được áp dụng cho Orbis. Tất cả tử số và mẫu số đều được tổng hợp trên cấp quốc gia trước khi chia. Chỉ số này được tính từ dữ liệu gốc của từng ngân hàng không hợp nhất từ Bankscope và Orbis.

1.2 Scrape dữ liệu

library(rvest)
## Warning: package 'rvest' was built under R version 4.2.3
library(stringr)
## Warning: package 'stringr' was built under R version 4.2.3
library(DT)
url <- "https://vn.investing.com/equities/south-korea"
html <- read_html(url)
h <- html |> html_element('table') |> html_table()
datatable(h)
  • Bảng dữ liệu trên là dữ liệu về thị trường chứng khoán của Hàn Quốc, bao gồm các cổ phiếu hàng đầu cũng như những loại cổ phiếu vốn hóa lớn và nhỏ.

1.3 Viết 1 function

library(AER)
## Warning: package 'AER' was built under R version 4.2.3
## Loading required package: car
## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
## Loading required package: lmtest
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Warning: package 'sandwich' was built under R version 4.2.3
## Loading required package: survival
data('RecreationDemand')

pie_chart <- function(data, x, y) {
  agg_data <- aggregate(data[[y]], by = list(data[[x]]), FUN = sum)
  colnames(agg_data) <- c("income", "trips")
  agg_data$percent <- round(agg_data$trips / sum(agg_data$trips) * 100, 2)
  pie(agg_data$percent, labels = paste(agg_data$income, agg_data$percent, "%"), main = paste("Pie chart for", y, "by", x))
}

pie_chart(RecreationDemand, "income", "trips")

2 Giới thiệu về dataset RecreationDemand

RecreationDemand (Nhu cầu giải trí): Dữ liệu chéo về số lượng các chuyến chèo thuyền giải trí đến hồ Somerville, Texas, vào năm 1980, dựa trên một cuộc khảo sát được thực hiện với 2.000 chủ sở hữu thuyền giải trí đã đăng ký ở 23 quận ở phía đông Texas:

  • trips (T) Số chuyến chèo thuyền giải trí đến hồ Somerville

  • quality (Q) Xếp hạng chất lượng chủ quan về cơ sở trên thang điểm từ 1 đến 5

  • ski (S) Người thực hiện khảo sát có tham gia trượt nước ở hồ không?

  • income (I) Thu nhập hộ gia đình hàng năm của người thực hiện khảo sát (tính bằng 1.000 USD)

  • userfee (U) Người thực hiện khảo sát có trả phí sử dụng hàng năm tại hồ Somerville không?

  • costC (CC) Chi phí tham quan hồ Conroe (USD)

  • costS (CS) Chi phí tham quan hồ Somerville (USD)

  • costH (CH) Chi phí tham quan hồ Houston (USD)

3 Bài tập tuần 5

3.0.1 So sánh mức trả phí trung bình ở cả ba hồ

mean(d$costS)
## [1] 59.92805
mean(d$costC)
## [1] 55.4237
mean(d$costH)
## [1] 55.9903
  • Hồ Somerville: 59.92 (USD)

  • Hồ Conroe: 55.42 (USD)

  • Hồ Houston: 55.99 (USD)

-> Qua đây ta thấy được mức trả phí trung bình ở hồ Somerville là cao nhất 59.92 (USD) và thấp nhất là hồ Conroe 55.42 (USD)

3.0.2 Tìm số người có chi phí tham quan ở ba hồ trên mức trung bình

S1 <- d$costS[d$costS > 55.42]
length(S1)
## [1] 260
C1 <- d$costC[d$costC > 59.92]
length(C1)
## [1] 204
H1 <- d$costH[d$costH > 55.99]
length(H1)
## [1] 228
  • Có 260/659 người có mức trả phí cho hồ Somerville trên 55.42 (USD)

  • Có 204/659 ngườicó mức trả phí cho hồ Conroe trên 59.92 (USD)

  • Có 228/659 người có mức trả phí cho hồ Houston trên 55.99 (USD)

-> Khảo sát này có tác dụng nếu trong tương lai quản lý của các hồ tham quan này có áp dụng chương trình ưu đãi dành cho khách hàng có mức trả phí trên mức trung bình thì có thể dựa vào số liệu này để dự tính số lượng khách hàng có thể sẽ đáp ứng.

3.0.3 Lập bảng tần số cho biến “ski” và “userfee” và phân tích:

table(d$ski, d$userfee)
##      
##        no yes
##   no  410   7
##   yes 236   6
  • Trong 417 người không tham gia trượt nước ở hồ Somerville thì có 410 người không trả phí hàng năm tại hồ và 7 người có trả phí.
  • Trong 242 người có tham gia trượt nước ở hồ SOmerville thì có 236 người không trả phí hàng năm tại hồ và 6 người có trả phí.

3.0.4 Phân bố số lần du lịch thuyền theo thu nhập

ggplot(RecreationDemand, aes(x = income, y = trips)) +
  geom_point() +
  geom_smooth(method = "loess") +
  labs(x = "Thu nhập hàng năm (nghìn USD)", y = "Số lần du lịch thuyền")
## `geom_smooth()` using formula = 'y ~ x'

- Từ biểu đồ, ta có thể thấy rằng số lần du lịch thuyền có xu hướng tăng khi thu nhập tăng, nhưng không đều và có nhiều ngoại lệ. Đường cong loess cho thấy mối quan hệ giữa hai biến không phải là tuyến tính.

3.0.5 Hệ số tương quan giữa chi phí du lịch và số lần du lịch thuyền ở các hồ khác nhau

cor(RecreationDemand[, c("trips", "costC", "costS", "costH")])
##             trips       costC      costS       costH
## trips  1.00000000 -0.04221274 -0.1237036 -0.02051193
## costC -0.04221274  1.00000000  0.9766786  0.98649929
## costS -0.12370362  0.97667860  1.0000000  0.96462307
## costH -0.02051193  0.98649929  0.9646231  1.00000000
  • Từ bảng, ta có thể thấy rằng hệ số tương quan giữa chi phí du lịch và số lần du lịch thuyền ở các hồ khác nhau đều là âm, nhưng rất nhỏ (khoảng -0.1). Điều này cho thấy mối quan hệ giữa hai biến là yếu và không rõ ràng. Có thể do chi phí du lịch không phải là yếu tố quyết định cho số lần du lịch thuyền, mà còn phụ thuộc vào nhiều yếu tố khác như thu nhập, chất lượng cơ sở, hoặc sở thích cá nhân.

4 Bài tập tuần 4

4.1 Dataset RecreationDemand

data(RecreationDemand)
d <- RecreationDemand
datatable(d)

4.2 Đồ thị dạng Scatter

4.2.1 Biểu đồ phân tán số chuyến chèo thuyền theo thu nhập

ggplot(RecreationDemand, aes(x = income, y = trips)) +
  geom_point(aes(color = userfee), size = 3) +
  geom_smooth(method = lm, se = T, color = 'green') +
  labs(title = "Biểu đồ phân tán số chuyến chèo thuyền theo thu nhập",
       x = "Thu nhập hộ gia đình (1.000 USD)",
       y = "Số chuyến chèo thuyền")
## `geom_smooth()` using formula = 'y ~ x'

  • Số chuyến chèo thuyền (trips) có mối tương quan dương với thu nhập hộ gia đình (income), điều này có nghĩa là khi thu nhập của hộ gia đình cao hơn thì Số chuyến chèo thuyền sẽ tăng và ngược lại.

  • Có sự khác biệt về thu nhập giữa những người trả phí sử dụng hàng năm (userfee) và những người không trả phí. Những người trả phí sử dụng hàng năm có xu hướng có thu nhập cao hơn những người không trả phí.

4.2.2 Biểu đồ phân tán số chuyến chèo thuyền theo chất lượng

ggplot(RecreationDemand, aes(x = quality, y = trips)) +
  geom_point(aes(color = userfee), size = 3) +
  geom_smooth(method = lm, se = FALSE) +
  labs(title = "Biểu đồ phân tán số chuyến chèo thuyền theo chất lượng",
       x = "Xếp hạng chất lượng về cơ sở",
       y = "Số chuyến chèo thuyền")
## `geom_smooth()` using formula = 'y ~ x'

  • Qua biểu đồ ta thấy có sự khác biệt về đánh giá chất lượng cơ sở vật chất giữa những người trả phí sử dụng hàng năm và những người không trả phí, những người trả phí sử dụng hàng năm có xu hướng đánh giá chất lượng cơ sở vật chất cao hơn những người không trả phí.

4.3 Đồ thị cột

d3 <- d %>% mutate(level = case_when(quality == "0" ~ "Không tham gia",
                                     quality == "1" ~ "Đ/giá thấp",
                                     quality == "2" ~ "Đ/giá thấp",
                                     quality == "3" ~ "Đ/giá trung bình",
                                     quality == "4" ~ "Đ/giá trung bình",
                                     quality == "5" ~ "Đ/giá cao"))
d3 |> ggplot(aes(x = level, y = after_stat(count))) +
  geom_bar(fill = 'blue') +
  geom_text(aes(label = scales::percent(after_stat(count/sum(count)))), stat = 'count', color = 'red', vjust = - .5) +
  facet_grid(. ~ userfee) +
  theme_classic() +
  labs(x = 'Mức hài lòng', y = 'Phần trăm')

  • Ta tạo thêm biến level thể hiện mức hài lòng của người tham gia bằng dữ liệu định tính từ dữ liệu của biến quality.

  • Qua biểu đồ ta thấy tỷ lệ người đánh giá cao và có trả phí hàng năm thì thấp hơn tỷ lệ người đánh giá cao và không trả phí, ở mức đánh giá trung bìnhthấp cũng tương tự như vậy, tỷ lệ người có trả phí luôn thấp hơn nhiều so với tỷ lệ người không trả phí.

Chúng ta cũng có thể vẽ đồ thi dạng cột theo biến level và chồng chúng lên nhau như sau để dễ phân tích hơn:

d3 |> ggplot(aes(x = level)) +
  geom_bar(aes(y = after_stat(count), fill = userfee), stat = 'count') +
  ylab('Số người đánh giá') +
  xlab('Mức hài lòng')

5 Bài tập tuần 3

5.1 pivot_longer

Gọi package ‘tidyverse’, ‘tidyr’, dữ liệu RecreationDemand để thực hiện các câu lệnh:

library(tidyverse)
library(tidyr)
data('RecreationDemand', package = 'AER')
d <- RecreationDemand
str(d)
## 'data.frame':    659 obs. of  8 variables:
##  $ trips  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ quality: num  0 0 0 0 0 0 0 0 0 2 ...
##  $ ski    : Factor w/ 2 levels "no","yes": 2 1 2 1 2 2 1 2 1 1 ...
##  $ income : num  4 9 5 2 3 5 1 5 2 3 ...
##  $ userfee: Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...
##  $ costC  : num  67.6 68.9 58.1 15.8 24 ...
##  $ costS  : num  68.6 70.9 59.5 13.8 34 ...
##  $ costH  : num  76.8 84.8 72.1 23.7 34.5 ...

Đưa biến ‘income’ về đơn vị USD, rút gọn số lượng biến của ‘d’ từ 8 biến còn 6 biến, gộp 4 biến ‘income’, ‘costC’, ‘costS’, ‘costH’ thành một biến ‘COST’ và giá trị tương ứng được thể hiện ở biến ‘USD’, quan sát thu nhập hộ gia đình hàng năm và chi phí tham quan của người thực hiện khảo sát ở cả 3 hồ trên cùng một biến:

d$income <- d$income*1000
d1 <- d %>% pivot_longer(cols = c(income, starts_with('cost')), names_to = 'COST', values_to = 'USD') # lấy tất cả dữ liệu 
d1
## # A tibble: 2,636 × 6
##    trips quality ski   userfee COST      USD
##    <dbl>   <dbl> <fct> <fct>   <chr>   <dbl>
##  1     0       0 yes   no      income 4000  
##  2     0       0 yes   no      costC    67.6
##  3     0       0 yes   no      costS    68.6
##  4     0       0 yes   no      costH    76.8
##  5     0       0 no    no      income 9000  
##  6     0       0 no    no      costC    68.9
##  7     0       0 no    no      costS    70.9
##  8     0       0 no    no      costH    84.8
##  9     0       0 yes   no      income 5000  
## 10     0       0 yes   no      costC    58.1
## # ℹ 2,626 more rows

5.2 pivot_wider

library(tidyr)
data(relig_income)
ec2 <- economics %>% as_tibble() %>%
  transmute(year =  year(date),
            month = month(date),
            rate = unemploy) %>%
  filter(year > 2005) %>% 
  pivot_wider(names_from = "month", values_from = "rate")
ec2
## # A tibble: 10 × 13
##     year   `1`   `2`   `3`   `4`   `5`   `6`   `7`   `8`   `9`  `10`  `11`  `12`
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2006  7064  7184  7072  7120  6980  7001  7175  7091  6847  6727  6872  6762
##  2  2007  7116  6927  6731  6850  6766  6979  7149  7067  7170  7237  7240  7645
##  3  2008  7685  7497  7822  7637  8395  8575  8937  9438  9494 10074 10538 11286
##  4  2009 12058 12898 13426 13853 14499 14707 14601 14814 15009 15352 15219 15098
##  5  2010 15046 15113 15202 15325 14849 14474 14512 14648 14579 14516 15081 14348
##  6  2011 14013 13820 13737 13957 13855 13962 13763 13818 13948 13594 13302 13093
##  7  2012 12797 12813 12713 12646 12660 12692 12656 12471 12115 12124 12005 12298
##  8  2013 12471 11950 11689 11760 11654 11751 11335 11279 11270 11136 10787 10404
##  9  2014 10202 10349 10380  9702  9859  9460  9608  9599  9262  8990  9090  8717
## 10  2015  8903  8610  8504  8526    NA    NA    NA    NA    NA    NA    NA    NA

5.3 mutate

Tạo thêm biến level thể hiện mức hài lòng của người tham gia bằng dữ liệu định tính, lấy d là tham số đầu vào, gán mutate vào d2 trong đó nếu quality có phản hồi là “0” nghĩa là người đó không tham gia, “1” và “2” là đánh giá thấp, “3” và “4” đánh giá trung bình, “5” là đánh giá cao; sau đó thể hiện 6 quan sát đầu và 6 quan sát cuối của d2:

d3 <- d %>% mutate(level = case_when(quality == "0" ~ "Không tham gia",
                                     quality == "1" ~ "Đánh giá thấp",
                                     quality == "2" ~ "Đánh giá thấp",
                                     quality == "3" ~ "Đánh giá trung bình",
                                     quality == "4" ~ "Đánh giá trung bình",
                                     quality == "5" ~ "Đánh giá cao"))
head(d3)
##   trips quality ski income userfee  costC   costS   costH          level
## 1     0       0 yes   4000      no  67.59  68.620  76.800 Không tham gia
## 2     0       0  no   9000      no  68.86  70.936  84.780 Không tham gia
## 3     0       0 yes   5000      no  58.12  59.465  72.110 Không tham gia
## 4     0       0  no   2000      no  15.79  13.750  23.680 Không tham gia
## 5     0       0 yes   3000      no  24.02  34.033  34.547 Không tham gia
## 6     0       0 yes   5000      no 129.46 137.377 137.850 Không tham gia
tail(d3)
##     trips quality ski income userfee costC  costS  costH               level
## 654    30       4 yes   3000      no 52.57 39.838 57.297 Đánh giá trung bình
## 655    40       5 yes   5000     yes 25.63 18.916 29.684        Đánh giá cao
## 656    40       3 yes   3000      no 18.46 13.330 25.800 Đánh giá trung bình
## 657    40       2 yes   4000      no 58.84 47.000 62.760       Đánh giá thấp
## 658    50       4 yes   4000      no 35.67 25.694 37.269 Đánh giá trung bình
## 659    88       2  no   2000      no 22.49  6.210 25.460       Đánh giá thấp

6 Bài tập tuần 2

6.1 Chia bậc cho biến income (thu nhập) và lập bảng tần số, tìm tỉ lệ người tham gia trượt nước ở các bậc đã chia:

data('RecreationDemand', package = 'AER')
d <- RecreationDemand
income <-cut(d$income, breaks=c(0,3,6,9), labels=c('Thấp', 'Trung bình', 'Cao'))
table(income)
## income
##       Thấp Trung bình        Cao 
##        335        265         59

Với mức lương trải dài trong khoảng 1-9.000 USD, bảng tần số cho thấy:

  • Có 335/659 người có thu nhập hộ gia đình trong khoảng 0-3.000 USD/ năm

  • Có 265/659 người có thu nhập hộ gia đình trong khoảng 3-6.000 USD/ năm

  • Có 59/659 người có thu nhập hộ gia đình trong khoảng 6-9.000 USD/ năm

incomeyes1 <- d[d$income <3 & d$ski == 'yes',] # 17/335 cao
incomeyes2 <- d[d$income >=3 & d$income <6 & d$ski == 'yes',] # 169/265 tb
incomeyes3 <- d[d$income >=6 & d$ski == 'yes',] # 56/335 thap
  • Trong 335 người có thu nhập hộ gia đình hàng năm Thấp thì có 17 người tham gia trượt nước (5.07%)

  • Trong 265 người có thu nhập hộ gia đình hàng năm Trung bình thì có 169 người tham gia trượt nước (63.77%)

  • Trong 59 người có thu nhập hộ gia đình hàng năm Cao thì có 56 người tham gia trượt nước (94.92%)

-> Qua thống kê ta thấy, ở mức thu nhập hộ gia đình hàng năm càng cao thì tỉ lệ người tham gia trượt nước càng cao.

6.2 Chia bậc và tìm mức thu nhập trung bình hộ gia đình hàng năm của người thực hiện khảo sát có chi phí tham quan ở cả ba hồ >= 300 USD:

costC <-cut(d$costC, breaks=c(0,150,300,500), labels=c('Thấp', 'Trung bình', 'Cao'))

costS <-cut(d$costS, breaks=c(0,150,300,500), labels=c('Thấp', 'Trung bình', 'Cao'))

costH <-cut(d$costH, breaks=c(0,150,300,500), labels=c('Thấp', 'Trung bình', 'Cao'))

aggregate(d$income, list(d$costC>=300), FUN = 'mean')
##   Group.1        x
## 1   FALSE 3.848855
## 2    TRUE 4.500000
aggregate(d$income, list(d$costS>=300), FUN = 'mean')
##   Group.1        x
## 1   FALSE 3.848855
## 2    TRUE 4.500000
aggregate(d$income, list(d$costH>=300), FUN = 'mean')
##   Group.1        x
## 1   FALSE 3.848855
## 2    TRUE 4.500000

True trả về kết quả đúng (costC >=300) thì có income trb là … False trả về kết quả sai (costC <300) thì có income trb là …

Thu nhập trung bình hộ gia đình hàng năm của người thực hiện khảo sát có chi phí tham gia ở cả 3 hồ >= 300 USD:

  • Ở hồ Conroe: 4.500 USD

  • Ở hồ Somerville: 4.500 USD

  • Ở hồ Houston: 4.500 USD

-> Vậy thu nhập trung bình hộ gia đình hàng năm của người thực hiện khảo sát có chi phí tham gia ở cả ba hồ >= 300 USD đều tương đương nhau là 4.500 USD.

7 Bài tập tuần 1

##Lấy dữ liệu "RecreationDemand" từ package "AER"
data('RecreationDemand', package = 'AER')
##Gán dữ liệu "RecreationDemand" vào d 
d <- RecreationDemand
##Xem cấu trúc dữ liệu d
str(d)
## 'data.frame':    659 obs. of  8 variables:
##  $ trips  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ quality: num  0 0 0 0 0 0 0 0 0 2 ...
##  $ ski    : Factor w/ 2 levels "no","yes": 2 1 2 1 2 2 1 2 1 1 ...
##  $ income : num  4 9 5 2 3 5 1 5 2 3 ...
##  $ userfee: Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...
##  $ costC  : num  67.6 68.9 58.1 15.8 24 ...
##  $ costS  : num  68.6 70.9 59.5 13.8 34 ...
##  $ costH  : num  76.8 84.8 72.1 23.7 34.5 ...
##Đặt tên cho các biến trong d
names(d) <- c('T','Q','S','I','U','CC','CS','CH')
head(d)
##   T Q   S I  U     CC      CS      CH
## 1 0 0 yes 4 no  67.59  68.620  76.800
## 2 0 0  no 9 no  68.86  70.936  84.780
## 3 0 0 yes 5 no  58.12  59.465  72.110
## 4 0 0  no 2 no  15.79  13.750  23.680
## 5 0 0 yes 3 no  24.02  34.033  34.547
## 6 0 0 yes 5 no 129.46 137.377 137.850
##Gán biến I trong data(RecreationDemand) vào "income" 
income <- d$I
##Lấy dữ liệu thứ 5 trong "income"
income[5]
## [1] 3
##Gán biến CC trong data(RecreationDemand) vào "costC"
costC <- d$CC
##Chi phí tham quan hồ Conroe từ 80 đến 100 USD 
costC1 <- costC[costC>80 & costC<100]
costC1
##  [1] 97.28 86.35 87.56 83.14 81.89 94.00 82.49 84.83 83.49 89.51 89.85 99.50
## [13] 82.86 98.01 92.94 91.22 93.51 93.42 91.92 86.26 99.11 82.50 91.58 89.86
## [25] 82.97 85.12 81.63 82.74 80.21 90.49 93.49 90.29 81.14 89.97 88.28 98.30
## [37] 85.17 92.51 84.44 86.14 81.51
##Chi phí tham quan hồ Somerville trên 80 USD và hồ Houston trên 100 USD 
costSH <- d[d$CS>80 & d$CH>100,]
costSH
##      T Q   S I   U     CC      CS      CH
## 6    0 0 yes 5  no 129.46 137.377 137.850
## 9    0 0  no 2  no 127.64 127.571 134.670
## 15   0 0 yes 4  no 129.31 137.680 130.400
## 22   0 0 yes 7  no 147.67 154.022 147.178
## 39   0 0 yes 1  no 230.04 216.420 226.620
## 53   0 0  no 4  no 116.85 120.125 112.755
## 60   0 0 yes 3  no 138.28 143.724 127.200
## 63   0 0 yes 9  no 143.08 148.033 137.767
## 75   0 1  no 7  no 356.72 358.163 350.390
## 86   0 0 yes 6  no 182.96 196.451 176.917
## 90   0 0  no 3  no 349.06 357.140 343.920
## 94   0 0  no 4  no 214.53 202.050 207.560
## 95   0 0  no 3  no 149.18 164.762 139.400
## 96   0 0  no 5  no 131.44 145.880 123.960
## 109  0 0  no 3  no 102.05 112.680 102.289
## 137  0 0 yes 2  no 151.24 160.080 148.760
## 165  0 0  no 2  no 126.43 136.720 132.767
## 168  0 0 yes 3  no 127.33 144.050 118.640
## 170  0 0 yes 3  no 168.68 147.860 162.920
## 174  0 0 yes 4  no 108.19 133.875 108.080
## 177  0 3 yes 5  no 493.77 491.547 491.049
## 184  0 0  no 3  no 329.12 336.389 328.177
## 191  0 0  no 3  no 195.84 202.953 196.480
## 212  0 0  no 4  no 262.56 261.610 262.395
## 216  0 0  no 4  no 118.20 123.590 116.880
## 223  0 4  no 8  no 111.42 104.980 108.040
## 245  0 0 yes 6  no 118.94 113.000 120.892
## 250  0 0 yes 9  no 108.41 112.811 105.478
## 255  0 0 yes 9  no 166.03 177.500 161.470
## 259  0 0 yes 1  no 125.32 142.960 124.420
## 260  0 0  no 1  no 217.27 236.780 217.617
## 306  0 3 yes 4  no 129.32 129.473 136.320
## 310  0 0  no 5  no 118.23 120.447 112.970
## 320  0 0  no 1  no 126.23 136.109 127.446
## 351  0 0 yes 1  no 147.36 151.317 143.580
## 355  0 1  no 3  no 133.34 130.567 141.327
## 380  0 0  no 2  no 211.23 219.280 213.485
## 383  0 0  no 5  no 118.60 122.727 113.580
## 389  0 0  no 3  no 100.26  93.758 102.427
## 406  0 0  no 9  no 176.76 153.660 178.800
## 412  0 3 yes 4  no 113.86 118.060 107.360
## 422  1 3  no 2  no 122.50 122.647 120.060
## 423  1 4  no 3  no 103.84  93.880 113.000
## 424  1 3 yes 4  no  93.42  87.305 107.360
## 428  1 2 yes 5  no 139.22 155.140 139.180
## 437  1 4  no 4  no 108.64 118.857 184.086
## 441  1 5 yes 4  no 122.63 123.840 106.505
## 444  1 4  no 2  no 129.48 124.200 128.600
## 445  1 3 yes 3  no 118.70 116.413 124.827
## 449  1 4  no 4  no 128.59 137.784 124.636
## 466  1 3 yes 3  no 138.84 148.680 132.160
## 467  1 3 yes 3  no 100.67  98.597 110.127
## 481  1 3 yes 9  no 271.09 278.520 276.470
## 492  2 4  no 2  no  85.12  94.857 103.400
## 498  2 5  no 3  no 119.56 117.650 117.980
## 500  2 5  no 2  no 105.88 113.800 121.407
## 505  2 3 yes 6  no 127.60 131.973 122.247
## 520  2 3  no 4  no 180.04 186.580 172.480
## 528  3 3 yes 2  no  93.49  91.050 100.700
## 533  3 3 yes 5  no 125.12  96.137 120.500
## 538  3 4  no 5  no 119.55 117.554 116.083
## 550  3 3 yes 4  no 158.92 162.430 155.260
## 558  4 3 yes 3  no 134.11 140.509 141.589
## 560  4 0 yes 7  no 118.86 113.396 111.736
## 571  4 3  no 9  no 173.91 170.394 182.470
## 574  4 5 yes 2  no 133.14 129.937 136.140
## 581  5 1  no 5 yes 125.03 113.887 127.087
## 582  5 3 yes 5  no 128.66 140.188 123.498
## 586  5 4 yes 9  no 276.99 262.080 288.460
## 619 10 5 yes 5  no 103.81  81.100 102.790
## 624 11 5  no 5  no 111.26 110.957 108.900
## 629 12 5 yes 5  no 111.39 119.214 109.309
##Gán biến CS trong data(RecreationDemand) vào "costS"
costS <- d$CS
costS
##   [1]  68.620  70.936  59.465  13.750  34.033 137.377  42.450  36.790 127.571
##  [10]  29.945  41.358  32.393 111.764  11.923 137.680  53.493  47.183  23.339
##  [19]  25.442  34.150  36.683 154.022  29.009  52.454  29.533  40.583 104.502
##  [28]  41.694  49.350  54.613  94.700  28.417  32.873  38.904  34.504  50.342
##  [37]  70.294  34.750 216.420 109.320  71.750  51.107  29.614  45.725 106.420
##  [46]  22.600  86.857  35.125  39.090  73.694  68.677  44.617 120.125  46.366
##  [55]  33.685  71.897  43.066   7.530 105.733 143.724  37.567  19.900 148.033
##  [64]  47.770  40.821  35.750  40.355  60.280  39.483  51.693  70.202  55.920
##  [73]  66.313  57.330 358.163  41.533  22.737  49.667  78.457  53.307  49.650
##  [82]  53.883  71.900  62.434  37.683 196.451 100.147  67.070  34.750 357.140
##  [91]  33.377  80.207  65.557 202.050 164.762 145.880  55.360  39.164  69.160
## [100]  78.147  45.777  97.066  91.207  59.980  42.388  58.240  84.527  44.867
## [109] 112.680  30.540  84.770  31.650  52.133  43.650  40.127  28.121  46.313
## [118]  59.980  30.250  44.606  29.975  86.290  46.590  26.888  35.883  30.696
## [127] 106.480  22.283  56.973  38.883  28.750  47.450  24.312  28.950  44.567
## [136]  79.960 160.080  28.183  57.773  89.880  12.161 156.550  65.628  36.350
## [145]  46.174  53.420  23.603  29.257  62.102  40.036  18.696  48.250  29.367
## [154]  20.071  67.840  30.682  82.117  47.083  28.517  41.010  59.150  52.350
## [163]  26.417  73.117 136.720  38.190  45.583 144.050  67.350 147.860  20.467
## [172]  19.557  91.060 133.875  55.250  41.080 491.547  62.321  67.450  51.317
## [181]  48.406  38.964  44.983 336.389  44.983  81.850  43.161  63.610  24.300
## [190]  43.490 202.953  26.250  24.140  89.090  46.630  35.057  45.850  19.672
## [199]  62.547  76.510  41.683  55.573  32.783  49.067  44.183  33.383  54.383
## [208]  91.533  58.283  33.040  37.290 261.610  82.080  24.583  21.233 123.590
## [217]  26.955  50.750  19.755  21.109  56.283  84.517 104.980  75.350  49.383
## [226]  71.380  40.610  29.850  63.167  42.180  53.357  26.687  31.233 111.213
## [235]  42.388  47.800  72.835  49.140  25.930  47.710  33.337  51.767  39.025
## [244]  34.983 113.000  88.413  29.417  56.313  38.621 112.811  56.303  50.433
## [253]  42.050  53.560 177.500  31.817  68.180  95.329 142.960 236.780  50.667
## [262]  51.283  94.000  48.920  15.267  45.850  21.000  94.302  25.803  51.366
## [271]  37.550  41.890  24.228  33.287  43.650  49.517  29.650  34.983  57.400
## [280]  55.717  35.450  33.100  39.065  25.483  50.850  36.736  27.710  69.740
## [289]  42.083  16.267  39.983 103.600  59.250  37.737  32.003   9.289 112.815
## [298]  15.350  52.500  59.190  38.383  29.250  26.775  64.280  35.167 129.473
## [307]  27.917  33.517  41.950 120.447  28.490  37.550  60.850  33.603  26.183
## [316]  36.303  56.950  65.340  25.673 136.109  13.550  52.950  28.383  90.027
## [325]  48.990  39.483  37.200  94.107  65.594  80.940  59.340  38.750  31.127
## [334]  44.067  50.170  24.406  40.907  39.593  43.294  47.040  31.550  42.917
## [343]  30.417  71.947  52.817  88.400  37.460  33.950  30.250  42.770 151.317
## [352]  58.650  53.973  73.107 130.567  36.083  44.750  27.917  35.520  25.650
## [361]  33.150  40.950  37.367  43.050 102.713  31.950  45.813  72.207  65.935
## [370]  45.570  35.117  27.220  37.783  39.713  75.993  69.940  62.480  39.850
## [379]  27.350 219.280  24.536  40.300 122.727  25.050  31.477  69.020  46.547
## [388]  58.650  93.758  64.272  43.550  49.250  43.990  49.517  25.961  39.227
## [397]  17.128  60.910  42.577  46.606  45.135  17.003  60.150  25.350   9.793
## [406] 153.660  59.279  37.783  51.510  79.027  51.050 118.060 108.500  61.080
## [415]  54.150 101.613  24.117  49.250  28.750 102.373  35.350 122.647  93.880
## [424]  87.305  45.250  33.883  75.000 155.140  39.850  26.183  70.840  21.165
## [433]  44.840  45.500  37.750  18.350 118.857  36.680  65.480  23.494 123.840
## [442]  68.147  84.220 124.200 116.413  57.250  35.350  67.240 137.784  44.340
## [451] 109.540  31.317  48.307  50.117  56.450  43.150  50.090  73.013  99.780
## [460]  70.940  41.450  55.920  73.507  44.550  28.872 148.680  98.597  21.707
## [469]  96.620  18.861  29.267  91.750  92.067  92.000  99.878  60.750  66.040
## [478]  73.554  38.940  89.320 278.520  25.083  64.917  78.280  43.550  77.047
## [487]  74.480  17.107  23.126  75.500  40.950  94.857  13.500  30.267  78.200
## [496]  10.117  72.467 117.650  25.767 113.800  42.697  40.167  46.604  35.775
## [505] 131.973  29.693  39.650  81.414  47.771  27.140  41.893  46.583  96.806
## [514]  51.981  74.515  62.450  66.780  60.250  39.590 186.580  57.450  86.540
## [523]  53.900  21.729  18.850  83.783  25.717  91.050  57.667  40.583  76.637
## [532]  22.540  96.137  74.413  64.800  58.050  43.450 117.554  16.150  37.200
## [541]  27.312  39.600  18.200  79.233  12.150  41.583  39.988  36.550  49.094
## [550] 162.430  61.590  39.933  88.230   8.057  18.250  56.680  41.830 140.509
## [559]  40.867 113.396  34.350  77.540 106.467  42.236  73.950  32.183  83.000
## [568]  31.050  71.896  47.600 170.394  16.767  18.140 129.937 110.400  22.317
## [577]  56.360  13.693  55.255  73.150 113.887 140.188  21.306  44.807  29.850
## [586] 262.080  43.883  17.233  36.393  82.023  52.913  52.865  59.833  80.897
## [595] 107.847  67.557  32.223  51.950  24.650  40.200  60.763  14.350  34.717
## [604]  11.033  21.075  24.741  28.117  91.333  37.562  36.264  30.317  28.088
## [613]  30.000  21.710  85.800  25.040  19.007  55.583  81.100  72.680  73.930
## [622]  76.967  40.817 110.957  39.900  20.158  48.700  23.283 119.214  16.300
## [631]  57.280  19.800  21.163  48.155  85.480  23.983  65.357  20.338  76.075
## [640]  15.550  40.800  68.396  12.172  47.325   4.767  27.607  37.944   8.325
## [649]  12.712  11.650  59.123  55.783  48.089  39.838  18.916  13.330  47.000
## [658]  25.694   6.210
##Chia dữ liệu "costD" thành 4 tổ 
cut(costS,4)
##   [1] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248] 
##   [7] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
##  [13] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
##  [19] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
##  [25] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [31] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [37] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
##  [43] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [49] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [55] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248] 
##  [61] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
##  [67] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [73] (4.28,126] (4.28,126] (248,370]  (4.28,126] (4.28,126] (4.28,126]
##  [79] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
##  [85] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126] (248,370] 
##  [91] (4.28,126] (4.28,126] (4.28,126] (126,248]  (126,248]  (126,248] 
##  [97] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [103] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [109] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [115] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [121] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [127] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [133] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126]
## [139] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [145] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [151] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [157] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [163] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (126,248] 
## [169] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126] (126,248] 
## [175] (4.28,126] (4.28,126] (370,492]  (4.28,126] (4.28,126] (4.28,126]
## [181] (4.28,126] (4.28,126] (4.28,126] (248,370]  (4.28,126] (4.28,126]
## [187] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126]
## [193] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [199] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [205] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [211] (4.28,126] (248,370]  (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [217] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [223] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [229] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [235] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [241] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [247] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [253] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
## [259] (126,248]  (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [265] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [271] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [277] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [283] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [289] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [295] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [301] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248] 
## [307] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [313] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [319] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [325] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [331] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [337] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [343] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [349] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126]
## [355] (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [361] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [367] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [373] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [379] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [385] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [391] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [397] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [403] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [409] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [415] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [421] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [427] (4.28,126] (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [433] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [439] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [445] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126]
## [451] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [457] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [463] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [469] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [475] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [481] (248,370]  (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [487] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [493] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [499] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [505] (126,248]  (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [511] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [517] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [523] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [529] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [535] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [541] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [547] (4.28,126] (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [553] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248] 
## [559] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [565] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [571] (126,248]  (4.28,126] (4.28,126] (126,248]  (4.28,126] (4.28,126]
## [577] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (126,248] 
## [583] (4.28,126] (4.28,126] (4.28,126] (248,370]  (4.28,126] (4.28,126]
## [589] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [595] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [601] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [607] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [613] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [619] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [625] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [631] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [637] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [643] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [649] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## [655] (4.28,126] (4.28,126] (4.28,126] (4.28,126] (4.28,126]
## Levels: (4.28,126] (126,248] (248,370] (370,492]
##Lập bảng tần số của "costS" sau khi chia thành 4 tổ 
table(cut(costS,4))
## 
## (4.28,126]  (126,248]  (248,370]  (370,492] 
##        615         37          6          1
##Tính log của biến "costH"
d$logH <- log(d$CH)
d$logH
##   [1] 4.341205 4.440060 4.278193 3.164631 3.542321 4.926166 3.786460 3.210844
##   [9] 4.902827 3.334701 3.734259 3.360028 4.576421 3.189653 4.870607 3.909821
##  [17] 3.693369 2.778198 2.714695 3.147595 3.384390 4.991643 3.552487 4.053523
##  [25] 3.402763 3.353407 4.592470 3.244427 3.931826 4.091006 4.491497 3.522825
##  [33] 3.141865 3.555348 3.421000 3.742420 4.058717 3.885268 5.423275 4.585783
##  [41] 3.789177 3.862139 3.598106 3.657569 4.583742 2.322388 4.396423 3.271468
##  [49] 3.331490 4.228977 4.128746 3.410487 4.725217 3.608672 3.171365 4.159508
##  [57] 3.565185 1.856298 4.584763 4.845761 3.397524 2.682390 4.925564 3.759571
##  [65] 3.505257 2.963571 3.518536 3.934958 3.480625 3.885001 4.165704 3.799526
##  [73] 4.058026 3.941193 5.859047 3.337547 2.667575 3.375880 4.120337 3.832330
##  [81] 3.678324 3.782984 4.105944 3.819359 3.282677 5.175681 4.475517 3.853546
##  [89] 2.861057 5.840409 3.173878 4.210051 4.045854 5.335420 4.937347 4.819959
##  [97] 3.811982 3.220355 4.038603 4.249352 3.634687 4.413876 4.361314 3.903769
## [105] 3.533891 3.921577 4.263904 3.449352 4.627802 3.232384 4.148201 3.072693
## [113] 3.723933 3.481517 3.520461 3.024806 3.614344 3.881337 3.002211 4.015428
## [121] 3.093539 4.308111 3.950089 2.931567 3.135494 3.313095 4.554087 2.726545
## [129] 4.295651 3.092405 3.095578 3.527242 3.140612 3.040706 3.237109 4.195998
## [137] 5.002334 2.841823 3.849019 4.157319 2.218225 4.485034 3.927896 2.344686
## [145] 3.650139 3.855664 2.761717 3.205182 4.031369 3.662279 2.572612 3.815071
## [153] 3.333882 2.623654 3.766697 3.624234 4.089332 3.584824 2.983153 3.678324
## [161] 3.825157 3.664587 2.870736 4.151780 4.888596 3.483699 3.542321 4.776094
## [169] 4.037421 5.093259 3.509962 2.897403 4.315887 4.682872 3.546163 3.340279
## [177] 6.196544 3.929352 4.030854 3.749033 3.597312 3.193189 3.544056 5.793553
## [185] 3.502550 4.262398 3.542957 3.891412 2.879760 3.543275 5.280561 3.286048
## [193] 3.104452 4.345103 3.806218 3.569533 3.560478 2.405142 3.968781 4.303795
## [201] 3.451890 3.825310 3.304943 3.865916 3.334559 3.154743 3.751854 4.437461
## [209] 3.713816 3.673766 3.455686 5.569851 4.304970 2.684236 3.553833 4.761148
## [217] 3.219276 3.690877 2.946542 2.827846 3.644928 4.529692 4.682502 4.180522
## [225] 3.556690 4.087656 3.274121 3.112626 4.124664 3.489452 4.162735 3.249599
## [233] 3.805484 4.581154 3.533891 3.487375 4.226834 3.858200 3.570518 4.121960
## [241] 3.018814 3.463546 3.404525 2.923162 4.794898 4.366748 3.051971 3.719894
## [249] 3.437015 4.658502 4.012773 3.915816 3.526949 3.869950 5.084319 3.039749
## [257] 4.001132 4.442369 4.823663 5.382737 3.746677 3.510351 4.355939 3.356200
## [265] 3.163786 3.421000 2.721295 4.350768 3.210844 3.709099 3.744314 3.397858
## [273] 2.914902 3.205993 3.810655 3.365467 3.044522 3.527242 3.721831 3.885884
## [281] 4.555770 2.890372 3.375538 2.833801 3.597312 3.278540 2.604170 4.107919
## [289] 3.520372 3.205182 3.390473 4.434975 3.943134 3.235418 3.252775 3.039749
## [297] 4.590107 2.175320 3.765956 4.215086 3.860730 2.922086 2.936778 3.995629
## [305] 3.148453 4.915005 2.948641 3.205993 2.894806 4.727122 2.681022 3.311637
## [313] 3.979308 3.484619 3.336730 3.564166 3.861508 3.877017 2.938103 4.847693
## [321] 3.349202 3.502700 3.560108 4.338427 3.769999 3.434310 2.272126 4.361939
## [329] 4.027973 4.330470 3.889368 3.392829 3.112982 3.353407 3.409827 3.018374
## [337] 3.472184 3.432890 3.577948 3.436565 2.969388 3.528711 3.071767 4.280686
## [345] 3.402763 4.300003 3.460723 3.138966 3.100092 3.090133 4.966892 3.847591
## [353] 3.764613 4.189200 4.951076 3.263734 3.441059 2.948641 3.379633 3.231595
## [361] 3.249599 3.539799 3.499533 3.477541 4.538250 2.989714 3.976818 4.175464
## [369] 3.731124 3.269569 3.190476 3.047376 3.766928 3.411148 4.217845 4.177459
## [377] 3.958143 3.440418 3.253470 5.363567 3.154870 3.551197 4.732507 2.665838
## [385] 3.160823 4.031405 3.670384 3.823847 4.629150 3.953856 2.956991 2.834389
## [393] 3.349202 3.659631 3.052018 3.434406 2.428953 3.734808 3.546451 3.709172
## [401] 3.668422 2.385086 3.650139 3.065118 1.740466 5.186268 3.906186 3.326725
## [409] 3.619529 4.193134 3.604954 4.676188 4.487512 3.934958 3.682358 4.462915
## [417] 2.726545 3.615771 3.889368 4.499810 3.732896 4.787992 4.727388 4.676188
## [425] 3.591570 3.027570 3.748091 4.935768 3.546163 2.914902 3.953741 3.531875
## [433] 3.471345 3.433342 3.168845 2.984671 5.215403 3.659965 3.985273 2.972822
## [441] 4.668192 4.182966 4.246207 4.856707 4.826929 3.977436 3.510948 3.997466
## [449] 4.825397 4.029753 4.595928 3.516310 3.834710 3.612538 3.954316 3.631250
## [457] 3.640214 4.260805 4.468204 4.039536 3.678324 3.769537 4.421247 3.383712
## [465] 3.240089 4.884013 4.701634 3.028925 4.448282 2.854053 2.830091 4.252772
## [473] 4.595393 4.409727 4.502750 4.170487 4.046379 4.450853 3.918005 4.467057
## [481] 5.622102 3.344521 4.026779 4.287166 3.547114 4.300369 4.465069 3.438493
## [489] 3.376905 4.104295 4.130033 4.638605 3.043570 3.650139 4.262680 2.835974
## [497] 4.446174 4.770515 2.829087 4.799149 4.019801 3.528711 3.256133 3.728220
## [505] 4.806044 3.348148 2.889260 4.401829 4.006606 2.827314 3.472277 3.484312
## [513] 4.510860 3.776112 4.452240 4.047952 4.432482 4.047952 3.106692 5.150281
## [521] 3.693369 4.584253 4.260706 3.422926 3.628599 4.366913 3.054001 4.612146
## [529] 3.855664 3.810367 4.541591 3.403860 4.791650 4.177873 4.292649 4.220390
## [537] 3.608347 4.754305 3.306887 4.010963 3.758172 3.476861 3.767691 4.233628
## [545] 3.366606 3.543275 3.645841 3.943909 3.758056 5.045101 4.151119 3.982426
## [553] 4.272630 4.200804 3.203965 3.911763 3.913222 4.952928 3.584269 4.716139
## [561] 3.997834 4.123903 4.373238 4.186924 4.188442 3.876334 4.470495 3.864092
## [569] 4.081529 3.339322 5.206586 3.344521 3.563883 4.913684 4.496471 3.558201
## [577] 4.144721 3.154870 4.412313 4.434382 4.844872 4.816225 3.650658 3.672699
## [585] 3.790081 5.664556 3.587594 2.980111 3.897721 4.267135 3.738050 4.139923
## [593] 3.908015 4.542124 4.386106 4.330470 3.674958 3.494384 3.631780 3.832547
## [601] 3.981362 3.340987 3.805484 3.222868 3.486763 3.052349 3.597312 4.315179
## [609] 3.858200 3.875359 3.809547 3.674223 3.796545 3.291383 4.294015 3.739573
## [617] 3.422633 4.214303 4.632688 4.274581 4.461069 4.435093 3.906005 4.690430
## [625] 3.909119 3.335770 3.846524 3.663562 4.694179 3.269949 4.037774 3.454643
## [633] 3.433342 4.285103 4.280271 3.747148 4.487838 3.434632 4.591882 3.178887
## [641] 4.100327 4.440296 3.443938 4.082390 2.765627 3.641526 4.133389 3.490429
## [649] 3.254243 3.309813 4.198104 4.418720 4.228584 4.048248 3.390608 3.250374
## [657] 4.139318 3.618162 3.237109