car_price_prediction_<-read.csv("car_price_prediction_.csv")

#Câu 1: Thực hiện thống kê mô tả a. Lập bảng tần số cho số thương hiệu xe và loại nhiên liệu xe sử dụng. Vẽ biểu đồ thanh thể hiện số lượng xe của từng thương hiệu xe và nhận xét.

#Lập bảng tần số cho số thương hiệu xe và loại nhiên liệu xe sử dụn
table(car_price_prediction_$Brand,car_price_prediction_$Fuel.Type)
##           
##            Diesel Electric Hybrid Petrol
##   Audi         97       94     81     96
##   BMW          92       91     86     89
##   Ford         85       85     86     91
##   Honda       103       75     87     87
##   Mercedes     83       82     80    108
##   Tesla        88      100     85     75
##   Toyota      107       87     96     84
#Vẽ biểu đồ thanh thể hiện số lượng xe của từng thương hiệu x
barplot(table(car_price_prediction_$Brand))

#Nhận xét:
# Các thương hiệu xe có số lượng phân bố khá đồng đều, không có sự chênh lệch quá lớn giữa các hãng. 
# Toyota có số lượng xe cao nhất trong các thương hiệu được thống kê. 
# Ford và Tesla có số lượng thấp hơn so với các hãng còn lại. 
# Audi, BMW, Honda và Mercedes có số lượng tương đối tương đương nhau

knitr::opts_chunk$set(echo = TRUE)
  1. Phân tổ dữ liệu cho dung tích động cơ của tất cả xe với các điểm chia 1.0, 2.0, 3.0, 4.0, 5.0, 6.0 và tính tỉ lệ số chiếc xe có dung tích động cơ trong khoảng (2.0;3.0]. Vẽ biểu đồ phân phối tần số cho dung tích động cơ xe và nhận xét.
min(car_price_prediction_$Engine.Size)
## [1] 1
max(car_price_prediction_$Engine.Size)
## [1] 6
# phân tổ dữ liệu
cut(car_price_prediction_$Engine.Size,breaks = c(1.0,2.0,3.0,4.0,5.0,6.0),right=T,include.lowest = T)
##    [1] (2,3] (4,5] (4,5] (4,5] (2,3] (2,3] (3,4] (5,6] (5,6] [1,2] [1,2] (5,6]
##   [13] (4,5] (5,6] [1,2] (3,4] (4,5] (4,5] (2,3] [1,2] (3,4] (2,3] (3,4] (5,6]
##   [25] (2,3] (5,6] [1,2] (4,5] (5,6] [1,2] [1,2] (3,4] [1,2] (4,5] (5,6] (3,4]
##   [37] (2,3] (3,4] (4,5] [1,2] (3,4] (4,5] (4,5] (2,3] (4,5] [1,2] [1,2] (5,6]
##   [49] (4,5] [1,2] (2,3] (2,3] (2,3] (2,3] [1,2] (3,4] (4,5] (3,4] (4,5] [1,2]
##   [61] (5,6] (5,6] (4,5] (5,6] (5,6] (3,4] [1,2] (4,5] (4,5] (4,5] (3,4] [1,2]
##   [73] (2,3] (5,6] (3,4] (3,4] (2,3] (2,3] (5,6] (4,5] (4,5] (3,4] (4,5] (2,3]
##   [85] (4,5] (3,4] (3,4] (4,5] (5,6] [1,2] (5,6] (2,3] (3,4] [1,2] (2,3] (3,4]
##   [97] [1,2] (3,4] (5,6] [1,2] (4,5] (2,3] (4,5] (2,3] [1,2] [1,2] [1,2] [1,2]
##  [109] (4,5] (5,6] (5,6] (4,5] [1,2] (2,3] (2,3] (2,3] (3,4] (3,4] (2,3] (2,3]
##  [121] (5,6] (4,5] (2,3] (5,6] (5,6] (2,3] (2,3] (3,4] (5,6] (5,6] [1,2] (2,3]
##  [133] (3,4] (3,4] [1,2] (5,6] (4,5] (5,6] (5,6] (4,5] (3,4] (4,5] [1,2] (4,5]
##  [145] [1,2] (4,5] (2,3] [1,2] [1,2] [1,2] (4,5] (4,5] (3,4] [1,2] [1,2] [1,2]
##  [157] [1,2] (5,6] (2,3] (2,3] [1,2] (2,3] (3,4] (3,4] (2,3] [1,2] (2,3] (2,3]
##  [169] (2,3] (5,6] (4,5] (3,4] (3,4] (3,4] (3,4] (4,5] (4,5] [1,2] (3,4] (3,4]
##  [181] (5,6] (4,5] (3,4] [1,2] (3,4] [1,2] (2,3] [1,2] (4,5] [1,2] (2,3] (5,6]
##  [193] [1,2] (3,4] (3,4] [1,2] (4,5] [1,2] (3,4] (3,4] (4,5] (4,5] (2,3] [1,2]
##  [205] (4,5] (3,4] (5,6] (5,6] (5,6] (3,4] (2,3] (4,5] (3,4] [1,2] (5,6] (5,6]
##  [217] (3,4] [1,2] (2,3] (4,5] (5,6] [1,2] [1,2] (5,6] (2,3] (3,4] (5,6] [1,2]
##  [229] (4,5] [1,2] (2,3] (4,5] (3,4] (5,6] (3,4] (2,3] (2,3] (2,3] (2,3] [1,2]
##  [241] (2,3] (3,4] (4,5] (4,5] (4,5] [1,2] (2,3] (4,5] (3,4] [1,2] (4,5] (4,5]
##  [253] (3,4] [1,2] (4,5] (3,4] (4,5] (4,5] (4,5] (3,4] [1,2] (4,5] (4,5] (4,5]
##  [265] [1,2] [1,2] (5,6] (4,5] (5,6] (4,5] (3,4] (4,5] (5,6] (3,4] (4,5] [1,2]
##  [277] (3,4] (4,5] (2,3] [1,2] (2,3] (2,3] (2,3] (3,4] (5,6] (3,4] [1,2] [1,2]
##  [289] (4,5] (2,3] (5,6] (4,5] (4,5] (2,3] (4,5] (2,3] (5,6] (4,5] (2,3] (2,3]
##  [301] [1,2] (4,5] (2,3] (3,4] (2,3] (4,5] (5,6] (4,5] (4,5] [1,2] [1,2] (4,5]
##  [313] (2,3] (3,4] [1,2] (2,3] [1,2] (5,6] (2,3] (3,4] [1,2] (4,5] (2,3] (5,6]
##  [325] (5,6] (2,3] (5,6] (5,6] (5,6] (5,6] (2,3] (3,4] [1,2] [1,2] (5,6] (2,3]
##  [337] (4,5] (4,5] (5,6] (5,6] (2,3] [1,2] (3,4] [1,2] [1,2] (2,3] (4,5] (3,4]
##  [349] (2,3] (4,5] (2,3] [1,2] (4,5] (4,5] (4,5] [1,2] (5,6] (4,5] (3,4] (4,5]
##  [361] (5,6] (3,4] (3,4] (5,6] (4,5] (3,4] (4,5] (2,3] (2,3] (3,4] (5,6] (5,6]
##  [373] (2,3] (3,4] (2,3] (5,6] (5,6] (4,5] (4,5] (4,5] (3,4] [1,2] (3,4] (4,5]
##  [385] (4,5] (2,3] (5,6] [1,2] (3,4] (4,5] (4,5] (4,5] (2,3] [1,2] (4,5] (3,4]
##  [397] [1,2] (4,5] (3,4] (4,5] (5,6] [1,2] [1,2] (4,5] (3,4] (4,5] (5,6] (4,5]
##  [409] (5,6] (3,4] (3,4] (2,3] [1,2] (3,4] (2,3] (5,6] (3,4] (3,4] (2,3] [1,2]
##  [421] [1,2] (3,4] [1,2] (3,4] (5,6] (5,6] (4,5] (2,3] (5,6] (5,6] [1,2] (4,5]
##  [433] (2,3] (4,5] (5,6] [1,2] (5,6] (4,5] (5,6] (3,4] (5,6] [1,2] (2,3] [1,2]
##  [445] (5,6] (5,6] (5,6] (5,6] [1,2] (2,3] [1,2] (2,3] (2,3] (3,4] (2,3] [1,2]
##  [457] [1,2] [1,2] (5,6] (4,5] (5,6] (3,4] (2,3] (4,5] (2,3] (2,3] (2,3] [1,2]
##  [469] (2,3] (2,3] (4,5] [1,2] (2,3] (4,5] [1,2] (2,3] (5,6] [1,2] [1,2] (3,4]
##  [481] (2,3] (3,4] (4,5] [1,2] (3,4] (3,4] [1,2] (4,5] (2,3] (3,4] [1,2] (3,4]
##  [493] (2,3] (5,6] [1,2] (3,4] (3,4] (4,5] (3,4] (4,5] (4,5] (5,6] (2,3] (3,4]
##  [505] (5,6] (5,6] (5,6] (2,3] [1,2] (3,4] (4,5] (3,4] (3,4] (5,6] (2,3] (5,6]
##  [517] (2,3] (2,3] (3,4] (4,5] [1,2] [1,2] (5,6] [1,2] (3,4] (3,4] (3,4] (4,5]
##  [529] (2,3] (3,4] (2,3] (4,5] [1,2] (3,4] [1,2] (2,3] (2,3] [1,2] (5,6] (2,3]
##  [541] (5,6] (5,6] (3,4] [1,2] (2,3] (4,5] (2,3] [1,2] (3,4] (5,6] (4,5] [1,2]
##  [553] (4,5] (2,3] (2,3] (5,6] (2,3] (2,3] [1,2] (5,6] (4,5] (4,5] (4,5] [1,2]
##  [565] (3,4] (2,3] [1,2] (3,4] (5,6] [1,2] (2,3] [1,2] (2,3] (5,6] (3,4] (3,4]
##  [577] (4,5] [1,2] (3,4] (3,4] (3,4] (5,6] (4,5] (2,3] (5,6] [1,2] [1,2] [1,2]
##  [589] (2,3] (3,4] (4,5] (5,6] (3,4] (3,4] [1,2] [1,2] (3,4] (3,4] (5,6] [1,2]
##  [601] [1,2] (3,4] (2,3] [1,2] (4,5] [1,2] (3,4] (2,3] [1,2] (2,3] (4,5] (2,3]
##  [613] (4,5] [1,2] (4,5] (2,3] (4,5] (3,4] (5,6] (2,3] [1,2] [1,2] (5,6] (3,4]
##  [625] (4,5] (2,3] (2,3] [1,2] (5,6] (4,5] (5,6] (2,3] (4,5] (4,5] (2,3] (5,6]
##  [637] (5,6] (5,6] (4,5] (2,3] (2,3] (5,6] [1,2] (4,5] (4,5] (4,5] (5,6] (2,3]
##  [649] (2,3] [1,2] (3,4] (2,3] (2,3] (5,6] (5,6] [1,2] (2,3] (5,6] [1,2] [1,2]
##  [661] [1,2] (3,4] [1,2] (5,6] (3,4] (3,4] (2,3] (3,4] (4,5] (4,5] (4,5] (3,4]
##  [673] (5,6] (5,6] (4,5] [1,2] [1,2] (2,3] (4,5] (3,4] (2,3] (5,6] (5,6] (5,6]
##  [685] (2,3] (4,5] (2,3] [1,2] [1,2] (2,3] (3,4] (5,6] [1,2] (4,5] (3,4] (2,3]
##  [697] (3,4] (2,3] (3,4] (3,4] [1,2] [1,2] (3,4] (5,6] (2,3] (4,5] (4,5] (5,6]
##  [709] (5,6] (3,4] (4,5] (5,6] (2,3] (2,3] [1,2] (5,6] (4,5] [1,2] (3,4] (3,4]
##  [721] [1,2] (5,6] (2,3] [1,2] (3,4] (4,5] [1,2] (4,5] (3,4] [1,2] [1,2] (3,4]
##  [733] (2,3] (5,6] (5,6] (5,6] (2,3] (5,6] (3,4] (2,3] [1,2] [1,2] (4,5] (3,4]
##  [745] (2,3] (4,5] (2,3] (3,4] (2,3] (5,6] (5,6] (3,4] (2,3] (2,3] (4,5] (2,3]
##  [757] [1,2] [1,2] (3,4] (3,4] (5,6] (2,3] (2,3] (4,5] (5,6] (2,3] (3,4] (2,3]
##  [769] (5,6] [1,2] (5,6] (4,5] (3,4] [1,2] (3,4] (2,3] [1,2] (4,5] (5,6] (3,4]
##  [781] (4,5] [1,2] (3,4] [1,2] (4,5] (5,6] (4,5] [1,2] (2,3] (3,4] (2,3] (5,6]
##  [793] (5,6] (4,5] (2,3] (2,3] [1,2] (2,3] (3,4] (4,5] (4,5] [1,2] (2,3] [1,2]
##  [805] [1,2] (5,6] [1,2] (3,4] [1,2] (5,6] (3,4] (2,3] (3,4] (4,5] (5,6] (2,3]
##  [817] (5,6] (5,6] (5,6] (4,5] (4,5] (2,3] (4,5] (3,4] (4,5] (3,4] (4,5] (5,6]
##  [829] [1,2] (5,6] (3,4] (5,6] (3,4] (2,3] (5,6] (2,3] (5,6] (3,4] (3,4] (2,3]
##  [841] (3,4] (2,3] [1,2] (2,3] [1,2] (5,6] (5,6] (2,3] (4,5] (2,3] (4,5] (4,5]
##  [853] (5,6] (2,3] (4,5] (2,3] (5,6] [1,2] (3,4] (4,5] (4,5] [1,2] (5,6] [1,2]
##  [865] (4,5] (2,3] (2,3] (3,4] (3,4] [1,2] [1,2] (3,4] (4,5] (5,6] [1,2] (2,3]
##  [877] [1,2] [1,2] (4,5] (3,4] [1,2] (2,3] [1,2] (5,6] (5,6] [1,2] (2,3] (5,6]
##  [889] (5,6] (3,4] [1,2] [1,2] (3,4] (2,3] [1,2] (3,4] [1,2] (4,5] (2,3] [1,2]
##  [901] (3,4] (2,3] (5,6] (3,4] (2,3] (4,5] (2,3] (5,6] (2,3] (3,4] [1,2] (3,4]
##  [913] (5,6] (4,5] (2,3] (2,3] (5,6] (5,6] [1,2] (3,4] (2,3] (5,6] [1,2] (2,3]
##  [925] (4,5] [1,2] (3,4] (3,4] (2,3] (2,3] (3,4] [1,2] (3,4] (4,5] (4,5] [1,2]
##  [937] [1,2] (2,3] (2,3] (2,3] (4,5] [1,2] [1,2] (2,3] (4,5] [1,2] (4,5] (2,3]
##  [949] (5,6] (5,6] (2,3] (2,3] (3,4] (2,3] (4,5] (5,6] (4,5] (5,6] (2,3] [1,2]
##  [961] (4,5] (2,3] (4,5] (2,3] [1,2] (5,6] [1,2] (5,6] (5,6] (4,5] (4,5] (3,4]
##  [973] (5,6] (2,3] (3,4] (4,5] (3,4] (3,4] (2,3] (3,4] (5,6] [1,2] (5,6] (4,5]
##  [985] (5,6] (3,4] (4,5] [1,2] (5,6] [1,2] (5,6] (5,6] (2,3] (2,3] (4,5] (2,3]
##  [997] (5,6] [1,2] [1,2] (5,6] (4,5] (5,6] (2,3] (4,5] (3,4] (3,4] (4,5] (3,4]
## [1009] (3,4] (2,3] (4,5] (2,3] (4,5] (2,3] (4,5] (4,5] (2,3] [1,2] [1,2] (3,4]
## [1021] (5,6] [1,2] (4,5] (2,3] (3,4] (5,6] (2,3] (3,4] [1,2] [1,2] (2,3] [1,2]
## [1033] (4,5] (3,4] (3,4] [1,2] (2,3] (4,5] (5,6] [1,2] (5,6] (3,4] (3,4] (3,4]
## [1045] [1,2] [1,2] (3,4] (2,3] (5,6] (2,3] [1,2] (4,5] (2,3] (3,4] (4,5] (5,6]
## [1057] (4,5] (4,5] (4,5] (5,6] (2,3] [1,2] (2,3] (2,3] (4,5] (4,5] (3,4] [1,2]
## [1069] (4,5] (2,3] (4,5] (3,4] (2,3] [1,2] [1,2] (5,6] (5,6] (4,5] [1,2] (2,3]
## [1081] (4,5] (4,5] [1,2] [1,2] (4,5] (2,3] (2,3] [1,2] (3,4] (5,6] (5,6] (3,4]
## [1093] (3,4] [1,2] (3,4] (2,3] (3,4] (2,3] (2,3] [1,2] (2,3] [1,2] [1,2] (5,6]
## [1105] (3,4] (3,4] (5,6] (5,6] (3,4] (5,6] (2,3] (2,3] (2,3] (4,5] (4,5] (2,3]
## [1117] [1,2] (4,5] [1,2] (3,4] (4,5] (4,5] (4,5] (5,6] (3,4] (4,5] (4,5] [1,2]
## [1129] [1,2] (2,3] (3,4] (4,5] (5,6] [1,2] [1,2] (5,6] [1,2] (3,4] (3,4] (3,4]
## [1141] [1,2] [1,2] [1,2] (3,4] (3,4] (2,3] (4,5] (5,6] [1,2] (3,4] (4,5] (2,3]
## [1153] (2,3] (4,5] (5,6] (4,5] (3,4] (4,5] (2,3] (4,5] (3,4] [1,2] (4,5] (3,4]
## [1165] (2,3] (5,6] [1,2] (2,3] [1,2] (4,5] (4,5] (2,3] (4,5] (2,3] (4,5] (3,4]
## [1177] (3,4] (5,6] (2,3] [1,2] (3,4] (5,6] (2,3] [1,2] (2,3] (3,4] [1,2] (4,5]
## [1189] (5,6] (3,4] (2,3] (2,3] [1,2] (5,6] (3,4] (2,3] (4,5] (3,4] (4,5] [1,2]
## [1201] (5,6] (5,6] (4,5] (5,6] [1,2] (3,4] (3,4] (3,4] (2,3] (2,3] [1,2] (2,3]
## [1213] [1,2] (4,5] [1,2] [1,2] (3,4] (3,4] (5,6] (3,4] (2,3] (4,5] (3,4] [1,2]
## [1225] (3,4] (5,6] (2,3] (2,3] [1,2] [1,2] (3,4] (3,4] [1,2] (5,6] (4,5] (3,4]
## [1237] (5,6] [1,2] (3,4] (4,5] (5,6] (4,5] (2,3] (5,6] [1,2] (5,6] (5,6] [1,2]
## [1249] (4,5] [1,2] (2,3] (3,4] (3,4] (5,6] (4,5] (3,4] (4,5] (5,6] [1,2] (5,6]
## [1261] [1,2] (5,6] (2,3] [1,2] (3,4] (4,5] (2,3] [1,2] (3,4] (5,6] (2,3] (2,3]
## [1273] (3,4] [1,2] (5,6] (5,6] (3,4] (2,3] (4,5] (3,4] (5,6] (4,5] (4,5] (3,4]
## [1285] (3,4] (5,6] (3,4] (3,4] (2,3] (4,5] (3,4] [1,2] [1,2] (3,4] (4,5] (3,4]
## [1297] (2,3] (4,5] [1,2] (3,4] [1,2] [1,2] [1,2] (2,3] [1,2] (2,3] (3,4] (3,4]
## [1309] (2,3] (5,6] [1,2] (3,4] [1,2] [1,2] (3,4] (3,4] (5,6] (3,4] (5,6] [1,2]
## [1321] [1,2] [1,2] [1,2] (3,4] (4,5] [1,2] (5,6] (5,6] (2,3] [1,2] [1,2] [1,2]
## [1333] [1,2] (3,4] (2,3] (2,3] (5,6] (4,5] (5,6] [1,2] (2,3] (3,4] [1,2] [1,2]
## [1345] (4,5] (4,5] (3,4] (3,4] (3,4] [1,2] (2,3] [1,2] [1,2] (5,6] (3,4] (4,5]
## [1357] (2,3] (2,3] (2,3] [1,2] [1,2] (4,5] (4,5] (3,4] (3,4] (5,6] [1,2] (2,3]
## [1369] (2,3] (4,5] (5,6] (2,3] (5,6] (5,6] (2,3] (2,3] (2,3] (5,6] [1,2] (4,5]
## [1381] (2,3] (4,5] (3,4] (3,4] (5,6] (4,5] (5,6] [1,2] (4,5] [1,2] (3,4] (3,4]
## [1393] (2,3] (3,4] (5,6] [1,2] (4,5] (2,3] [1,2] [1,2] (5,6] (5,6] (5,6] (5,6]
## [1405] [1,2] (2,3] (4,5] (3,4] (3,4] (2,3] (3,4] (3,4] [1,2] (3,4] (3,4] (3,4]
## [1417] (2,3] (4,5] [1,2] (2,3] (4,5] (3,4] (2,3] (4,5] (3,4] (4,5] (4,5] (4,5]
## [1429] (3,4] [1,2] (2,3] (3,4] (3,4] (3,4] (2,3] [1,2] (3,4] (2,3] (4,5] [1,2]
## [1441] (3,4] (5,6] [1,2] (3,4] [1,2] (4,5] (3,4] (2,3] (3,4] (5,6] [1,2] [1,2]
## [1453] (5,6] (3,4] (5,6] (3,4] (5,6] (3,4] (4,5] (5,6] (3,4] [1,2] (2,3] [1,2]
## [1465] (2,3] (2,3] (3,4] (3,4] (3,4] (4,5] [1,2] [1,2] [1,2] (3,4] (2,3] (2,3]
## [1477] (2,3] (5,6] [1,2] (4,5] (4,5] (4,5] (5,6] [1,2] [1,2] (5,6] (3,4] (3,4]
## [1489] (4,5] (4,5] (5,6] (5,6] (4,5] (2,3] (5,6] [1,2] (2,3] (5,6] (2,3] (2,3]
## [1501] [1,2] (5,6] (3,4] (4,5] (2,3] (4,5] (4,5] (2,3] (3,4] [1,2] (5,6] (4,5]
## [1513] (5,6] (2,3] (4,5] (4,5] (4,5] (5,6] (2,3] [1,2] (4,5] (4,5] (3,4] [1,2]
## [1525] (3,4] (2,3] (3,4] (4,5] (4,5] (2,3] (2,3] (2,3] [1,2] (4,5] (5,6] (2,3]
## [1537] (4,5] (5,6] (5,6] [1,2] (5,6] (2,3] (2,3] [1,2] (3,4] [1,2] (2,3] (2,3]
## [1549] (4,5] (5,6] (2,3] (5,6] (5,6] (4,5] [1,2] (4,5] (5,6] (4,5] (2,3] (3,4]
## [1561] (4,5] (3,4] [1,2] (2,3] (4,5] (5,6] [1,2] (5,6] (2,3] (4,5] (4,5] (5,6]
## [1573] (5,6] (2,3] (5,6] [1,2] (4,5] (4,5] (4,5] (2,3] (5,6] [1,2] [1,2] (4,5]
## [1585] (3,4] (5,6] (2,3] [1,2] (5,6] (3,4] [1,2] (4,5] (3,4] (3,4] (3,4] (5,6]
## [1597] (5,6] (4,5] [1,2] (5,6] (4,5] (4,5] (2,3] (5,6] (4,5] [1,2] (2,3] (5,6]
## [1609] [1,2] (5,6] (4,5] (4,5] (2,3] (2,3] (5,6] (2,3] (4,5] (2,3] [1,2] [1,2]
## [1621] (3,4] (5,6] (2,3] (2,3] (2,3] (3,4] (3,4] (5,6] (3,4] (3,4] [1,2] (5,6]
## [1633] (2,3] [1,2] (4,5] (3,4] (3,4] (3,4] (4,5] [1,2] (5,6] (4,5] (3,4] (3,4]
## [1645] (2,3] (4,5] (3,4] (2,3] (3,4] (5,6] (3,4] (5,6] (2,3] [1,2] [1,2] (3,4]
## [1657] (2,3] [1,2] (5,6] (5,6] (4,5] [1,2] [1,2] [1,2] (4,5] (5,6] (3,4] [1,2]
## [1669] (3,4] (2,3] (2,3] (4,5] (4,5] [1,2] [1,2] (5,6] (2,3] [1,2] [1,2] [1,2]
## [1681] (2,3] (4,5] (2,3] (3,4] (4,5] (3,4] (5,6] (5,6] [1,2] (4,5] (3,4] (5,6]
## [1693] (3,4] (5,6] (4,5] (2,3] (3,4] (5,6] (5,6] [1,2] (4,5] (2,3] [1,2] (2,3]
## [1705] (2,3] (5,6] (2,3] (5,6] [1,2] (2,3] (2,3] (2,3] [1,2] [1,2] (3,4] (2,3]
## [1717] (3,4] (2,3] (5,6] (5,6] (3,4] (2,3] [1,2] (5,6] [1,2] (2,3] (2,3] (2,3]
## [1729] [1,2] (4,5] [1,2] (4,5] [1,2] [1,2] (5,6] [1,2] (5,6] (3,4] [1,2] (5,6]
## [1741] (2,3] (5,6] [1,2] (5,6] [1,2] (3,4] (4,5] (5,6] (5,6] (5,6] (5,6] [1,2]
## [1753] (2,3] (2,3] (2,3] (2,3] (3,4] [1,2] (4,5] [1,2] (2,3] (3,4] (4,5] (4,5]
## [1765] (4,5] [1,2] (3,4] [1,2] (2,3] (3,4] [1,2] (2,3] (5,6] (5,6] (2,3] [1,2]
## [1777] [1,2] (2,3] (5,6] [1,2] (4,5] [1,2] (5,6] (2,3] (4,5] (2,3] (4,5] [1,2]
## [1789] [1,2] (5,6] (5,6] (5,6] (4,5] (4,5] [1,2] (2,3] (2,3] (4,5] (2,3] [1,2]
## [1801] (3,4] (5,6] (2,3] [1,2] [1,2] (2,3] (2,3] (4,5] (3,4] (4,5] (2,3] (5,6]
## [1813] [1,2] (3,4] (4,5] [1,2] [1,2] (5,6] (2,3] (4,5] [1,2] (4,5] (2,3] [1,2]
## [1825] (3,4] (2,3] (2,3] [1,2] [1,2] (2,3] [1,2] (5,6] [1,2] (3,4] [1,2] (2,3]
## [1837] (5,6] [1,2] (5,6] [1,2] (4,5] (3,4] (5,6] (3,4] (3,4] [1,2] [1,2] (5,6]
## [1849] (2,3] (2,3] (4,5] (2,3] (5,6] (4,5] (3,4] (5,6] [1,2] (2,3] (3,4] (2,3]
## [1861] (4,5] (5,6] (3,4] (2,3] (5,6] (3,4] (3,4] (2,3] (5,6] (3,4] (4,5] (5,6]
## [1873] (2,3] (3,4] (5,6] (2,3] (4,5] (5,6] (4,5] (4,5] (4,5] (5,6] (2,3] [1,2]
## [1885] (2,3] (4,5] (3,4] (4,5] (2,3] (4,5] [1,2] (4,5] (3,4] [1,2] (2,3] (4,5]
## [1897] (3,4] (2,3] (5,6] (4,5] (5,6] (3,4] (3,4] (5,6] (3,4] (4,5] (2,3] (3,4]
## [1909] [1,2] [1,2] [1,2] [1,2] (5,6] (2,3] (4,5] (5,6] (3,4] [1,2] (4,5] (3,4]
## [1921] (4,5] (4,5] (5,6] (3,4] (2,3] (4,5] [1,2] (5,6] [1,2] (2,3] (5,6] (3,4]
## [1933] (2,3] (3,4] (5,6] (2,3] (5,6] [1,2] (4,5] (5,6] [1,2] (3,4] [1,2] (4,5]
## [1945] (3,4] (4,5] [1,2] (2,3] [1,2] (2,3] (3,4] (5,6] (4,5] (3,4] (5,6] (4,5]
## [1957] (5,6] (3,4] (2,3] [1,2] (4,5] [1,2] (2,3] (3,4] (3,4] (3,4] [1,2] (2,3]
## [1969] (4,5] (5,6] (4,5] (5,6] (4,5] (3,4] [1,2] (4,5] (4,5] (3,4] (3,4] (3,4]
## [1981] (2,3] (3,4] [1,2] (4,5] [1,2] [1,2] (3,4] (4,5] (3,4] (2,3] (3,4] (2,3]
## [1993] (5,6] (5,6] (3,4] (2,3] (4,5] [1,2] (3,4] (2,3] (5,6] [1,2] (3,4] (4,5]
## [2005] (3,4] [1,2] (5,6] (3,4] (4,5] (2,3] (3,4] (3,4] [1,2] [1,2] (5,6] (2,3]
## [2017] [1,2] (3,4] (4,5] [1,2] (3,4] [1,2] [1,2] [1,2] (5,6] [1,2] [1,2] (3,4]
## [2029] (5,6] (2,3] (3,4] [1,2] (3,4] (3,4] (3,4] (2,3] (2,3] [1,2] (2,3] [1,2]
## [2041] (4,5] (5,6] (5,6] (5,6] (3,4] (4,5] (2,3] (4,5] (3,4] (3,4] (4,5] (2,3]
## [2053] (2,3] (5,6] [1,2] (3,4] (5,6] (4,5] (3,4] (2,3] (2,3] (5,6] (3,4] (3,4]
## [2065] [1,2] [1,2] (5,6] (2,3] (3,4] [1,2] (4,5] (5,6] (3,4] [1,2] (3,4] (4,5]
## [2077] (2,3] (5,6] (4,5] (5,6] (4,5] [1,2] (2,3] [1,2] (5,6] (4,5] (4,5] (2,3]
## [2089] [1,2] (4,5] (3,4] (2,3] (4,5] [1,2] (2,3] (3,4] [1,2] (5,6] [1,2] [1,2]
## [2101] [1,2] (4,5] (3,4] (3,4] [1,2] [1,2] (3,4] (5,6] (5,6] [1,2] (3,4] (5,6]
## [2113] (2,3] (5,6] [1,2] (5,6] (4,5] (5,6] (4,5] (2,3] (5,6] (2,3] (2,3] (4,5]
## [2125] (4,5] (5,6] [1,2] (4,5] (4,5] [1,2] (2,3] (2,3] (2,3] (5,6] (4,5] (4,5]
## [2137] (5,6] (2,3] (4,5] (3,4] (5,6] [1,2] (5,6] (2,3] (2,3] (4,5] (2,3] (3,4]
## [2149] (3,4] (4,5] (2,3] [1,2] (2,3] (3,4] [1,2] (2,3] (2,3] [1,2] (3,4] (5,6]
## [2161] [1,2] (3,4] (4,5] (3,4] (4,5] (3,4] (3,4] [1,2] (4,5] (4,5] [1,2] (2,3]
## [2173] (5,6] (3,4] (3,4] (5,6] (4,5] (3,4] (4,5] (5,6] (3,4] (3,4] (2,3] (5,6]
## [2185] (4,5] [1,2] (5,6] (3,4] [1,2] (3,4] (3,4] (5,6] [1,2] (5,6] (3,4] [1,2]
## [2197] (5,6] (3,4] (2,3] (3,4] (5,6] (2,3] [1,2] [1,2] (2,3] (4,5] (3,4] (2,3]
## [2209] [1,2] (2,3] (5,6] (2,3] (5,6] (3,4] [1,2] (5,6] (3,4] (4,5] (5,6] [1,2]
## [2221] [1,2] (4,5] (2,3] [1,2] [1,2] [1,2] (4,5] [1,2] (3,4] (3,4] (3,4] [1,2]
## [2233] (4,5] [1,2] (4,5] (5,6] (3,4] (3,4] (3,4] (2,3] (5,6] (5,6] (2,3] (4,5]
## [2245] (5,6] (5,6] (3,4] (3,4] (2,3] (5,6] [1,2] (3,4] (2,3] (2,3] (2,3] (5,6]
## [2257] [1,2] (3,4] [1,2] [1,2] (3,4] (3,4] (2,3] (2,3] [1,2] (2,3] (5,6] (5,6]
## [2269] (2,3] (3,4] (5,6] [1,2] (5,6] (5,6] [1,2] [1,2] (5,6] (3,4] [1,2] (2,3]
## [2281] (3,4] (4,5] (4,5] (5,6] (2,3] (3,4] (3,4] (2,3] [1,2] (5,6] (5,6] (3,4]
## [2293] (3,4] (2,3] (3,4] (4,5] (3,4] (5,6] (4,5] (2,3] (4,5] [1,2] (2,3] (2,3]
## [2305] (3,4] (4,5] (3,4] (4,5] (3,4] (2,3] (4,5] (2,3] (2,3] (3,4] (2,3] [1,2]
## [2317] (4,5] (3,4] (3,4] (5,6] (3,4] (5,6] [1,2] (3,4] (5,6] (3,4] (4,5] (2,3]
## [2329] [1,2] (3,4] (2,3] (5,6] (2,3] (5,6] (5,6] (2,3] (2,3] (5,6] (5,6] (3,4]
## [2341] (2,3] (3,4] (4,5] (2,3] (4,5] [1,2] [1,2] (2,3] (2,3] (2,3] (3,4] (2,3]
## [2353] [1,2] (2,3] (5,6] (3,4] (3,4] (3,4] (5,6] (2,3] (4,5] (4,5] (3,4] [1,2]
## [2365] (4,5] [1,2] (3,4] (4,5] (2,3] (5,6] [1,2] (5,6] (3,4] (2,3] [1,2] (5,6]
## [2377] [1,2] [1,2] (2,3] (4,5] (3,4] [1,2] (2,3] (2,3] (2,3] (3,4] (4,5] (2,3]
## [2389] (2,3] (2,3] (5,6] (5,6] (4,5] (2,3] [1,2] (2,3] (2,3] (3,4] (4,5] (5,6]
## [2401] (5,6] (2,3] (4,5] (2,3] [1,2] (4,5] [1,2] (2,3] (2,3] (4,5] (4,5] (2,3]
## [2413] (5,6] (2,3] (3,4] (4,5] (4,5] (5,6] (2,3] (4,5] (3,4] (5,6] [1,2] (4,5]
## [2425] (3,4] (2,3] (3,4] (2,3] (3,4] (5,6] (3,4] (4,5] (3,4] [1,2] (2,3] (3,4]
## [2437] (2,3] [1,2] (3,4] (2,3] (2,3] (3,4] [1,2] (5,6] (5,6] (4,5] [1,2] (4,5]
## [2449] (4,5] (4,5] [1,2] (4,5] (5,6] (3,4] (4,5] (3,4] (3,4] [1,2] (4,5] [1,2]
## [2461] (3,4] (2,3] (3,4] [1,2] (4,5] (4,5] [1,2] [1,2] [1,2] (5,6] (3,4] (3,4]
## [2473] [1,2] (4,5] (5,6] (5,6] (4,5] [1,2] [1,2] [1,2] (2,3] [1,2] (2,3] (2,3]
## [2485] (5,6] (4,5] (5,6] (4,5] [1,2] (4,5] (2,3] (4,5] (2,3] (5,6] (2,3] (2,3]
## [2497] (5,6] [1,2] (4,5] (4,5]
## Levels: [1,2] (2,3] (3,4] (4,5] (5,6]
#Lập bảng tần số số lượng xe tương ứng với từng mức dung tích động cơ
table(cut(car_price_prediction_$Engine.Size,breaks = c(1.0,2.0,3.0,4.0,5.0,6.0),right=T,include.lowest = T))
## 
## [1,2] (2,3] (3,4] (4,5] (5,6] 
##   530   527   507   480   456
#Tính tỉ lệ số chiếc xe có dung tích động cơ trong khoảng (2.0;3.0].
527/(530+527+507+480+456)
## [1] 0.2108
#Vẽ biểu đồ phân phối tần số cho dung tích động cơ xe.
hist(car_price_prediction_$Engine.Size)

#Nhận xét:
#- Dữ liệu phân phối tương đối đều.
#- Tần suất tập trung nhiều ở khoảng 1.0-2.0 cho thấy các dòng xe có dung tích nhỏ (1.0-2.0) chiếm số lượng lớn.
#- Tần suất có dấu hiệu giảm nhẹ khi dung tích động cơ tăng dần.

knitr::opts_chunk$set(echo = TRUE)

Câu 2: Tính toán các đại lượng thống kê mô tả:

  1. Tính số chiếc xe có số dặm đi trên 100000 dặm
sum(car_price_prediction_$Mileage>100000)
## [1] 1658
knitr::opts_chunk$set(echo = TRUE)
  1. Tính trung vị và mode của dung tích động cơ xe
median(car_price_prediction_$Engine.Size)
## [1] 3.4
#NX: Có khoảng 50% số chiếc xe có dung tích động cơ nhỏ hơn 3.4 và có khoảng 50% chiếc xe có dung tích động cơ lớn hơn 3.4
which(table(car_price_prediction_$Engine.Size)==max(table(car_price_prediction_$Engine.Size)))
## 1.3 
##   4
# NX: Dung tích động cơ xe có giá trị là 1.3 xuất hiện nhiều lần nhất với 4 lần xuất hiện
  1. Tính giá trung bình của thương hiệu xe Ford có tình trạng xe là Used.
# Lọc ra tập con giá của xe Ford 
c<- subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Ford")
# Tính trung bình giá của tập con đó
mean(c)
## [1] 51593.25
  1. Tính tỉ lệ số chiếc xe có model là Fiesta có dung tích động cơ trên 2.5 lít trên tổng số xe model là Fiesta.
# Tính tổng số chiếc xe có model là Fiesta có dung tích động cơ trên 2.5 lít
sum(car_price_prediction_$Model=="Fiesta"&car_price_prediction_$Engine.Size>2.5)
## [1] 71
# Tính tổng số chiếc xe có model là Fiesta
sum(car_price_prediction_$Model=="Fiesta")
## [1] 103
# Tính tỉ lệ
71/103
## [1] 0.6893204
  1. Tính các tham số mô tả sự phân bố của dung tích động cơ xe: tứ phân vị, phân vị thứ 30,60,90 của dung tích động cơ xe. Nêu ý nghĩa cho những giá trị này.
# Tứ phân vị
summary(car_price_prediction_$Engine.Size)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.200   3.400   3.465   4.700   6.000
# Ý nghĩa tứ phân vị
#Tứ phân vị thứ nhất: 25% số xe có dung tích động cơ (Engine Size) nhỏ hơn hoặc bằng 2.2.
#Tứ phân vị thứ 2: 50% số xe có dung tích động cơ nhỏ hơn hoặc bằng 3.4
#Tứ phân vị thứ 3: 75% số xe có dung tích động cơ nhỏ hơn hoặc bằng 4.7
#Tính các phân vị thứ 30, 60, 90
quantile(car_price_prediction_$Engine.Size,30/100)
## 30% 
## 2.5
quantile(car_price_prediction_$Engine.Size,60/100)
## 60% 
## 3.9
quantile(car_price_prediction_$Engine.Size,90/100)
## 90% 
## 5.5
# Ý nghĩa các phân vị thứ 30
# Phân vị thứ 30 chia dung tích động cơ xe thành 2 phần, phần nhỏ hơn 2.5 chiếm 30%, phần lớn hơn 2.5 chiếm 70%
  1. Tính các tham số mô tả sự phân tán của giá xe: khoảng biến thiên, độ trải giữa, phương sai, và độ lệch chuẩn giá xe
# Khoảng biến thiên
range(car_price_prediction_$Price)
## [1]  5011.27 99982.59
# Độ trải giữa q3-q1
summary(car_price_prediction_$Price)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5011   28908   53485   52638   75839   99983
# Phương sai
var(car_price_prediction_$Price)
## [1] 745062524
# Độ lệch chuẩn
sd(car_price_prediction_$Price)
## [1] 27295.83

câu 3 :Các bài toán ước lượng điểm, ước lượng khoảng: trung bình, tỷ lệ:

  1. Tìm ước lượng điểm cho trung bình dung tích động cơ của tất cả các xe.
mean(car_price_prediction_$Engine.Size)
## [1] 3.46524
  1. Tìm ước lượng điểm cho phương sai giá xe của dòng xe có loại hộp số tự động (Automatic).
# Lọc ra tập con giá của dòng xe có loại hộp số tự động (Automatic): 
auto=subset(car_price_prediction_$Price,car_price_prediction_$Transmission=="Automatic")
# Tính phương sai của tập con
var(auto)
## [1] 731159201
  1. Tìm ước lượng điểm cho tỉ lệ giá xe có giá cao hơn 70.000$.
# Tính số chiếc xe có giá cao hơn 70000$
sum(car_price_prediction_$Price>70000)
## [1] 801
# Tính số chiếc xe 
length(car_price_prediction_$Price)
## [1] 2500
#Tính tỉ lệ
801/2500
## [1] 0.3204
  1. Tìm khoảng tin cậy 90% cho tỷ lệ xe có tình trạng Like New
# Tính số chiếc xe có tình trạng là Like New
sum(car_price_prediction_$Condition=="Like New")
## [1] 836
# Tính số chiếc xe
length(car_price_prediction_$Condition)
## [1] 2500
# Tính khoảng tin cậy 90% cho tỉ lệ
prop.test(836,2500,conf.level = 0.9)
## 
##  1-sample proportions test with continuity correction
## 
## data:  836 out of 2500, null probability 0.5
## X-squared = 273.57, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 90 percent confidence interval:
##  0.3188687 0.3502939
## sample estimates:
##      p 
## 0.3344
# Nhận xét: Khoảng tin cậy 90% cho tỉ lệ số chiếc xe có tình trạng Like New nằm trong khoảng từ 0.3188687 đến 0.3502939.
  1. Tìm khoảng tin cậy 95% cho trung bình dung tích động cơ của hãng xe Mercedes.
# Lọc ra tập con về dung tích động cơ của xe có thương hiệu Mercedes: 
subset(car_price_prediction_$Engine.Size,car_price_prediction_$Brand=="Mercedes")
##   [1] 4.5 3.9 2.3 5.9 3.9 4.1 2.2 5.8 2.3 4.2 2.2 4.5 4.2 3.5 3.5 4.8 1.8 1.6
##  [19] 4.7 2.2 1.3 3.7 1.1 4.1 1.0 3.4 2.7 1.4 1.3 1.4 3.2 2.8 4.5 1.0 4.1 5.5
##  [37] 3.9 2.2 3.5 1.9 2.4 1.2 1.3 1.1 2.2 4.8 4.8 5.3 6.0 5.6 1.3 4.4 4.4 2.9
##  [55] 5.7 1.8 4.5 4.0 3.4 1.8 2.4 3.1 5.9 1.3 5.9 1.8 1.7 2.7 3.5 1.4 2.5 3.1
##  [73] 4.3 5.3 5.2 3.0 3.9 1.9 5.2 5.0 5.4 3.4 2.5 3.3 4.8 1.8 2.0 2.7 3.5 2.6
##  [91] 2.6 1.0 2.4 2.7 1.6 4.3 1.9 2.8 5.1 2.1 2.9 3.4 4.6 1.4 4.1 5.1 3.5 5.8
## [109] 4.8 5.2 2.6 1.2 2.7 2.5 1.1 1.8 5.6 3.9 4.5 1.5 4.8 1.7 2.8 4.5 4.4 5.1
## [127] 2.8 1.4 6.0 4.1 5.3 4.4 1.1 2.3 5.9 4.7 4.0 2.3 3.0 4.6 4.4 2.5 2.6 3.8
## [145] 2.3 1.1 3.8 2.9 1.9 5.1 4.8 3.5 1.4 3.5 3.9 1.9 3.8 2.8 2.6 4.8 4.5 2.7
## [163] 2.9 3.3 2.8 1.6 5.4 2.9 3.4 3.9 5.4 3.9 5.0 1.8 4.6 3.6 3.4 5.9 4.0 5.1
## [181] 3.9 4.0 5.8 4.0 2.1 2.9 1.4 3.9 1.2 1.8 5.7 2.9 3.4 3.1 3.0 1.9 5.0 3.9
## [199] 4.5 3.1 3.9 3.4 4.7 3.8 4.5 3.4 5.5 2.3 3.8 3.6 5.4 3.3 5.4 2.1 1.7 4.8
## [217] 2.0 4.9 3.0 1.7 2.3 5.4 4.2 3.6 1.7 2.6 4.5 2.8 4.4 5.7 4.9 2.8 3.5 1.7
## [235] 2.2 3.1 4.0 1.3 5.2 4.6 1.9 3.0 3.2 4.5 2.2 5.1 2.9 5.3 1.1 3.5 2.9 3.1
## [253] 2.0 5.6 2.9 5.1 1.4 5.8 3.7 4.7 1.2 2.1 2.8 5.2 4.1 4.7 1.3 2.8 5.5 2.3
## [271] 1.6 4.0 3.9 3.4 5.3 5.3 4.6 2.5 3.2 2.7 1.1 3.1 3.2 5.9 3.3 3.4 1.1 2.9
## [289] 3.0 5.5 1.9 2.1 1.2 2.0 2.9 2.4 5.0 5.3 4.8 1.8 3.1 4.6 5.8 1.3 2.5 3.3
## [307] 2.0 2.1 2.7 5.9 4.6 1.9 4.9 4.9 5.5 5.5 4.1 5.6 3.9 2.3 2.5 2.7 4.5 6.0
## [325] 4.0 3.7 2.9 3.2 2.1 1.0 4.6 2.7 3.2 3.5 3.9 4.7 2.2 3.0 2.8 4.5 1.0 2.5
## [343] 3.2 4.6 4.3 2.4 1.5 4.9 5.2 2.5 1.4 2.9 2.3
# Tìm khoảng tin cậy 95% cho trung bình
t.test(subset(car_price_prediction_$Engine.Size,car_price_prediction_$Brand=="Mercedes"),conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  subset(car_price_prediction_$Engine.Size, car_price_prediction_$Brand == "Mercedes")
## t = 46.346, df = 352, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  3.254903 3.543397
## sample estimates:
## mean of x 
##   3.39915
# Nhận xét: Khoảng tin cậy 95% cho trung bình dung tích động cơ của hãng xe Mercedes đi từ  3.254903 đến 3.543397.

câu 4 : Các bài toán kiểm định tham số 1 tổng thể: trung bình, tỷ lệ.

  1. Kiểm định giả thuyết: tại mức ý nghĩa 5%, trung bình giá của thương hiệu xe Audi cao hơn 45.000 $.
# Gọi M là trung bình giá của thương hiệu xe Audi.
# H0: M<=45000
# H1: M>45000
# Lọc ra tập con cho giá của xe Audi
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi")
##   [1] 44402.61 88969.76 63498.75 70193.74 75044.95 82480.40 54201.18 71972.18
##   [9] 19993.56 40422.68 19379.29 96903.15 26352.59 88047.31 30103.17 81623.45
##  [17] 53463.16  7494.40 48517.86 43341.00 23011.57 65510.97 57608.77 46849.57
##  [25] 65248.06 75349.30 37290.10  9730.07 85719.15 95644.79 27057.55 60799.03
##  [33] 94917.73 38018.04 53772.43 91080.62 21684.35 14031.19 69032.18 11508.22
##  [41] 96270.31 66410.90 71685.59 34240.31 45172.66  6629.41 91162.56 96779.22
##  [49] 30896.46 59939.22  9660.54 43837.32 70814.24 19070.54 58953.97 64367.04
##  [57] 29756.80 30659.10 43071.10 72925.19 93890.40 86583.65 53545.84 63548.00
##  [65] 48799.65 97156.13 93026.99 66129.83 61503.74 36037.38 69387.25 45927.65
##  [73] 80568.22 53144.42 54041.95 64529.38 34075.55 30691.24 33214.51 98153.00
##  [81] 36432.36 85693.40  9701.08 33145.63 44681.71 44060.29 79507.15 90488.55
##  [89] 17432.03 67655.38 52854.61 11829.50 68363.56 49436.04 61889.23 73497.00
##  [97] 66073.98 50507.25 12490.66 31455.83 14086.62 97818.68  9943.59 85737.79
## [105] 28497.74 15212.37 86918.43 20134.21 62280.02 20868.82 85376.31 18275.36
## [113] 42066.22 80236.67 35070.17 63236.33 53199.72 74765.48 16479.84 36089.69
## [121] 42176.97 96558.64 35550.89 39517.99 83183.16 24602.19 16465.29  5011.27
## [129]  6740.34 71028.74 97808.48 40608.90 28199.42 49926.83 98330.26 86181.92
## [137] 62043.29 94943.29 45274.04 25255.35 70370.49 96173.37 97261.57 56072.54
## [145] 51732.06 10870.41 52649.97 87327.78 32778.28 43215.92 66332.39 28608.80
## [153] 43037.42 15495.96 71072.92  7975.57 16289.72 16394.32 59123.34 97771.60
## [161] 94827.57 11200.65 34513.51 63510.95  8434.50 58196.10 76515.33 39870.93
## [169] 71976.90 72208.89 27143.94 41249.71 30530.96 14406.85  8046.13 37728.83
## [177] 42453.41  7581.53 48820.70 56223.94 92834.17 77050.35 10557.62 57578.84
## [185] 38371.45 11375.30 45053.87 42462.69 35068.17 34109.11 23914.16 85753.79
## [193] 30833.31 55278.28  5947.24 34979.46  9455.33 44365.11 32342.86 28598.53
## [201] 70055.56 46076.33 38523.40 66972.89 21833.41 49105.69 46543.12 59286.67
## [209] 28322.67 28532.54 81937.80 23781.30 27099.99 82246.19 39255.57 78189.24
## [217] 31567.83 38681.70 65541.58 79831.68 90768.57 48283.02 71982.59 61508.19
## [225] 41932.64 52840.27 15573.09 31546.34 94733.24 43411.36 93363.35 70291.28
## [233] 20352.91 97082.99 67863.46 89229.15 94355.25 71894.70  8192.92 82335.21
## [241] 29039.01 61282.10 99541.32 89147.36 97323.32 15004.69 10455.23 65767.89
## [249] 99982.59 62884.66 93926.98 26081.98 37067.94 57910.10 25909.03 90502.81
## [257] 63472.77 42017.31 59265.27 76807.97 89579.85 21080.81 25820.35 17876.40
## [265] 67396.71 69605.40 18856.62 95709.72 18452.24 86782.66  7550.55 92983.85
## [273] 45622.62 94116.90 63260.96 89526.99 33688.28 46044.85 16615.92 10605.99
## [281] 22795.31  5703.33 98137.19 40923.43 44094.52 29118.37 36473.19 59071.61
## [289] 30076.84  8665.69  9583.19 20207.19 54493.53 71681.54 47839.71 70699.19
## [297] 72440.13 77048.81 36792.44 96651.49 10876.84  7283.66 32163.12 79194.62
## [305] 23028.99 75446.31 36871.76 79429.51 90416.60 70640.74 69845.31 73838.03
## [313] 37000.75 59744.06 51425.19 44837.96 47677.53 46049.78 58403.72 49201.46
## [321] 18936.55 90175.23  5022.86 59627.42 15372.95 54899.83 97144.03 16960.31
## [329] 48014.73 98042.59 48589.93 40146.82 90253.66  6290.25 80306.54 70529.86
## [337] 71954.76 60358.76 19175.06 88895.86 21661.92 32454.14 80961.53 20796.06
## [345] 48228.10 41658.67 59181.58 71095.80 45658.69 45964.04 93779.23 72824.50
## [353] 40899.14 87061.94 23092.76 98346.28 73463.68 60287.13 54765.09 82920.85
## [361] 14068.95 48185.43 32351.06 15126.76 98434.45 61384.10 24710.35 46085.67
# chạy lệnh
t.test(subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi"),mu=45000,alt="g")
## 
##  One Sample t-test
## 
## data:  subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Audi")
## t = 4.8702, df = 367, p-value = 8.303e-07
## alternative hypothesis: true mean is greater than 45000
## 95 percent confidence interval:
##  49599.03      Inf
## sample estimates:
## mean of x 
##  51953.42
# Nhận xét: p-value = 8.303e-07 < 0.05 
# => Bác bỏ H0 
# KL: Ở mức ý nghĩa 5%, có thể cho rằng trung bình giá của thương hiệu xe Audi cao hơn 45000$.
  1. Kiểm định giả thuyết: tại mức ý nghĩa 10%, trung bình dung tích động cơ xe có tình trạng New dưới 3.5 lít.
# Gọi M là trung bình dung tích động cơ xe có tình trạng New.
# H0: M>=3.5
# H1: M<3.5
# Lọc ra tập con dung tích động cơ của xe có tình trạng New
subset(car_price_prediction_$Engine.Size,car_price_prediction_$Condition=="New")
##   [1] 2.3 4.5 4.1 5.3 4.7 2.0 4.5 3.0 1.1 3.3 5.8 3.0 4.4 2.3 3.2 1.0 3.9 4.1
##  [19] 2.0 5.4 3.3 4.0 4.4 5.0 5.7 3.7 1.3 5.6 3.9 3.7 2.3 2.8 5.7 3.2 3.5 1.9
##  [37] 5.4 2.5 3.7 2.8 2.8 5.1 4.9 5.8 2.8 5.7 1.5 3.0 2.0 3.2 4.1 4.4 1.6 1.8
##  [55] 4.0 1.3 2.2 3.7 3.5 3.1 4.2 3.5 3.1 3.4 4.4 1.0 3.7 5.3 2.9 1.3 2.9 4.2
##  [73] 1.4 2.9 3.2 3.8 2.6 2.8 3.3 4.6 4.3 1.0 3.4 5.0 4.4 4.1 4.7 1.8 4.6 2.4
##  [91] 2.2 1.9 4.5 2.9 5.0 4.5 4.5 3.2 2.3 1.2 2.6 5.1 2.2 1.3 1.5 6.0 4.7 5.0
## [109] 6.0 2.2 4.9 1.2 3.9 4.5 2.1 5.6 2.1 5.9 1.3 5.7 1.8 4.2 4.3 1.1 4.9 5.2
## [127] 5.0 5.8 3.0 5.6 4.0 1.3 1.2 4.0 5.4 5.4 4.3 5.3 1.2 2.7 5.9 5.3 1.4 2.1
## [145] 3.3 2.3 1.7 4.8 2.4 5.0 2.6 2.8 1.3 1.7 2.4 4.6 3.9 4.3 4.9 3.7 3.5 2.6
## [163] 4.8 2.0 5.8 1.9 3.9 3.4 1.9 1.9 5.1 5.6 2.8 5.2 1.9 4.4 2.3 3.3 1.2 2.5
## [181] 2.0 5.5 3.3 3.0 5.6 3.5 1.3 1.2 1.8 2.2 4.6 1.6 4.0 3.0 1.6 4.4 3.6 2.2
## [199] 5.7 5.7 5.4 2.4 1.1 6.0 3.2 2.7 5.2 1.8 5.8 3.5 4.3 4.8 5.1 4.8 5.5 2.6
## [217] 2.0 5.2 1.6 3.5 3.7 5.7 5.5 5.0 2.1 4.0 1.5 3.8 5.7 5.9 2.3 1.3 4.5 2.1
## [235] 3.9 2.8 5.1 2.8 5.0 3.3 3.4 5.2 2.9 3.3 2.5 5.7 4.4 3.4 3.0 1.8 5.9 3.8
## [253] 4.6 1.3 3.1 5.7 4.3 1.4 2.8 4.1 2.3 1.5 1.9 1.8 5.4 2.2 5.8 4.2 3.0 4.4
## [271] 4.7 5.1 1.7 3.7 5.2 2.9 2.5 3.9 2.4 6.0 4.3 1.9 1.8 1.9 1.5 4.0 1.8 1.1
## [289] 5.2 1.7 3.1 3.9 3.0 4.9 5.9 4.5 5.5 3.7 5.4 1.4 4.8 3.5 3.2 3.0 3.6 1.7
## [307] 2.3 2.8 1.3 2.0 2.1 5.1 4.4 1.8 2.4 1.8 5.3 3.3 3.1 2.7 5.1 3.8 4.9 6.0
## [325] 4.8 1.6 5.9 5.2 2.6 4.4 3.9 2.4 5.6 2.7 1.1 1.9 1.3 3.8 1.4 2.7 3.0 4.5
## [343] 1.1 4.6 3.8 1.7 4.6 1.6 4.0 2.6 5.1 2.6 2.5 1.6 3.9 4.5 4.8 4.7 1.9 1.1
## [361] 2.0 3.7 1.4 5.0 2.8 1.9 5.6 1.3 4.5 3.1 2.3 1.6 5.8 1.3 2.7 3.3 1.6 2.9
## [379] 1.8 3.4 3.0 2.7 1.6 3.0 2.0 3.8 4.0 5.4 3.9 5.5 2.5 1.8 1.4 4.8 1.4 4.9
## [397] 2.4 5.7 4.6 1.2 1.1 5.1 4.2 4.0 5.5 3.2 2.8 5.0 5.1 4.2 4.1 2.1 1.9 3.4
## [415] 1.7 1.3 1.4 3.9 3.8 5.4 3.8 5.8 1.2 3.7 5.7 2.5 1.4 3.6 1.0 5.8 2.6 2.2
## [433] 1.9 5.6 1.4 5.4 3.0 5.9 1.9 4.5 1.7 6.0 5.4 2.8 4.3 3.9 1.8 2.3 4.1 3.4
## [451] 3.1 3.6 2.4 4.7 3.9 1.5 3.6 5.5 5.3 5.1 4.7 3.9 1.9 2.3 3.9 3.1 5.1 4.3
## [469] 5.4 3.3 4.3 5.7 5.4 4.4 2.2 2.6 3.1 4.2 5.7 3.0 4.6 3.9 2.0 4.7 2.2 3.0
## [487] 2.0 4.9 4.8 3.4 2.2 5.3 4.4 2.7 5.1 1.8 1.3 3.4 5.2 1.9 4.6 3.6 3.3 5.1
## [505] 5.4 1.6 1.2 4.2 5.7 3.0 3.7 2.8 2.7 5.4 3.5 3.5 1.7 3.1 3.3 4.8 3.6 2.6
## [523] 4.0 1.6 3.2 1.6 3.6 2.9 4.1 1.6 3.7 5.3 1.5 4.5 2.7 1.0 1.3 2.9 5.8 1.3
## [541] 2.5 2.5 1.4 5.1 3.7 4.8 5.7 5.5 2.0 3.0 1.8 2.6 5.0 2.9 3.1 1.2 2.4 2.8
## [559] 5.7 1.5 2.9 1.7 5.6 5.4 5.0 1.3 2.6 2.8 4.0 5.1 2.9 4.0 2.0 1.5 4.4 4.5
## [577] 4.0 2.9 1.4 5.6 2.5 1.8 2.0 4.7 3.8 3.7 1.8 4.7 4.0 1.2 3.3 2.1 3.1 2.7
## [595] 2.8 2.8 5.0 4.1 4.7 5.2 1.3 3.3 2.8 1.9 2.5 4.7 3.4 4.5 3.2 4.6 3.9 4.2
## [613] 1.3 2.6 3.4 5.2 1.9 4.5 4.2 3.2 2.3 4.6 1.6 4.0 5.8 4.6 4.0 4.3 3.4 2.7
## [631] 3.6 2.0 1.9 3.8 5.6 1.2 3.8 2.2 3.4 1.2 2.3 1.2 3.2 3.9 2.6 1.5 5.8 2.4
## [649] 3.3 5.6 3.4 5.6 3.8 5.8 4.0 4.2 4.1 4.8 4.8 3.3 5.9 2.0 1.7 4.8 3.8 1.1
## [667] 1.7 5.7 2.4 4.8 5.6 5.0 1.3 2.5 5.9 5.9 3.2 1.9 4.8 3.2 2.1 1.3 2.5 1.8
## [685] 2.8 3.0 3.1 3.5 1.0 5.9 3.5 5.5 3.9 3.3 3.4 1.4 5.3 3.4 3.7 2.0 3.3 2.5
## [703] 5.7 3.4 4.5 4.6 2.4 1.9 1.2 3.3 4.0 3.1 1.1 3.7 2.9 5.4 5.8 3.9 2.4 2.4
## [721] 6.0 3.9 1.8 3.2 3.6 5.8 5.7 5.5 1.0 5.1 1.1 2.3 3.2 4.5 4.7 2.4 3.7 4.0
## [739] 2.1 6.0 1.9 2.7 5.0 2.7 3.2 5.8 5.3 3.9 4.6 2.9 1.5 3.3 5.3 2.2 5.8 5.8
## [757] 2.6 1.2 2.9 2.8 2.0 3.1 5.9 2.1 5.2 1.2 3.3 2.0 2.7 4.1 2.8 4.4 4.5 1.0
## [775] 2.6 5.1 4.3 4.8 2.7 3.6 1.3 2.2 3.5 3.5 2.6 1.7 5.3 5.0 4.8 4.2 4.2 3.3
## [793] 1.2 1.4 2.5 3.7 1.8 1.7 5.4 3.6 5.1 1.6 2.3 1.7 2.3 2.9 4.2 2.7 6.0
# Chạy lệnh
t.test(subset(car_price_prediction_$Engine.Size,car_price_prediction_$Condition=="New"),mu=3.5,alt="l")
## 
##  One Sample t-test
## 
## data:  subset(car_price_prediction_$Engine.Size, car_price_prediction_$Condition == "New")
## t = -1.2392, df = 808, p-value = 0.1078
## alternative hypothesis: true mean is less than 3.5
## 95 percent confidence interval:
##      -Inf 3.520445
## sample estimates:
## mean of x 
##  3.437824
# Nhận xét: p-value = 0.1078 > 0.1 
# Chấp nhận H0
# KL: Ở mức ý nghĩa 10%, có thể cho rằng dung tích động cơ xe có tình trạng New không dưới 3,5 lít.
  1. Một chiếc xe được đánh giá là đắt tiền nếu giá của chiếc xe đó ít nhất là 95.000$. Kiểm định giả thuyết: 15% chiếc xe có giá đắt tiền tại mức ý nghĩa 5%.
# Gọi p là tỷ lệ số chiếc xe có giá đắt tiền.
# H0: p=0.15
# H1: p#0.15
# Tính số chiếc xe có giá ít nhất 95000$
sum(car_price_prediction_$Price>=95000)
## [1] 118
# Tính tổng số chiếc xe
length(car_price_prediction_$Price)
## [1] 2500
# Chạy lệnh
prop.test(118,2500,p=0.15,alt="t",correct=F)
## 
##  1-sample proportions test without continuity correction
## 
## data:  118 out of 2500, null probability 0.15
## X-squared = 207.21, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.15
## 95 percent confidence interval:
##  0.03955923 0.05623017
## sample estimates:
##      p 
## 0.0472
# Nhận xét : p-value < 2.2e-16 < 0.05 
# Bác bỏ H0
# KL: Ở mức ý nghĩa 5%, có thể cho rằng tỷ lệ chiếc xe có giá đắt tiền không phải là 15%.
  1. Kiểm định giả thuyết: Trong loại nhiên liệu xe sử dụng là điện (Electronic) trên 10% chiếc xe có số dặm đã đi ít nhất 150.000 dặm tại mức ý nghĩa 1%.
# Gọi p là tỷ lệ số chiếc xe Điện (Electronic) có số dặm đã đi ít nhất là 150000.
# H0: p<=0.1
# H1: p>0.1
# Tính số chiếc xe Điện (Electronic) có số dặm đã đi ít nhất là 150000.
sum(car_price_prediction_$Fuel.Type=="Electric"&car_price_prediction_$Mileage>=150000)
## [1] 289
# Tính tổng số chiếc xe điện 
sum(car_price_prediction_$Fuel.Type=="Electric")
## [1] 614
# Chạy lệnh: 
prop.test(289,614,p=0.1,alt="g",correct=F)
## 
##  1-sample proportions test without continuity correction
## 
## data:  289 out of 614, null probability 0.1
## X-squared = 937.42, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is greater than 0.1
## 95 percent confidence interval:
##  0.4377518 1.0000000
## sample estimates:
##        p 
## 0.470684
# Nhận xét : p-value < 2.2e-16 < 0.01 
# Bác bỏ H0
# KL: Ở mức ý nghĩa 1%, có thể cho rằng tỷ lệ chiếc xe có số dặm đã đi ít nhất là 150000 trên 10%.

câu 5: Các bài toán kiểm định tham số 2 tổng thể: Trung bình, tỷ lệ, phương sai

  1. Tại mức ý nghĩa 5%, kiểm định xem trung bình giá bán xe Audi có cao hơn xe BMW hay không?
# Gọi m1,m2 lần lượt là giá bán trung bình của xe Audi và BMW
# H0:m1-m2 ≤0
# H1:m1-m2 >0
# lọc ra tập con giá bán của xe AUdi
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi")
##   [1] 44402.61 88969.76 63498.75 70193.74 75044.95 82480.40 54201.18 71972.18
##   [9] 19993.56 40422.68 19379.29 96903.15 26352.59 88047.31 30103.17 81623.45
##  [17] 53463.16  7494.40 48517.86 43341.00 23011.57 65510.97 57608.77 46849.57
##  [25] 65248.06 75349.30 37290.10  9730.07 85719.15 95644.79 27057.55 60799.03
##  [33] 94917.73 38018.04 53772.43 91080.62 21684.35 14031.19 69032.18 11508.22
##  [41] 96270.31 66410.90 71685.59 34240.31 45172.66  6629.41 91162.56 96779.22
##  [49] 30896.46 59939.22  9660.54 43837.32 70814.24 19070.54 58953.97 64367.04
##  [57] 29756.80 30659.10 43071.10 72925.19 93890.40 86583.65 53545.84 63548.00
##  [65] 48799.65 97156.13 93026.99 66129.83 61503.74 36037.38 69387.25 45927.65
##  [73] 80568.22 53144.42 54041.95 64529.38 34075.55 30691.24 33214.51 98153.00
##  [81] 36432.36 85693.40  9701.08 33145.63 44681.71 44060.29 79507.15 90488.55
##  [89] 17432.03 67655.38 52854.61 11829.50 68363.56 49436.04 61889.23 73497.00
##  [97] 66073.98 50507.25 12490.66 31455.83 14086.62 97818.68  9943.59 85737.79
## [105] 28497.74 15212.37 86918.43 20134.21 62280.02 20868.82 85376.31 18275.36
## [113] 42066.22 80236.67 35070.17 63236.33 53199.72 74765.48 16479.84 36089.69
## [121] 42176.97 96558.64 35550.89 39517.99 83183.16 24602.19 16465.29  5011.27
## [129]  6740.34 71028.74 97808.48 40608.90 28199.42 49926.83 98330.26 86181.92
## [137] 62043.29 94943.29 45274.04 25255.35 70370.49 96173.37 97261.57 56072.54
## [145] 51732.06 10870.41 52649.97 87327.78 32778.28 43215.92 66332.39 28608.80
## [153] 43037.42 15495.96 71072.92  7975.57 16289.72 16394.32 59123.34 97771.60
## [161] 94827.57 11200.65 34513.51 63510.95  8434.50 58196.10 76515.33 39870.93
## [169] 71976.90 72208.89 27143.94 41249.71 30530.96 14406.85  8046.13 37728.83
## [177] 42453.41  7581.53 48820.70 56223.94 92834.17 77050.35 10557.62 57578.84
## [185] 38371.45 11375.30 45053.87 42462.69 35068.17 34109.11 23914.16 85753.79
## [193] 30833.31 55278.28  5947.24 34979.46  9455.33 44365.11 32342.86 28598.53
## [201] 70055.56 46076.33 38523.40 66972.89 21833.41 49105.69 46543.12 59286.67
## [209] 28322.67 28532.54 81937.80 23781.30 27099.99 82246.19 39255.57 78189.24
## [217] 31567.83 38681.70 65541.58 79831.68 90768.57 48283.02 71982.59 61508.19
## [225] 41932.64 52840.27 15573.09 31546.34 94733.24 43411.36 93363.35 70291.28
## [233] 20352.91 97082.99 67863.46 89229.15 94355.25 71894.70  8192.92 82335.21
## [241] 29039.01 61282.10 99541.32 89147.36 97323.32 15004.69 10455.23 65767.89
## [249] 99982.59 62884.66 93926.98 26081.98 37067.94 57910.10 25909.03 90502.81
## [257] 63472.77 42017.31 59265.27 76807.97 89579.85 21080.81 25820.35 17876.40
## [265] 67396.71 69605.40 18856.62 95709.72 18452.24 86782.66  7550.55 92983.85
## [273] 45622.62 94116.90 63260.96 89526.99 33688.28 46044.85 16615.92 10605.99
## [281] 22795.31  5703.33 98137.19 40923.43 44094.52 29118.37 36473.19 59071.61
## [289] 30076.84  8665.69  9583.19 20207.19 54493.53 71681.54 47839.71 70699.19
## [297] 72440.13 77048.81 36792.44 96651.49 10876.84  7283.66 32163.12 79194.62
## [305] 23028.99 75446.31 36871.76 79429.51 90416.60 70640.74 69845.31 73838.03
## [313] 37000.75 59744.06 51425.19 44837.96 47677.53 46049.78 58403.72 49201.46
## [321] 18936.55 90175.23  5022.86 59627.42 15372.95 54899.83 97144.03 16960.31
## [329] 48014.73 98042.59 48589.93 40146.82 90253.66  6290.25 80306.54 70529.86
## [337] 71954.76 60358.76 19175.06 88895.86 21661.92 32454.14 80961.53 20796.06
## [345] 48228.10 41658.67 59181.58 71095.80 45658.69 45964.04 93779.23 72824.50
## [353] 40899.14 87061.94 23092.76 98346.28 73463.68 60287.13 54765.09 82920.85
## [361] 14068.95 48185.43 32351.06 15126.76 98434.45 61384.10 24710.35 46085.67
# Lọc ra tập con giá bán của xe BMW
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="BMW")
##   [1] 14679.61 35220.52 35735.34 75621.02 46800.60 71916.68 40155.51 21471.98
##   [9] 16167.56 85266.84 80341.84 45104.74 45952.79 43126.91 71051.50 68037.91
##  [17] 96941.02 44119.84 43559.34 56392.39 13072.13 15952.67 36254.60 72016.25
##  [25] 69195.80 96018.28 99371.68 15277.69 26498.91 60692.67 11618.92 28992.68
##  [33] 90495.38 45968.35 93578.52 72174.13 90080.40 27465.00 37814.92 83227.83
##  [41] 35187.25 48049.89 70569.63 25447.11 35782.66 31288.40 81910.79 62365.50
##  [49] 22947.88 92787.78 97666.64 87853.95 93712.71 54541.42 51712.69 49337.96
##  [57] 21701.94  8126.21 62488.51 93917.45 66805.57  5741.64 59300.95 33449.34
##  [65] 12413.03 82477.46 25518.60 61799.07 98972.03 68600.67 88580.82  6176.89
##  [73] 42942.56 65938.78 13684.37 70406.34 20705.82 70861.07  6398.77 57391.58
##  [81] 88486.09 23029.74 58703.76 21962.52  5124.89 86049.42 56917.99 68239.00
##  [89] 54173.00 22932.06 98038.25 44875.96 25155.32 48216.46 59183.20 84800.81
##  [97] 13926.56 68420.48 94015.92 39239.12 87879.25 89606.41 37462.42 30894.45
## [105] 95691.73 56022.56 89476.53 76813.10 32090.11 51990.41 14097.95 65282.26
## [113] 78653.31 41633.96 55381.61 19439.29 75127.26 54592.22 73682.20 14174.78
## [121] 61932.70 86254.29 10806.67 87013.83 26164.57 17165.24 89332.38 63692.45
## [129] 74627.61  9341.96 24191.69 65839.01 78956.84  8000.20 70068.99 93430.15
## [137] 95332.86 80364.72 68399.37 53834.07 33371.37 56575.70 97595.54 34382.84
## [145] 20350.81 63238.73 18781.21 64640.87 19141.40 81229.74 58735.06 74341.57
## [153] 45423.04 18379.20 23677.08 90445.55 77642.94 94486.25 69719.28 55368.39
## [161] 90639.13 47155.14 22159.58 12283.88 78949.96  8218.17 44399.60 64982.02
## [169] 33444.21 39743.01 48326.64 21609.73 58675.79 28378.94 14552.91 77017.26
## [177] 97684.22 86937.60 17161.68  9330.19 58855.43 67207.07 93582.37 70771.94
## [185] 59521.86 95693.28 20133.13 56703.88 81406.70 84173.65 64543.81 87456.56
## [193] 83046.34 59185.74 18839.84 66427.69 65103.29  8268.34 23490.23 56596.24
## [201] 98710.52 93569.04 62117.43 40673.26 65624.73 66600.32 88842.18 27289.12
## [209] 29925.11 71883.89 76008.85 48635.26 57722.66 86150.93 75066.13 57807.75
## [217] 12549.81 67293.83 43429.33 73779.99 31294.11 58221.96 74303.45 77070.57
## [225] 35579.68 49235.03 99968.62 52264.40 47196.40 79549.84 57658.05 68349.45
## [233] 24628.15 16797.81 97511.18 30460.85 90198.76 35034.32 67278.76 39098.80
## [241] 91344.46 69924.53 91346.42 99073.74 28978.91 86087.85 52430.24 69094.68
## [249] 61180.41 73719.07 11866.05 71259.92  5107.22 86891.77 42899.09 58054.65
## [257] 45340.55 65645.30 94081.43 72256.62 55458.94 24702.88 76877.39  5843.96
## [265]  8480.01 30938.69 41850.40 65653.36 25126.60 92581.20  9212.70 91188.47
## [273] 68178.02 69919.28 14281.89 73436.22 14856.20 24995.87 37006.81 72943.23
## [281] 39479.18  7563.58 42691.34 14843.78 17594.09 67674.17 59637.74 24135.18
## [289] 38698.38 80995.07 98187.18 70928.77 14881.64 12364.18 84156.07 15489.37
## [297] 23960.81  6929.49 18891.04 55145.17 41390.97 64720.38 97165.62 35091.12
## [305] 71685.11 46319.83 83557.77 51174.28 45092.24 15072.58 11785.16 19504.91
## [313] 10708.09 14879.58 78113.54 68440.51 38162.84 39682.76 63555.14 56527.43
## [321] 18957.69 43398.25 71676.27 64720.06 66284.80 61879.84 77413.44 95022.62
## [329] 45808.83 56377.17  7657.33 78191.59 83021.14 71381.70 53092.73 56141.29
## [337]  7630.54 56099.65 83982.13 78531.99 65488.48 58558.94 84913.44 56201.40
## [345]  8569.42 69330.20 60767.46  7093.72 94713.45 29507.23 95342.95 94134.18
## [353] 79574.92 67785.03 57367.93 92862.86 74883.99 16102.78
# chạy lệnh
t.test(subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi"),subset(car_price_prediction_$Price,car_price_prediction_$Brand=="BMW"),mu=0,alt="g",paired = F,var.equal = F)
## 
##  Welch Two Sample t-test
## 
## data:  subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Audi") and subset(car_price_prediction_$Price, car_price_prediction_$Brand == "BMW")
## t = -1.0818, df = 723.29, p-value = 0.8601
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  -5558.673       Inf
## sample estimates:
## mean of x mean of y 
##  51953.42  54157.11
# Nhận xét : p-value =0.8601>0.05
# Chấp nhận H0
# KL: Tại mức ý nghĩa 5%, ko đủ bằng chứng kết luận rằng giá bán trung bình của xe Audi cao hơn xe BMW.
  1. Tại mức ý nghĩa 5%, kiểm định xem tỷ lệ xe có giá trên 50.000 USD giữa Audi và BMW có khác nhau hay không?
# Gọi p1,p2 lần lượt là tỉ lệ của xe Audi và BMW có giá trên 50.000 USD.
# H0: p1-p2=0
# H1: p1-p2#0
# Tính số chiếc xe Audi có giá trên 50000$
sum(car_price_prediction_$Brand=="Audi"&car_price_prediction_$Price>50000)
## [1] 181
# Tính số chiếc xe BMW có giá trên 50000$
sum(car_price_prediction_$Brand=="BMW"&car_price_prediction_$Price>50000)
## [1] 207
# Tính số chiếc xe Audi
sum(car_price_prediction_$Brand=="Audi")
## [1] 368
# Tính số chiếc xe BMW
sum(car_price_prediction_$Brand=="BMW")
## [1] 358
# Chạy lệnh
prop.test(c(181,207),c(368,358),alt="t",correct = F)
## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(181, 207) out of c(368, 358)
## X-squared = 5.4399, df = 1, p-value = 0.01968
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.15865511 -0.01407382
## sample estimates:
##    prop 1    prop 2 
## 0.4918478 0.5782123
# Nhận xét: p-value = 0.01968 < 0.05
# Bác bỏ H0
#   KL: Tại mức ý nghĩa 5%, tỷ lệ xe có giá trên 50.000 USD giữa Audi và BMW có sự khác nhau.
  1. Tại mức ý nghĩa 5%, kiểm định xem mức độ biến động giá xe Audi và Toyota có khác nhau hay không?
# Gọi a,b lần lượt là phương sai giá xe Audi và Toyota.
# H0: a-b=0
# H1: a-b#0
# Lọc ra tập con giá của xe Audi
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi")
##   [1] 44402.61 88969.76 63498.75 70193.74 75044.95 82480.40 54201.18 71972.18
##   [9] 19993.56 40422.68 19379.29 96903.15 26352.59 88047.31 30103.17 81623.45
##  [17] 53463.16  7494.40 48517.86 43341.00 23011.57 65510.97 57608.77 46849.57
##  [25] 65248.06 75349.30 37290.10  9730.07 85719.15 95644.79 27057.55 60799.03
##  [33] 94917.73 38018.04 53772.43 91080.62 21684.35 14031.19 69032.18 11508.22
##  [41] 96270.31 66410.90 71685.59 34240.31 45172.66  6629.41 91162.56 96779.22
##  [49] 30896.46 59939.22  9660.54 43837.32 70814.24 19070.54 58953.97 64367.04
##  [57] 29756.80 30659.10 43071.10 72925.19 93890.40 86583.65 53545.84 63548.00
##  [65] 48799.65 97156.13 93026.99 66129.83 61503.74 36037.38 69387.25 45927.65
##  [73] 80568.22 53144.42 54041.95 64529.38 34075.55 30691.24 33214.51 98153.00
##  [81] 36432.36 85693.40  9701.08 33145.63 44681.71 44060.29 79507.15 90488.55
##  [89] 17432.03 67655.38 52854.61 11829.50 68363.56 49436.04 61889.23 73497.00
##  [97] 66073.98 50507.25 12490.66 31455.83 14086.62 97818.68  9943.59 85737.79
## [105] 28497.74 15212.37 86918.43 20134.21 62280.02 20868.82 85376.31 18275.36
## [113] 42066.22 80236.67 35070.17 63236.33 53199.72 74765.48 16479.84 36089.69
## [121] 42176.97 96558.64 35550.89 39517.99 83183.16 24602.19 16465.29  5011.27
## [129]  6740.34 71028.74 97808.48 40608.90 28199.42 49926.83 98330.26 86181.92
## [137] 62043.29 94943.29 45274.04 25255.35 70370.49 96173.37 97261.57 56072.54
## [145] 51732.06 10870.41 52649.97 87327.78 32778.28 43215.92 66332.39 28608.80
## [153] 43037.42 15495.96 71072.92  7975.57 16289.72 16394.32 59123.34 97771.60
## [161] 94827.57 11200.65 34513.51 63510.95  8434.50 58196.10 76515.33 39870.93
## [169] 71976.90 72208.89 27143.94 41249.71 30530.96 14406.85  8046.13 37728.83
## [177] 42453.41  7581.53 48820.70 56223.94 92834.17 77050.35 10557.62 57578.84
## [185] 38371.45 11375.30 45053.87 42462.69 35068.17 34109.11 23914.16 85753.79
## [193] 30833.31 55278.28  5947.24 34979.46  9455.33 44365.11 32342.86 28598.53
## [201] 70055.56 46076.33 38523.40 66972.89 21833.41 49105.69 46543.12 59286.67
## [209] 28322.67 28532.54 81937.80 23781.30 27099.99 82246.19 39255.57 78189.24
## [217] 31567.83 38681.70 65541.58 79831.68 90768.57 48283.02 71982.59 61508.19
## [225] 41932.64 52840.27 15573.09 31546.34 94733.24 43411.36 93363.35 70291.28
## [233] 20352.91 97082.99 67863.46 89229.15 94355.25 71894.70  8192.92 82335.21
## [241] 29039.01 61282.10 99541.32 89147.36 97323.32 15004.69 10455.23 65767.89
## [249] 99982.59 62884.66 93926.98 26081.98 37067.94 57910.10 25909.03 90502.81
## [257] 63472.77 42017.31 59265.27 76807.97 89579.85 21080.81 25820.35 17876.40
## [265] 67396.71 69605.40 18856.62 95709.72 18452.24 86782.66  7550.55 92983.85
## [273] 45622.62 94116.90 63260.96 89526.99 33688.28 46044.85 16615.92 10605.99
## [281] 22795.31  5703.33 98137.19 40923.43 44094.52 29118.37 36473.19 59071.61
## [289] 30076.84  8665.69  9583.19 20207.19 54493.53 71681.54 47839.71 70699.19
## [297] 72440.13 77048.81 36792.44 96651.49 10876.84  7283.66 32163.12 79194.62
## [305] 23028.99 75446.31 36871.76 79429.51 90416.60 70640.74 69845.31 73838.03
## [313] 37000.75 59744.06 51425.19 44837.96 47677.53 46049.78 58403.72 49201.46
## [321] 18936.55 90175.23  5022.86 59627.42 15372.95 54899.83 97144.03 16960.31
## [329] 48014.73 98042.59 48589.93 40146.82 90253.66  6290.25 80306.54 70529.86
## [337] 71954.76 60358.76 19175.06 88895.86 21661.92 32454.14 80961.53 20796.06
## [345] 48228.10 41658.67 59181.58 71095.80 45658.69 45964.04 93779.23 72824.50
## [353] 40899.14 87061.94 23092.76 98346.28 73463.68 60287.13 54765.09 82920.85
## [361] 14068.95 48185.43 32351.06 15126.76 98434.45 61384.10 24710.35 46085.67
# Lọc ra tập con giá của xe Toyota
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Toyota")
##   [1] 70176.95 89587.88 92009.61 36278.13 18035.41 56919.02 69523.76 45764.29
##   [9] 93126.06 91981.24 33168.40 40790.18 71109.39 95981.89  7865.33 79696.82
##  [17] 23695.06 74413.84 27025.29 54702.39 24791.06 58344.84 73778.51 10116.90
##  [25] 96981.66 19655.11 26512.16 60030.44 59976.03 65006.23 88481.26 63473.31
##  [33] 47957.36 74988.63 45216.96 11927.12 43288.37 28419.52 81293.98 40805.03
##  [41] 63401.95 84564.33 65718.75 85485.54 50555.40 17135.56  5472.39 36441.48
##  [49] 14527.21 36930.31 11417.52 63818.98 77417.09 53517.76 12817.89 40601.34
##  [57] 35653.47 46493.90 47415.40  8884.27 89048.83 63703.77 98645.75 25320.09
##  [65] 49511.11 36155.21 40630.17 48889.95 11482.58 71558.31 21932.27 97461.61
##  [73] 94809.81 79411.38 46011.26 28940.54 95389.05 87119.23 76065.14 41275.26
##  [81] 56350.28 42277.91 35238.25  9039.84 80151.85 80164.40 87758.12 80754.70
##  [89] 43089.18 41440.22 64002.04 40537.67 11783.11 91972.58 83707.47 58695.12
##  [97] 43349.53  6865.07 79583.76 90558.59 57024.91 20368.47 14374.69 13119.35
## [105] 70016.62 51516.20 13522.26 52045.44 31141.53 81157.49 17022.85 93901.09
## [113] 21547.31 44867.12 35593.06 60380.53 94478.13 73292.09 58064.48 67682.27
## [121] 88900.74 50250.98 62939.91 13780.00 10355.93 54881.07 12920.87 12929.83
## [129] 58518.19 77469.18 14003.23 81184.90 60725.99 23848.51 74598.88 63340.94
## [137] 62063.39 49967.86 77681.51 90138.79 14555.64 21967.75 40734.23 44340.36
## [145] 32686.71 80351.23 89727.46 56563.48 19615.76 17032.55 37912.87 55470.46
## [153] 55061.49 57588.09 86765.44 91318.02 59551.72 84690.37 55556.15 57566.70
## [161] 72016.11 47981.28  9731.03 58937.32 87474.10 65128.56 20281.08 47149.43
## [169] 38775.86 90478.61 82109.97 29259.73 89019.71 35708.31 29737.34 74003.92
## [177] 97705.95 92693.15 40263.26 78449.12 13322.64 86348.52  9948.47 40624.25
## [185] 70061.18 18945.71 52648.59 69401.54 40357.76 82564.09 33537.03 46225.88
## [193] 33416.03 58366.77 32437.59 22749.28 12696.41 19544.74 27011.56 90913.66
## [201] 13121.42 25578.52 85220.19 62302.94 74744.21 94101.54 37221.49 87630.92
## [209] 84622.59 34750.31 69490.41 14395.92 69921.92 38014.82  8673.23 22424.55
## [217] 10257.49 98496.67 33051.79 68362.11 14728.06  8055.44 56034.53 81568.35
## [225] 22034.71 87883.28 71574.06 74700.40 39768.76 40234.58 44014.24 95390.34
## [233] 73997.21 72894.30 24368.44 24671.86 80975.36 66520.34 54949.03 74717.66
## [241] 87189.19 87800.17 86190.44  8716.86 16614.03 35184.40 45121.15 98493.27
## [249] 87156.36 10002.30 63817.50 42708.54 42611.56 14467.78 45212.41 10532.59
## [257] 23900.22 55680.58 88002.37 44695.00 90760.34 56611.41 59844.61 71976.64
## [265] 30146.02 48135.89 86019.28 22123.37 25004.89 56158.34 92975.90 10315.81
## [273] 50773.03 32071.99 47609.93 87191.07 91057.57 17915.06 19133.19 57204.66
## [281] 31803.50 41926.32 29390.09 37120.26 25490.20 33216.92 99400.47 16900.42
## [289] 75830.51 61511.27 85805.52 95329.96 45987.27 14767.92 76664.41 16876.30
## [297] 17868.57 24070.77 82357.98  6355.76 90870.69 55114.42 31692.84 18246.64
## [305] 72588.15 48326.38 54616.50 41016.77 37623.96 44500.57 75739.99 95135.69
## [313] 47373.55 26163.54 67076.17  8818.88 11892.86 57552.43 91494.80 47044.23
## [321] 23123.54 61424.06 36382.78 57231.50 47346.40 36370.17 35419.76 28769.68
## [329] 73796.14 73872.23 22665.45 94132.36 76225.56 29487.76 19390.86 29507.70
## [337] 74530.90 54479.15 61088.35 97425.69 35411.88 68249.27 69007.56 41756.29
## [345] 69868.63 94764.46 48512.26  6729.50 52129.23 13522.58 58688.87 70375.88
## [353] 53755.20 15569.82 73287.36 28493.67 95242.86 52330.11 81910.22 61357.58
## [361] 89389.53 79615.00 48533.45 72433.83 83576.90 62729.37 76890.21 78647.35
## [369]  6178.92 51779.02 22705.09  5998.26 28041.25 16594.14
# Chạy lệnh
var.test(subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi"),subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Toyota"),alt="t")
## 
##  F test to compare two variances
## 
## data:  subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Audi") and subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Toyota")
## F = 1.029, num df = 367, denom df = 373, p-value = 0.7836
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.8390617 1.2620607
## sample estimates:
## ratio of variances 
##           1.028963
# Nhận xét: p-value = 0.7836>0.05
# Chấp nhận H0
#   Kl: Tại mức ý nghĩa 5%, có thể nói rằng mức độ biến động giá xe Audi và Toyota là như nhau.

câu 6 : Phân tích phương sai ANOVA, phân tích sâu TukeyHSD

Tại mức ý nghĩa 10%, kiểm định xem giá xe trung bình có khác nhau giữa các loại nhiên liệu (Fuel_Type) hay không? Nếu có sự khác biệt, sử dụng phân tích sâu TukeyHSD để xác định: - Cặp loại nhiên liệu nào có sự khác biệt về giá trung bình. - Loại nhiên liệu nào có xu hướng giá xe cao hơn hoặc thấp hơn.

# Thiết lập giả thuyết: 
# H0: Giá xe trung bình giữa các loại nhiên liệu là bằng nhau
# H1: Giá xe trung bình giữa các loại nhiên liệu là không bằng nhau
# Chạy lệnh
anova(lm(car_price_prediction_$Price~car_price_prediction_$Fuel.Type))
# Nhận xét :    P-giá trị= 0.05796 < 0.1 => bác bỏ Ho => yếu tố nhiên liệu có ảnh hưởng đến đến giá xe.
# Phân tích sâu TukeyHSD
TukeyHSD(aov(lm(car_price_prediction_$Price~car_price_prediction_$Fuel.Type)))
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lm(car_price_prediction_$Price ~ car_price_prediction_$Fuel.Type))
## 
## $`car_price_prediction_$Fuel.Type`
##                       diff       lwr       upr     p adj
## Electric-Diesel -3893.9841 -7832.152   44.1838 0.0539446
## Hybrid-Diesel   -2449.6028 -6409.694 1510.4883 0.3843682
## Petrol-Diesel   -3229.0796 -7141.350  683.1910 0.1463996
## Hybrid-Electric  1444.3812 -2578.479 5467.2416 0.7925390
## Petrol-Electric   664.9045 -3310.890 4640.6994 0.9733490
## Petrol-Hybrid    -779.4767 -4776.989 3218.0351 0.9587801
# Nhận xét: 
# Chỉ có cặp khác biệt duy nhất Electric-Diesel có P giá trị = 0.0539446 < 0.1 . Các cặp còn lại có P giá trị > 0.1 nghĩa là chưa có sự khác biệt rõ ràng về giá.
# Xe điện (Electric) có xu hướng giá thấp hơn xe Dầu (Diesel).Cụ thể giá trị diff = - 3893,9841 cho thấy xe điện trung bình nhỏ hơn xe dầu khoảng 3894 đơn vị tiền tệ.
# KL: mặc dù ANOVA cho thấy có sự khác biệt chung, nhưng sự khác biệt này chủ yếu đến từ nhóm xe điện và xe dầu . Các loại xe còn lại có mức khá tương đồng nhau, không có sự chênh lệch quá lớn ở mức ý nghĩa 10%.

câu 7: Kiểm định phi tham số: Kiểm định tính độc lập, kiểm định mức phù hợp, kiểm định trung vị Wilcoxon ( 1 trung vị, 2 trung vị)

  1. Tại mức ý nghĩa 5%, kiểm định xem loại nhiên liệu (Petrol/diesel/electric/hybird) có độc lập với tình trạng xe (New/like new/used) hay không?
# Thiết lập giả thuyết
# H0: Loại nhiên liệu và tình trạng xe độc lập nhau
# H1: Loại nhiên liệu và tình trạng xe không độc lập nhau.
chisq.test(table(car_price_prediction_$Fuel.Type,car_price_prediction_$Condition))
## 
##  Pearson's Chi-squared test
## 
## data:  table(car_price_prediction_$Fuel.Type, car_price_prediction_$Condition)
## X-squared = 6.8042, df = 6, p-value = 0.3393
# Nhận xét: p-value = 0.3393>0.05 => Chấp nhận H0
# Kl: Ở mức ý nghĩa 5%,có thể thấy loại nhiên liệu và tình trạng xe không có liên hệ với nhau. Hai biến được xem là độc lập

b.: Tại mức ý nghĩa 5%, kiểm định xem tỷ lệ xe theo tình trạng (New/like new/used) có phân bố đều hay không?

# Gọi p1,p2,p3 lần lượt là tỷ lệ xe có tình trạng New,Like New và Used
# H0: Tỉ lệ các xe có tình trạng New, Like New, Used có phân bố đều (p1=p2=p3)
#H1: Tỉ lệ các xe có tình trạng New, Like New, Used có phân bố không đều ( tồn tại i#j: pi # pj)
chisq.test(table(car_price_prediction_$Condition))
## 
##  Chi-squared test for given probabilities
## 
## data:  table(car_price_prediction_$Condition)
## X-squared = 1.2824, df = 2, p-value = 0.5267
# Nhận xét: p-value = 0.5267>0.05 => Chấp nhận H0
# Kl: Ở mức ý nghĩa 5%, có thể thấy tỷ lệ các loại xe có tình trạng New, Like New và Used có phân bố đều.  
  1. Tại mức ý nghĩa 5%, kiểm định xem giá xe Audi có bằng 50.000 USD hay không.(1 trung vị)
# Thiết lập giả thuyết
# H0: Giá của xe Audi bằng 50000$
# H1: Giá của xe Audi không bằng 50000$
# Lọc ra tập con giá của xe Audi
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi")
##   [1] 44402.61 88969.76 63498.75 70193.74 75044.95 82480.40 54201.18 71972.18
##   [9] 19993.56 40422.68 19379.29 96903.15 26352.59 88047.31 30103.17 81623.45
##  [17] 53463.16  7494.40 48517.86 43341.00 23011.57 65510.97 57608.77 46849.57
##  [25] 65248.06 75349.30 37290.10  9730.07 85719.15 95644.79 27057.55 60799.03
##  [33] 94917.73 38018.04 53772.43 91080.62 21684.35 14031.19 69032.18 11508.22
##  [41] 96270.31 66410.90 71685.59 34240.31 45172.66  6629.41 91162.56 96779.22
##  [49] 30896.46 59939.22  9660.54 43837.32 70814.24 19070.54 58953.97 64367.04
##  [57] 29756.80 30659.10 43071.10 72925.19 93890.40 86583.65 53545.84 63548.00
##  [65] 48799.65 97156.13 93026.99 66129.83 61503.74 36037.38 69387.25 45927.65
##  [73] 80568.22 53144.42 54041.95 64529.38 34075.55 30691.24 33214.51 98153.00
##  [81] 36432.36 85693.40  9701.08 33145.63 44681.71 44060.29 79507.15 90488.55
##  [89] 17432.03 67655.38 52854.61 11829.50 68363.56 49436.04 61889.23 73497.00
##  [97] 66073.98 50507.25 12490.66 31455.83 14086.62 97818.68  9943.59 85737.79
## [105] 28497.74 15212.37 86918.43 20134.21 62280.02 20868.82 85376.31 18275.36
## [113] 42066.22 80236.67 35070.17 63236.33 53199.72 74765.48 16479.84 36089.69
## [121] 42176.97 96558.64 35550.89 39517.99 83183.16 24602.19 16465.29  5011.27
## [129]  6740.34 71028.74 97808.48 40608.90 28199.42 49926.83 98330.26 86181.92
## [137] 62043.29 94943.29 45274.04 25255.35 70370.49 96173.37 97261.57 56072.54
## [145] 51732.06 10870.41 52649.97 87327.78 32778.28 43215.92 66332.39 28608.80
## [153] 43037.42 15495.96 71072.92  7975.57 16289.72 16394.32 59123.34 97771.60
## [161] 94827.57 11200.65 34513.51 63510.95  8434.50 58196.10 76515.33 39870.93
## [169] 71976.90 72208.89 27143.94 41249.71 30530.96 14406.85  8046.13 37728.83
## [177] 42453.41  7581.53 48820.70 56223.94 92834.17 77050.35 10557.62 57578.84
## [185] 38371.45 11375.30 45053.87 42462.69 35068.17 34109.11 23914.16 85753.79
## [193] 30833.31 55278.28  5947.24 34979.46  9455.33 44365.11 32342.86 28598.53
## [201] 70055.56 46076.33 38523.40 66972.89 21833.41 49105.69 46543.12 59286.67
## [209] 28322.67 28532.54 81937.80 23781.30 27099.99 82246.19 39255.57 78189.24
## [217] 31567.83 38681.70 65541.58 79831.68 90768.57 48283.02 71982.59 61508.19
## [225] 41932.64 52840.27 15573.09 31546.34 94733.24 43411.36 93363.35 70291.28
## [233] 20352.91 97082.99 67863.46 89229.15 94355.25 71894.70  8192.92 82335.21
## [241] 29039.01 61282.10 99541.32 89147.36 97323.32 15004.69 10455.23 65767.89
## [249] 99982.59 62884.66 93926.98 26081.98 37067.94 57910.10 25909.03 90502.81
## [257] 63472.77 42017.31 59265.27 76807.97 89579.85 21080.81 25820.35 17876.40
## [265] 67396.71 69605.40 18856.62 95709.72 18452.24 86782.66  7550.55 92983.85
## [273] 45622.62 94116.90 63260.96 89526.99 33688.28 46044.85 16615.92 10605.99
## [281] 22795.31  5703.33 98137.19 40923.43 44094.52 29118.37 36473.19 59071.61
## [289] 30076.84  8665.69  9583.19 20207.19 54493.53 71681.54 47839.71 70699.19
## [297] 72440.13 77048.81 36792.44 96651.49 10876.84  7283.66 32163.12 79194.62
## [305] 23028.99 75446.31 36871.76 79429.51 90416.60 70640.74 69845.31 73838.03
## [313] 37000.75 59744.06 51425.19 44837.96 47677.53 46049.78 58403.72 49201.46
## [321] 18936.55 90175.23  5022.86 59627.42 15372.95 54899.83 97144.03 16960.31
## [329] 48014.73 98042.59 48589.93 40146.82 90253.66  6290.25 80306.54 70529.86
## [337] 71954.76 60358.76 19175.06 88895.86 21661.92 32454.14 80961.53 20796.06
## [345] 48228.10 41658.67 59181.58 71095.80 45658.69 45964.04 93779.23 72824.50
## [353] 40899.14 87061.94 23092.76 98346.28 73463.68 60287.13 54765.09 82920.85
## [361] 14068.95 48185.43 32351.06 15126.76 98434.45 61384.10 24710.35 46085.67
# Chạy lệnh: 
wilcox.test(subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi"),mu=50000,alt="t",conf.int = F,conf.level = 0.95)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Audi")
## V = 36620, p-value = 0.1908
## alternative hypothesis: true location is not equal to 50000
# Nhận xét : p-value = 0.1908 >0.05=> Chấp nhận H0
# KL: Ở mức ý nghĩa 5%, có thể thấy trung vị giá xe Audi bằng 50,000 USD.
  1. Tại mức ý nghĩa 5%, kiểm định xem giá xe giữa Audi và Toyota có khác nhau hay không.(2 trung vị)
# Thiết lập giả thuyết:
# H0: Giá xe Audi bằng giá xe Toyota
# H1: Giá xe Audi khác giá xe Toyota
# Lọc ra tập con giá xe của 2 loại xe Audi và Toyota
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi")
##   [1] 44402.61 88969.76 63498.75 70193.74 75044.95 82480.40 54201.18 71972.18
##   [9] 19993.56 40422.68 19379.29 96903.15 26352.59 88047.31 30103.17 81623.45
##  [17] 53463.16  7494.40 48517.86 43341.00 23011.57 65510.97 57608.77 46849.57
##  [25] 65248.06 75349.30 37290.10  9730.07 85719.15 95644.79 27057.55 60799.03
##  [33] 94917.73 38018.04 53772.43 91080.62 21684.35 14031.19 69032.18 11508.22
##  [41] 96270.31 66410.90 71685.59 34240.31 45172.66  6629.41 91162.56 96779.22
##  [49] 30896.46 59939.22  9660.54 43837.32 70814.24 19070.54 58953.97 64367.04
##  [57] 29756.80 30659.10 43071.10 72925.19 93890.40 86583.65 53545.84 63548.00
##  [65] 48799.65 97156.13 93026.99 66129.83 61503.74 36037.38 69387.25 45927.65
##  [73] 80568.22 53144.42 54041.95 64529.38 34075.55 30691.24 33214.51 98153.00
##  [81] 36432.36 85693.40  9701.08 33145.63 44681.71 44060.29 79507.15 90488.55
##  [89] 17432.03 67655.38 52854.61 11829.50 68363.56 49436.04 61889.23 73497.00
##  [97] 66073.98 50507.25 12490.66 31455.83 14086.62 97818.68  9943.59 85737.79
## [105] 28497.74 15212.37 86918.43 20134.21 62280.02 20868.82 85376.31 18275.36
## [113] 42066.22 80236.67 35070.17 63236.33 53199.72 74765.48 16479.84 36089.69
## [121] 42176.97 96558.64 35550.89 39517.99 83183.16 24602.19 16465.29  5011.27
## [129]  6740.34 71028.74 97808.48 40608.90 28199.42 49926.83 98330.26 86181.92
## [137] 62043.29 94943.29 45274.04 25255.35 70370.49 96173.37 97261.57 56072.54
## [145] 51732.06 10870.41 52649.97 87327.78 32778.28 43215.92 66332.39 28608.80
## [153] 43037.42 15495.96 71072.92  7975.57 16289.72 16394.32 59123.34 97771.60
## [161] 94827.57 11200.65 34513.51 63510.95  8434.50 58196.10 76515.33 39870.93
## [169] 71976.90 72208.89 27143.94 41249.71 30530.96 14406.85  8046.13 37728.83
## [177] 42453.41  7581.53 48820.70 56223.94 92834.17 77050.35 10557.62 57578.84
## [185] 38371.45 11375.30 45053.87 42462.69 35068.17 34109.11 23914.16 85753.79
## [193] 30833.31 55278.28  5947.24 34979.46  9455.33 44365.11 32342.86 28598.53
## [201] 70055.56 46076.33 38523.40 66972.89 21833.41 49105.69 46543.12 59286.67
## [209] 28322.67 28532.54 81937.80 23781.30 27099.99 82246.19 39255.57 78189.24
## [217] 31567.83 38681.70 65541.58 79831.68 90768.57 48283.02 71982.59 61508.19
## [225] 41932.64 52840.27 15573.09 31546.34 94733.24 43411.36 93363.35 70291.28
## [233] 20352.91 97082.99 67863.46 89229.15 94355.25 71894.70  8192.92 82335.21
## [241] 29039.01 61282.10 99541.32 89147.36 97323.32 15004.69 10455.23 65767.89
## [249] 99982.59 62884.66 93926.98 26081.98 37067.94 57910.10 25909.03 90502.81
## [257] 63472.77 42017.31 59265.27 76807.97 89579.85 21080.81 25820.35 17876.40
## [265] 67396.71 69605.40 18856.62 95709.72 18452.24 86782.66  7550.55 92983.85
## [273] 45622.62 94116.90 63260.96 89526.99 33688.28 46044.85 16615.92 10605.99
## [281] 22795.31  5703.33 98137.19 40923.43 44094.52 29118.37 36473.19 59071.61
## [289] 30076.84  8665.69  9583.19 20207.19 54493.53 71681.54 47839.71 70699.19
## [297] 72440.13 77048.81 36792.44 96651.49 10876.84  7283.66 32163.12 79194.62
## [305] 23028.99 75446.31 36871.76 79429.51 90416.60 70640.74 69845.31 73838.03
## [313] 37000.75 59744.06 51425.19 44837.96 47677.53 46049.78 58403.72 49201.46
## [321] 18936.55 90175.23  5022.86 59627.42 15372.95 54899.83 97144.03 16960.31
## [329] 48014.73 98042.59 48589.93 40146.82 90253.66  6290.25 80306.54 70529.86
## [337] 71954.76 60358.76 19175.06 88895.86 21661.92 32454.14 80961.53 20796.06
## [345] 48228.10 41658.67 59181.58 71095.80 45658.69 45964.04 93779.23 72824.50
## [353] 40899.14 87061.94 23092.76 98346.28 73463.68 60287.13 54765.09 82920.85
## [361] 14068.95 48185.43 32351.06 15126.76 98434.45 61384.10 24710.35 46085.67
subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Toyota")
##   [1] 70176.95 89587.88 92009.61 36278.13 18035.41 56919.02 69523.76 45764.29
##   [9] 93126.06 91981.24 33168.40 40790.18 71109.39 95981.89  7865.33 79696.82
##  [17] 23695.06 74413.84 27025.29 54702.39 24791.06 58344.84 73778.51 10116.90
##  [25] 96981.66 19655.11 26512.16 60030.44 59976.03 65006.23 88481.26 63473.31
##  [33] 47957.36 74988.63 45216.96 11927.12 43288.37 28419.52 81293.98 40805.03
##  [41] 63401.95 84564.33 65718.75 85485.54 50555.40 17135.56  5472.39 36441.48
##  [49] 14527.21 36930.31 11417.52 63818.98 77417.09 53517.76 12817.89 40601.34
##  [57] 35653.47 46493.90 47415.40  8884.27 89048.83 63703.77 98645.75 25320.09
##  [65] 49511.11 36155.21 40630.17 48889.95 11482.58 71558.31 21932.27 97461.61
##  [73] 94809.81 79411.38 46011.26 28940.54 95389.05 87119.23 76065.14 41275.26
##  [81] 56350.28 42277.91 35238.25  9039.84 80151.85 80164.40 87758.12 80754.70
##  [89] 43089.18 41440.22 64002.04 40537.67 11783.11 91972.58 83707.47 58695.12
##  [97] 43349.53  6865.07 79583.76 90558.59 57024.91 20368.47 14374.69 13119.35
## [105] 70016.62 51516.20 13522.26 52045.44 31141.53 81157.49 17022.85 93901.09
## [113] 21547.31 44867.12 35593.06 60380.53 94478.13 73292.09 58064.48 67682.27
## [121] 88900.74 50250.98 62939.91 13780.00 10355.93 54881.07 12920.87 12929.83
## [129] 58518.19 77469.18 14003.23 81184.90 60725.99 23848.51 74598.88 63340.94
## [137] 62063.39 49967.86 77681.51 90138.79 14555.64 21967.75 40734.23 44340.36
## [145] 32686.71 80351.23 89727.46 56563.48 19615.76 17032.55 37912.87 55470.46
## [153] 55061.49 57588.09 86765.44 91318.02 59551.72 84690.37 55556.15 57566.70
## [161] 72016.11 47981.28  9731.03 58937.32 87474.10 65128.56 20281.08 47149.43
## [169] 38775.86 90478.61 82109.97 29259.73 89019.71 35708.31 29737.34 74003.92
## [177] 97705.95 92693.15 40263.26 78449.12 13322.64 86348.52  9948.47 40624.25
## [185] 70061.18 18945.71 52648.59 69401.54 40357.76 82564.09 33537.03 46225.88
## [193] 33416.03 58366.77 32437.59 22749.28 12696.41 19544.74 27011.56 90913.66
## [201] 13121.42 25578.52 85220.19 62302.94 74744.21 94101.54 37221.49 87630.92
## [209] 84622.59 34750.31 69490.41 14395.92 69921.92 38014.82  8673.23 22424.55
## [217] 10257.49 98496.67 33051.79 68362.11 14728.06  8055.44 56034.53 81568.35
## [225] 22034.71 87883.28 71574.06 74700.40 39768.76 40234.58 44014.24 95390.34
## [233] 73997.21 72894.30 24368.44 24671.86 80975.36 66520.34 54949.03 74717.66
## [241] 87189.19 87800.17 86190.44  8716.86 16614.03 35184.40 45121.15 98493.27
## [249] 87156.36 10002.30 63817.50 42708.54 42611.56 14467.78 45212.41 10532.59
## [257] 23900.22 55680.58 88002.37 44695.00 90760.34 56611.41 59844.61 71976.64
## [265] 30146.02 48135.89 86019.28 22123.37 25004.89 56158.34 92975.90 10315.81
## [273] 50773.03 32071.99 47609.93 87191.07 91057.57 17915.06 19133.19 57204.66
## [281] 31803.50 41926.32 29390.09 37120.26 25490.20 33216.92 99400.47 16900.42
## [289] 75830.51 61511.27 85805.52 95329.96 45987.27 14767.92 76664.41 16876.30
## [297] 17868.57 24070.77 82357.98  6355.76 90870.69 55114.42 31692.84 18246.64
## [305] 72588.15 48326.38 54616.50 41016.77 37623.96 44500.57 75739.99 95135.69
## [313] 47373.55 26163.54 67076.17  8818.88 11892.86 57552.43 91494.80 47044.23
## [321] 23123.54 61424.06 36382.78 57231.50 47346.40 36370.17 35419.76 28769.68
## [329] 73796.14 73872.23 22665.45 94132.36 76225.56 29487.76 19390.86 29507.70
## [337] 74530.90 54479.15 61088.35 97425.69 35411.88 68249.27 69007.56 41756.29
## [345] 69868.63 94764.46 48512.26  6729.50 52129.23 13522.58 58688.87 70375.88
## [353] 53755.20 15569.82 73287.36 28493.67 95242.86 52330.11 81910.22 61357.58
## [361] 89389.53 79615.00 48533.45 72433.83 83576.90 62729.37 76890.21 78647.35
## [369]  6178.92 51779.02 22705.09  5998.26 28041.25 16594.14
# Chạy lệnh
wilcox.test(subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Audi"),subset(car_price_prediction_$Price,car_price_prediction_$Brand=="Toyota"),mu=0,alt="t",conf.int =T,conf.level = 0.95)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Audi") and subset(car_price_prediction_$Price, car_price_prediction_$Brand == "Toyota")
## W = 68598, p-value = 0.9406
## alternative hypothesis: true location shift is not equal to 0
## 95 percent confidence interval:
##  -4137.23  3825.88
## sample estimates:
## difference in location 
##              -149.0999
# Nhận xét:  p-value = 0.9406 >0.05 => Chấp nhận H0
# KL: Ở mức ý nghĩa 5%, chưa có bằng chứng cho thấy trung vị giá xe Audi và Toyota khác nhau.