Ngô Thành Kiên

Bài 3.4: Một vùng có 2000 hộ gia đình. Để điều tra nhu cầu tiêu dùng loại sản phẩm A tại vùng đó, người ta phỏng vấn ngẫu nhiên 100 gia đình và thấy có 65 gia đình có nhu cầu về loại sản phẩm trên. Với độ tin cậy 95% hãy ước lượng số gia đình có nhu cầu về loại sản phẩm đó bằng khoảng tin cậy đối xứng.

# số liệu bài toántoán
n_vung <- 2000
n_phong_van <- 100
n_nhu_cau <- 65
alpha <- 0.05

f <- n_nhu_cau/n_phong_van
U_0.975 <- 1.96

#  tính khoảng tin cậy đối xứng
lower_bound <- f-sqrt((f*(1-f))/n_phong_van)*U_0.975
upper_bound <- f+sqrt((f*(1-f))/n_phong_van)*U_0.975

print(paste("Khoảng tin cậy đối với tham sô p là: ",round(lower_bound, 3) ,"< p <", round(upper_bound,3)))
## [1] "Khoảng tin cậy đối với tham sô p là:  0.557 < p < 0.743"
# thay p vào khoảng tin cậy ta có

print(paste("thay p = N/2000 vào khoảng tin cậy ta có: ",round(lower_bound, 3) ,"< N/2000 <", round(upper_bound,3)))
## [1] "thay p = N/2000 vào khoảng tin cậy ta có:  0.557 < N/2000 < 0.743"
#tính giá trị của N
kq_1 <- 2000*lower_bound
kq_2 <- 2000*upper_bound

cat("ước lượng số hộ gia đình có nhu cầu về loại sản phẩm đó là: ",round(kq_1) , "< N <" , round(kq_2))
## ước lượng số hộ gia đình có nhu cầu về loại sản phẩm đó là:  1113 < N < 1487
library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
prop <- prop.test(x = 65, n = 100, correct = F, conf.level = 0.95)
print(paste("Khoảng tin cậy đối với tham sô p là: ", round(prop$conf.int[1],2),"< p <", round(prop$conf.int[2],2)))
## [1] "Khoảng tin cậy đối với tham sô p là:  0.55 < p < 0.74"
cat("ước lượng số hộ gia đình có nhu cầu về loại sản phẩm đó là: ",round(2000*prop$conf.int[1]) , "< N <" , round(2000*prop$conf.int[2]))
## ước lượng số hộ gia đình có nhu cầu về loại sản phẩm đó là:  1105 < N < 1473

Dương Đức Tưởng

Bài 5.2 (Chương 5): Đo một chiều cao Y(cm) và đường kính X (cm) của một loại cây ta có bảng kết quả sau:

X <- c(5,6,5,6,10,5,7,8,9,10)
Y <- c(28,28,24,30,60,30,32,42,43,49)
data <- data.frame(X,Y)
# a, lập phương trình hồi quy tuyến tính
PT <- lm(formula = Y~X)
cat("Phương trình hồi quy tuyến tính: y = ",round(PT$coefficients[1],2),"+",paste0(round(PT$coefficients[2],2),"x\n"))
## Phương trình hồi quy tuyến tính: y =  -1.19 + 5.32x
# b, biết một cay có đường kính là 5.5 cm. hãy dự đoán chiều cao Y
cat("Chiều cao của Y = ",paste0( round(PT$coefficients[1]+PT$coefficients[2]*5.5,2), "cm"))
## Chiều cao của Y =  28.08cm

Trực quan hóa dữ liệu để dễ quan sát

library(ggplot2)
ggplot(data, aes(x = X, y = Y))+
  geom_point(color = "indianred")+
geom_smooth(method = "lm", formula = y~x, size = 1)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Luân Ngọc Thơ

Bài 3.31. Nghiên cứu trọng lượng trẻ sơ sinh của nhóm với mẹ không hút thuốc lá, ta có kết quả (kg) như sau: 3,99 3,79 3,60 3,21 3,60 4,08 3,61 3,83 3,31 4,13 3,26 2,72 3,54 3,51 Giả sử rằng trọng lượng trẻ có phân phối chuẩn. Với độ tin cậy 95%, hãy ước lượng trọng lượng trung bình của trẻ sơ sinh ở nhóm với mẹ không hút thuốc lá.

# Dữ liệu
trong_luong <- c(3.99, 3.79, 3.60, 3.21, 3.60, 4.08, 3.61, 3.83, 3.31, 4.13, 3.26, 2.72, 3.54, 3.51)

# Số lượng mẫu
n <- length(trong_luong)

# Trọng lượng trung bình
mean_estimate <- mean(trong_luong)

# Độ lệch chuẩn
sd_estimate <- sd(trong_luong)

# Giá trị tới hạn (t-score) cho độ tin cậy 95%
t_score <- qt(0.975, df = n - 1)

# Khoảng tin cậy 95% cho trọng lượng trung bình
lower_bound <- mean_estimate - t_score * (sd_estimate / sqrt(n))
upper_bound <- mean_estimate + t_score * (sd_estimate / sqrt(n))

# In kết quả
print(paste("Trọng lượng trung bình ước lượng:", mean_estimate))
## [1] "Trọng lượng trung bình ước lượng: 3.58428571428571"
print(paste("Khoảng tin cậy 95%:", lower_bound, "-", upper_bound))
## [1] "Khoảng tin cậy 95%: 3.36431161505825 - 3.80425981351318"

áp dụng hàm.

# Dữ liệu
trong_luong <- c(3.99, 3.79, 3.60, 3.21, 3.60, 4.08, 3.61, 3.83, 3.31, 4.13, 3.26, 2.72, 3.54, 3.51)
library(BSDA)
test <- t.test(trong_luong, conf.level = 0.95)
print(paste("Trọng lượng trung bình ước lượng:", round(test$estimate,2)))
## [1] "Trọng lượng trung bình ước lượng: 3.58"
print(paste("Khoảng tin cậy 95%:", round(test$conf.int[1],2), "-", round(test$conf.int[2],2)))
## [1] "Khoảng tin cậy 95%: 3.36 - 3.8"

Ứng Thảo Nguyên

bài 4.31: Cô giáo cho rằng có đến 30% học sinh không làm bài tập về nhà, học sinh lại cho rằng cô giáo quá bi quan. Người ta kiểm tra 50 em học sinh của trường đó thì thấy 15 em không làm bài tập về nhà. Với mức ý nghĩa a=5% hãy kiểm tra nhận định nào đúng?

t <- prop.test(x = 15, n = 50 , p = 0.3, alternative = "two.side", correct = F)

t
## 
##  1-sample proportions test without continuity correction
## 
## data:  15 out of 50, null probability 0.3
## X-squared = 0, df = 1, p-value = 1
## alternative hypothesis: true p is not equal to 0.3
## 95 percent confidence interval:
##  0.1910355 0.4375035
## sample estimates:
##   p 
## 0.3
cat("x-squard:", ((15/50 - 0.3)/sqrt(0.3*(1-0.3)))*sqrt(50))
## x-squard: 0
if (abs((15/50 - 0.3)/sqrt(0.3*(1-0.3)))*sqrt(50) > qnorm(0.975)){
  cat("bác bỏ giả thiết 30% học sinh không làm bài tập về nhà")
}else{
  cat("chấp giả thiết 30% học sinh không làm bài tập về nhà")
}
## chấp giả thiết 30% học sinh không làm bài tập về nhà

Dương Tuấn Minh

Bài 4.2: chương 4

# Tạo một khung dữ liệu với hai cột: "Doanh_so" và "So_ho"

Doanh_so = c(rep(10.1, time = 2), rep(10.2, time = 3), rep(10.4, time = 8), rep(10.5, time = 13), rep(10.7, time = 25), rep(10.8, time = 20), rep(10.9, time = 12), rep(11, time = 10), rep(11.3, time = 6), rep(11.4, time = 1))

# Tính trung bình mẫu và phương sai mẫu của doanh số
trung_binh_mau <- mean(Doanh_so)
phuong_sai_mau <- 0.04

# Tính z_observed
do_lech_chuan_mau <- sqrt(phuong_sai_mau)
kich_thuoc_mau <- length(Doanh_so)
do_tin_cay <- 0.95
z_alpha_2 <- qnorm((1 + do_tin_cay) / 2)

muc_gia_tri_chuan <- 10.8
z_observed <- (trung_binh_mau - muc_gia_tri_chuan) / (do_lech_chuan_mau / sqrt(kich_thuoc_mau))

# So sánh giá trị thống kê với giá trị z-critical
if (abs(z_observed) > z_alpha_2) {
  cat("Bác bỏ giả thuyết: Doanh thu trung bình không phải là 10.8 triệu đồng\n")
} else {
  cat("Chấp nhận giả thuyết: Doanh thu trung bình là 10.8 triệu đồng\n")
}
## Bác bỏ giả thuyết: Doanh thu trung bình không phải là 10.8 triệu đồng