library(lessR)
## 
## lessR 4.5.2                          feedback: gerbing@pdx.edu 
## --------------------------------------------------------------
## > d <- Read("")  Read data file, many formats available, e.g., Excel
##   d is the default data frame, data= in analysis routines optional
## 
## Find examples of reading, writing, and manipulating data, graphics,
## testing means and proportions, regression, factor analysis,
## customization, forecasting, and aggregation to pivot tables.
##   Enter: browseVignettes("lessR")
## 
## Although most previous function calls still work, most
## visualization functions are now reorganized to three functions:
##    Chart(): type = "bar", "pie", "radar", "bubble", "dot",
##                    "sunburst", "treemap", "icicle"
##    X(): type="histogram", "density", "vbs", and more
##    XY(): type="scatter" for a scatterplot, or "contour", "smooth"
## There is also Flows() for Sankey flow diagrams.
## 
## View lessR updates, now including modern time series forecasting.
##   Enter: news(package="lessR"), or ?Chart, ?X, or ?XY
## 
## Interactive data analysis for constructing visualizations.
##   Enter: interact()
library(table1)
## 
## Attaching package: 'table1'
## The following object is masked from 'package:lessR':
## 
##     label
## The following objects are masked from 'package:base':
## 
##     units, units<-
data <- read.csv(file.choose())
dim(data)
## [1] 100   8
names(data)
## [1] "ho_id"     "khu_vuc"   "gioi_tinh" "tuoi"      "hoc_van"   "thu_nhap" 
## [7] "chi_tieu"  "tiet_kiem"
colMeans(data[,c("thu_nhap","chi_tieu","tiet_kiem")])
##  thu_nhap  chi_tieu tiet_kiem 
##  14575000  10050000   4525000
str(data)
## 'data.frame':    100 obs. of  8 variables:
##  $ ho_id    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ khu_vuc  : chr  "Nong_thon" "Thanh_thi" "Nong_thon" "Thanh_thi" ...
##  $ gioi_tinh: chr  "Nu" "Nam" "Nu" "Nam" ...
##  $ tuoi     : int  31 32 33 34 35 36 37 38 39 40 ...
##  $ hoc_van  : chr  "THCS" "THCS" "THPT" "Dai_hoc" ...
##  $ thu_nhap : int  7150000 7300000 7450000 7600000 7750000 7900000 8050000 8200000 8350000 8500000 ...
##  $ chi_tieu : int  5100000 5200000 5300000 5400000 5500000 5600000 5700000 5800000 5900000 6000000 ...
##  $ tiet_kiem: int  2050000 2100000 2150000 2200000 2250000 2300000 2350000 2400000 2450000 2500000 ...
table1(~ thu_nhap + chi_tieu + tiet_kiem | khu_vuc, data = data)
Nong_thon
(N=50)
Thanh_thi
(N=50)
Overall
(N=100)
thu_nhap
Mean (SD) 14500000 (4370000) 14700000 (4370000) 14600000 (4350000)
Median [Min, Max] 14500000 [7150000, 21900000] 14700000 [7300000, 22000000] 14600000 [7150000, 22000000]
chi_tieu
Mean (SD) 10000000 (2920000) 10100000 (2920000) 10100000 (2900000)
Median [Min, Max] 10000000 [5100000, 14900000] 10100000 [5200000, 15000000] 10100000 [5100000, 15000000]
tiet_kiem
Mean (SD) 4500000 (1460000) 4550000 (1460000) 4530000 (1450000)
Median [Min, Max] 4500000 [2050000, 6950000] 4550000 [2100000, 7000000] 4530000 [2050000, 7000000]
table1(~ thu_nhap + chi_tieu + tiet_kiem | hoc_van, data = data)
Dai_hoc
(N=25)
THCS
(N=50)
THPT
(N=25)
Overall
(N=100)
thu_nhap
Mean (SD) 14800000 (4420000) 14500000 (4370000) 14500000 (4410000) 14600000 (4350000)
Median [Min, Max] 14800000 [7600000, 22000000] 14400000 [7150000, 21700000] 14700000 [7450000, 21900000] 14600000 [7150000, 22000000]
chi_tieu
Mean (SD) 10200000 (2940000) 10000000 (2920000) 10000000 (2940000) 10100000 (2900000)
Median [Min, Max] 10200000 [5400000, 15000000] 9950000 [5100000, 14800000] 10100000 [5300000, 14900000] 10100000 [5100000, 15000000]
tiet_kiem
Mean (SD) 4600000 (1470000) 4500000 (1460000) 4500000 (1470000) 4530000 (1450000)
Median [Min, Max] 4600000 [2200000, 7000000] 4480000 [2050000, 6900000] 4550000 [2150000, 6950000] 4530000 [2050000, 7000000]

Nhận xét kết quả

Theo khu vực sinh sống:

Kết quả thống kê cho thấy khu vực thành thị có thu nhập trung bình cao hơn

so với khu vực nông thôn (14.700.000 so với 14.500.000). Đồng thời, mức chi

tiêu trung bình của người dân thành thị cũng cao hơn (10.100.000 so với

10.000.000). Mức tiết kiệm trung bình của khu vực thành thị cũng cao hơn

(4.550.000 so với 4.500.000). Điều này cho thấy người dân ở khu vực thành thị

có điều kiện kinh tế tốt hơn nên thu nhập, chi tiêu và khả năng tiết kiệm

đều cao hơn so với khu vực nông thôn.

Theo trình độ học vấn:

Kết quả phân tích cho thấy nhóm có trình độ đại học có thu nhập trung bình

cao nhất (14.800.000), cao hơn so với nhóm THCS và THPT (khoảng 14.500.000).

Mức chi tiêu trung bình của nhóm đại học cũng cao nhất (10.200.000), tiếp

theo là nhóm THPT (10.100.000) và nhóm THCS (10.000.000). Tương tự, mức tiết

kiệm trung bình của nhóm đại học cũng cao nhất (4.600.000), trong khi nhóm

THCS và THPT khoảng 4.500.000. Điều này cho thấy trình độ học vấn cao hơn

thường đi kèm với thu nhập và khả năng tích lũy cao hơn.

ggplot(data, aes(x = thu_nhap)) +
  geom_histogram(binwidth = 500000, fill="skyblue", color="black") +
  labs(title = "Phân bố thu nhập", x = "Thu nhập", y = "Tần số")

ggplot(data, aes(x = khu_vuc, y = chi_tieu)) +
  geom_boxplot(fill="orange") +
  labs(title = "Chi tiêu theo khu vực", x = "Khu vực", y = "Chi tiêu")

ggplot(data, aes(x = thu_nhap, y = chi_tieu)) +
  geom_point(color="blue") +
  labs(title = "Mối quan hệ thu nhập và chi tiêu",
       x = "Thu nhập",
       y = "Chi tiêu")

#Dựa trên các biểu đồ phân tích dữ liệu về thu nhập và chi tiêu của các hộ gia đình, có thể rút ra một số nhận xét quan trọng về mối quan hệ giữa thu nhập, khu vực sinh sống và hành vi tiêu dùng.

#Trước hết, kết quả từ biểu đồ phân tán giữa thu nhập và chi tiêu cho thấy thu nhập có ảnh hưởng rõ rệt đến mức chi tiêu của các hộ gia đình. Các điểm dữ liệu trên biểu đồ tạo thành một xu hướng tăng gần như tuyến tính, cho thấy khi thu nhập của hộ gia đình tăng lên thì mức chi tiêu cũng tăng theo. Điều này phản ánh mối quan hệ cùng chiều giữa hai biến số. Những hộ có thu nhập thấp thường có mức chi tiêu thấp hơn, trong khi những hộ có thu nhập cao hơn có khả năng chi tiêu nhiều hơn cho các nhu cầu sinh hoạt, dịch vụ và các hoạt động khác. Như vậy, thu nhập được xem là một yếu tố quan trọng quyết định khả năng và mức độ tiêu dùng của hộ gia đình.

#Thứ hai, khi so sánh mức chi tiêu giữa khu vực nông thôn và thành thị thông qua biểu đồ hộp (boxplot), có thể thấy rằng các hộ gia đình ở khu vực thành thị có xu hướng chi tiêu cao hơn so với khu vực nông thôn. Điều này thường gắn liền với việc thu nhập của các hộ gia đình ở thành thị cao hơn do có nhiều cơ hội việc làm, mức lương cao hơn và khả năng tiếp cận các hoạt động kinh tế đa dạng hơn. Ngược lại, ở khu vực nông thôn, thu nhập của người dân thường thấp hơn nên mức chi tiêu cũng có xu hướng thấp hơn. Sự khác biệt này phản ánh đặc điểm phát triển kinh tế – xã hội giữa hai khu vực.

#Cuối cùng, kết quả phân tích trên phù hợp với lý thuyết kinh tế tiêu dùng trong kinh tế học. Theo lý thuyết hàm tiêu dùng của Keynes, tiêu dùng của các cá nhân hay hộ gia đình phụ thuộc chủ yếu vào thu nhập hiện tại. Khi thu nhập tăng lên, tiêu dùng cũng tăng lên nhưng thường tăng với tốc độ chậm hơn so với thu nhập, phần còn lại có thể được dành cho tiết kiệm. Do đó, kết quả phân tích dữ liệu trong bài cho thấy mối quan hệ giữa thu nhập và chi tiêu phù hợp với các dự đoán của lý thuyết kinh tế tiêu dùng, đồng thời phản ánh đúng thực tế hành vi tiêu dùng của các hộ gia đình.