library(lessR)
##
## lessR 4.5.2 feedback: gerbing@pdx.edu
## --------------------------------------------------------------
## > d <- Read("") Read data file, many formats available, e.g., Excel
## d is the default data frame, data= in analysis routines optional
##
## Find examples of reading, writing, and manipulating data, graphics,
## testing means and proportions, regression, factor analysis,
## customization, forecasting, and aggregation to pivot tables.
## Enter: browseVignettes("lessR")
##
## Although most previous function calls still work, most
## visualization functions are now reorganized to three functions:
## Chart(): type = "bar", "pie", "radar", "bubble", "dot",
## "sunburst", "treemap", "icicle"
## X(): type="histogram", "density", "vbs", and more
## XY(): type="scatter" for a scatterplot, or "contour", "smooth"
## There is also Flows() for Sankey flow diagrams.
##
## View lessR updates, now including modern time series forecasting.
## Enter: news(package="lessR"), or ?Chart, ?X, or ?XY
##
## Interactive data analysis for constructing visualizations.
## Enter: interact()
library(table1)
##
## Attaching package: 'table1'
## The following object is masked from 'package:lessR':
##
## label
## The following objects are masked from 'package:base':
##
## units, units<-
data <- read.csv(file.choose())
dim(data)
## [1] 100 8
names(data)
## [1] "ho_id" "khu_vuc" "gioi_tinh" "tuoi" "hoc_van" "thu_nhap"
## [7] "chi_tieu" "tiet_kiem"
colMeans(data[,c("thu_nhap","chi_tieu","tiet_kiem")])
## thu_nhap chi_tieu tiet_kiem
## 14575000 10050000 4525000
str(data)
## 'data.frame': 100 obs. of 8 variables:
## $ ho_id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ khu_vuc : chr "Nong_thon" "Thanh_thi" "Nong_thon" "Thanh_thi" ...
## $ gioi_tinh: chr "Nu" "Nam" "Nu" "Nam" ...
## $ tuoi : int 31 32 33 34 35 36 37 38 39 40 ...
## $ hoc_van : chr "THCS" "THCS" "THPT" "Dai_hoc" ...
## $ thu_nhap : int 7150000 7300000 7450000 7600000 7750000 7900000 8050000 8200000 8350000 8500000 ...
## $ chi_tieu : int 5100000 5200000 5300000 5400000 5500000 5600000 5700000 5800000 5900000 6000000 ...
## $ tiet_kiem: int 2050000 2100000 2150000 2200000 2250000 2300000 2350000 2400000 2450000 2500000 ...
table1(~ thu_nhap + chi_tieu + tiet_kiem | khu_vuc, data = data)
| Nong_thon (N=50) |
Thanh_thi (N=50) |
Overall (N=100) |
|
|---|---|---|---|
| thu_nhap | |||
| Mean (SD) | 14500000 (4370000) | 14700000 (4370000) | 14600000 (4350000) |
| Median [Min, Max] | 14500000 [7150000, 21900000] | 14700000 [7300000, 22000000] | 14600000 [7150000, 22000000] |
| chi_tieu | |||
| Mean (SD) | 10000000 (2920000) | 10100000 (2920000) | 10100000 (2900000) |
| Median [Min, Max] | 10000000 [5100000, 14900000] | 10100000 [5200000, 15000000] | 10100000 [5100000, 15000000] |
| tiet_kiem | |||
| Mean (SD) | 4500000 (1460000) | 4550000 (1460000) | 4530000 (1450000) |
| Median [Min, Max] | 4500000 [2050000, 6950000] | 4550000 [2100000, 7000000] | 4530000 [2050000, 7000000] |
table1(~ thu_nhap + chi_tieu + tiet_kiem | hoc_van, data = data)
| Dai_hoc (N=25) |
THCS (N=50) |
THPT (N=25) |
Overall (N=100) |
|
|---|---|---|---|---|
| thu_nhap | ||||
| Mean (SD) | 14800000 (4420000) | 14500000 (4370000) | 14500000 (4410000) | 14600000 (4350000) |
| Median [Min, Max] | 14800000 [7600000, 22000000] | 14400000 [7150000, 21700000] | 14700000 [7450000, 21900000] | 14600000 [7150000, 22000000] |
| chi_tieu | ||||
| Mean (SD) | 10200000 (2940000) | 10000000 (2920000) | 10000000 (2940000) | 10100000 (2900000) |
| Median [Min, Max] | 10200000 [5400000, 15000000] | 9950000 [5100000, 14800000] | 10100000 [5300000, 14900000] | 10100000 [5100000, 15000000] |
| tiet_kiem | ||||
| Mean (SD) | 4600000 (1470000) | 4500000 (1460000) | 4500000 (1470000) | 4530000 (1450000) |
| Median [Min, Max] | 4600000 [2200000, 7000000] | 4480000 [2050000, 6900000] | 4550000 [2150000, 6950000] | 4530000 [2050000, 7000000] |
ggplot(data, aes(x = thu_nhap)) +
geom_histogram(binwidth = 500000, fill="skyblue", color="black") +
labs(title = "Phân bố thu nhập", x = "Thu nhập", y = "Tần số")
ggplot(data, aes(x = khu_vuc, y = chi_tieu)) +
geom_boxplot(fill="orange") +
labs(title = "Chi tiêu theo khu vực", x = "Khu vực", y = "Chi tiêu")
ggplot(data, aes(x = thu_nhap, y = chi_tieu)) +
geom_point(color="blue") +
labs(title = "Mối quan hệ thu nhập và chi tiêu",
x = "Thu nhập",
y = "Chi tiêu")
#Dựa trên các biểu đồ phân tích dữ liệu về thu nhập và chi tiêu của các
hộ gia đình, có thể rút ra một số nhận xét quan trọng về mối quan hệ
giữa thu nhập, khu vực sinh sống và hành vi tiêu dùng.
#Trước hết, kết quả từ biểu đồ phân tán giữa thu nhập và chi tiêu cho thấy thu nhập có ảnh hưởng rõ rệt đến mức chi tiêu của các hộ gia đình. Các điểm dữ liệu trên biểu đồ tạo thành một xu hướng tăng gần như tuyến tính, cho thấy khi thu nhập của hộ gia đình tăng lên thì mức chi tiêu cũng tăng theo. Điều này phản ánh mối quan hệ cùng chiều giữa hai biến số. Những hộ có thu nhập thấp thường có mức chi tiêu thấp hơn, trong khi những hộ có thu nhập cao hơn có khả năng chi tiêu nhiều hơn cho các nhu cầu sinh hoạt, dịch vụ và các hoạt động khác. Như vậy, thu nhập được xem là một yếu tố quan trọng quyết định khả năng và mức độ tiêu dùng của hộ gia đình.
#Thứ hai, khi so sánh mức chi tiêu giữa khu vực nông thôn và thành thị thông qua biểu đồ hộp (boxplot), có thể thấy rằng các hộ gia đình ở khu vực thành thị có xu hướng chi tiêu cao hơn so với khu vực nông thôn. Điều này thường gắn liền với việc thu nhập của các hộ gia đình ở thành thị cao hơn do có nhiều cơ hội việc làm, mức lương cao hơn và khả năng tiếp cận các hoạt động kinh tế đa dạng hơn. Ngược lại, ở khu vực nông thôn, thu nhập của người dân thường thấp hơn nên mức chi tiêu cũng có xu hướng thấp hơn. Sự khác biệt này phản ánh đặc điểm phát triển kinh tế – xã hội giữa hai khu vực.
#Cuối cùng, kết quả phân tích trên phù hợp với lý thuyết kinh tế tiêu dùng trong kinh tế học. Theo lý thuyết hàm tiêu dùng của Keynes, tiêu dùng của các cá nhân hay hộ gia đình phụ thuộc chủ yếu vào thu nhập hiện tại. Khi thu nhập tăng lên, tiêu dùng cũng tăng lên nhưng thường tăng với tốc độ chậm hơn so với thu nhập, phần còn lại có thể được dành cho tiết kiệm. Do đó, kết quả phân tích dữ liệu trong bài cho thấy mối quan hệ giữa thu nhập và chi tiêu phù hợp với các dự đoán của lý thuyết kinh tế tiêu dùng, đồng thời phản ánh đúng thực tế hành vi tiêu dùng của các hộ gia đình.