dulieu_hh=read.csv("C:\\Users\\MINH ANH\\OneDrive\\Máy tính\\Thuc hanh PTDL.csv\\doanh_thu_ban_le.csv")
| Họ và tên | Mã sinh viên | Đánh giá mức độ hoàn thành nhiệm vụ (%) |
|---|---|---|
| Hồ Minh Ánh | 686616 | 100% |
| Nguyễn Thị Phương Dung | 686656 | 100% |
| Nguyễn Thu Giang | 686703 | 100% |
| Hoàng Thị Hậu | 686725 | 100% |
| Vương Thị Hiền | 686738 | 100% |
| Lưu Khánh Linh | 686821 | 100% |
cat("So quan sat;", nrow(dulieu_hh), "\nSo bien:", ncol(dulieu_hh),"\n")
## So quan sat; 108
## So bien: 4
-Bộ dữ liệu có 108 quan sát
names(dulieu_hh)
## [1] "thang" "san_pham" "khu_vuc" "doanh_thu"
-Bộ dữ liệu có 4 biến: “thang” ; “san_pham” ; “khu_vuc” ; “doanh_thu”
str(dulieu_hh)
## 'data.frame': 108 obs. of 4 variables:
## $ thang : int 1 1 1 1 1 1 1 1 1 2 ...
## $ san_pham : chr "A" "A" "A" "B" ...
## $ khu_vuc : chr "Bac" "Trung" "Nam" "Bac" ...
## $ doanh_thu: int 170 170 170 220 220 220 270 270 270 190 ...
library(table1)
##
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
##
## units, units<-
table1(~ doanh_thu | khu_vuc, data = dulieu_hh)
| Bac (N=36) |
Nam (N=36) |
Trung (N=36) |
Overall (N=108) |
|
|---|---|---|---|---|
| doanh_thu | ||||
| Mean (SD) | 330 (81.3) | 330 (81.3) | 330 (81.3) | 330 (80.6) |
| Median [Min, Max] | 330 [170, 490] | 330 [170, 490] | 330 [170, 490] | 330 [170, 490] |
Trong bảng số liệu, cả ba khu vực Bắc, Nam và Trung đều có doanh thu trung bình (Mean) là 330. Độ lệch chuẩn (SD) của mỗi vùng cũng hoàn toàn giống nhau, đều bằng 81.3. Điều này cho thấy mức độ phân tán của doanh thu xung quanh giá trị trung bình là như nhau ở cả ba miền. Do đó, không có khu vực nào có doanh thu trung bình cao nhất.
table1(~ doanh_thu | san_pham, data = dulieu_hh)
| A (N=36) |
B (N=36) |
C (N=36) |
Overall (N=108) |
|
|---|---|---|---|---|
| doanh_thu | ||||
| Mean (SD) | 280 (70.0) | 330 (70.0) | 380 (70.0) | 330 (80.6) |
| Median [Min, Max] | 280 [170, 390] | 330 [220, 440] | 380 [270, 490] | 330 [170, 490] |
Sản phẩm C có giá trị trung bình và trung vị đều đạt 380, trong khi sản phẩm B chỉ ở mức 330 và A là 280. Điều này cho thấy không chỉ một vài trường hợp riêng lẻ mà nhìn chung doanh thu của C luôn vượt trội.
Ngoài ra, dù độ lệch chuẩn của cả ba sản phẩm đều giống nhau (70), nhưng khoảng doanh thu của C lại nằm ở mức cao hơn (từ 270 đến 490). Điều đó cho thấy sản phẩm C không chỉ bán tốt mà còn duy trì doanh thu ổn định ở mức cao.
Vì vậy, có thể kết luận rằng sản phẩm C là sản phẩm bán chạy nhất trong ba sản phẩm A, B và C.
library(ggplot2)
tong_kv <- aggregate(doanh_thu ~ khu_vuc, dulieu_hh, sum)
ggplot(tong_kv, aes(x = khu_vuc, y = doanh_thu)) +
geom_col(fill = "steelblue") +
labs(title = "Tong doanh thu theo khu vuc",
x = "Khu vuc",
y = "Tong doanh thu")
library(ggplot2)
tong_sp <- aggregate(doanh_thu ~ san_pham, dulieu_hh, sum)
ggplot(tong_sp, aes(x = san_pham, y = doanh_thu)) +
geom_col(fill = "orange") +
labs(title = "Tong doanh thu theo san pham ",
x = "San pham",
y = "Tong doanh thu")
library(ggplot2)
tong_kv_sp <- aggregate(doanh_thu ~ khu_vuc + san_pham, dulieu_hh, sum)
ggplot(tong_kv_sp, aes(x = khu_vuc, y = doanh_thu, fill = san_pham)) +
geom_col(position = "dodge") +
labs(title = "Tong doanh thu theo khu vuc va san pham",
x = "Khu vuc",
y = "Tong doanh thu",
fill = "San pham")
hist(dulieu_hh$doanh_thu,
main = "Phân bố doanh thu",
xlab = "Doanh thu",
col = "lightblue",
border = "black")
Dựa trên phân tích dữ liệu doanh thu bán lẻ, ba khu vực Bắc, Nam và Trung có tổng doanh thu bằng nhau, mỗi khu vực đạt 11.880 đơn vị (tổng cộng 35.640). Thống kê mô tả cho thấy giá trị trung bình và trung vị đều giống nhau (Mean = 330, Median = 330), với mức dao động từ 170 đến 490. Điều này phản ánh doanh nghiệp đang phân bổ hiệu suất kinh doanh đồng đều giữa các vùng, không có khu vực nào vượt trội, thể hiện chiến lược phân phối ổn định. Tuy nhiên, để xác định thị trường trọng điểm, cần xem xét thêm các yếu tố như chi phí vận hành, tiềm năng tăng trưởng và mức độ cạnh tranh.
Xét theo sản phẩm, trong ba dòng A, B và C, sản phẩm C dẫn đầu với tổng doanh thu 13.680 đơn vị, tiếp theo là B (11.880) và A (10.080). Doanh thu trung bình của C đạt 380 (SD = 70), cao hơn so với B (330) và A (280). Xu hướng tăng từ A → B → C diễn ra nhất quán, và sản phẩm C duy trì vị thế dẫn đầu ở cả ba khu vực, cho thấy sức hút thị trường ổn định.
Từ góc độ quản lý, nhóm đề xuất một số định hướng.Đầu tiêt, tập trung phát triển sản phẩm C thông qua tăng cường marketing, mở rộng kênh phân phối và phát triển phiên bản cao cấp.Tiếp đó, cải thiện hiệu suất sản phẩm A bằng cách phân tích nguyên nhân doanh thu thấp và tái định vị phù hợp. Kế tiếp, cần phân tích sâu từng khu vực để xác định nơi có chi phí thấp hoặc tiềm năng cao nhằm ưu tiên mở rộng. Cuối cùng, doanh nghiệp nên xem xét thâm nhập thị trường mới, tận dụng sản phẩm C như một lợi thế cạnh tranh.