dulieu_hh=read.csv("C:\\Users\\MINH ANH\\OneDrive\\Máy tính\\Thuc hanh PTDL.csv\\doanh_thu_ban_le.csv")
Họ và tên Mã sinh viên Đánh giá mức độ hoàn thành nhiệm vụ (%)
Hồ Minh Ánh 686616 100%
Nguyễn Thị Phương Dung 686656 100%
Nguyễn Thu Giang 686703 100%
Hoàng Thị Hậu 686725 100%
Vương Thị Hiền 686738 100%
Lưu Khánh Linh 686821 100%

Mô tả dữ liệu

cat("So quan sat;", nrow(dulieu_hh), "\nSo bien:", ncol(dulieu_hh),"\n")
## So quan sat; 108 
## So bien: 4

-Bộ dữ liệu có 108 quan sát

names(dulieu_hh)
## [1] "thang"     "san_pham"  "khu_vuc"   "doanh_thu"

-Bộ dữ liệu có 4 biến: “thang” ; “san_pham” ; “khu_vuc” ; “doanh_thu”

Kiểu dữ liệu của từng biến

str(dulieu_hh)
## 'data.frame':    108 obs. of  4 variables:
##  $ thang    : int  1 1 1 1 1 1 1 1 1 2 ...
##  $ san_pham : chr  "A" "A" "A" "B" ...
##  $ khu_vuc  : chr  "Bac" "Trung" "Nam" "Bac" ...
##  $ doanh_thu: int  170 170 170 220 220 220 270 270 270 190 ...

Mô tả doanh thu - sử dụng table1

Bảng mô tả doanh thu theo khu vực

library(table1)
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
table1(~ doanh_thu | khu_vuc, data = dulieu_hh)
Bac
(N=36)
Nam
(N=36)
Trung
(N=36)
Overall
(N=108)
doanh_thu
Mean (SD) 330 (81.3) 330 (81.3) 330 (81.3) 330 (80.6)
Median [Min, Max] 330 [170, 490] 330 [170, 490] 330 [170, 490] 330 [170, 490]

Trong bảng số liệu, cả ba khu vực Bắc, Nam và Trung đều có doanh thu trung bình (Mean) là 330. Độ lệch chuẩn (SD) của mỗi vùng cũng hoàn toàn giống nhau, đều bằng 81.3. Điều này cho thấy mức độ phân tán của doanh thu xung quanh giá trị trung bình là như nhau ở cả ba miền. Do đó, không có khu vực nào có doanh thu trung bình cao nhất.

Bảng mô tả doanh thu theo sản phẩm

table1(~ doanh_thu | san_pham, data = dulieu_hh)
A
(N=36)
B
(N=36)
C
(N=36)
Overall
(N=108)
doanh_thu
Mean (SD) 280 (70.0) 330 (70.0) 380 (70.0) 330 (80.6)
Median [Min, Max] 280 [170, 390] 330 [220, 440] 380 [270, 490] 330 [170, 490]

Sản phẩm C có giá trị trung bình và trung vị đều đạt 380, trong khi sản phẩm B chỉ ở mức 330 và A là 280. Điều này cho thấy không chỉ một vài trường hợp riêng lẻ mà nhìn chung doanh thu của C luôn vượt trội.

Ngoài ra, dù độ lệch chuẩn của cả ba sản phẩm đều giống nhau (70), nhưng khoảng doanh thu của C lại nằm ở mức cao hơn (từ 270 đến 490). Điều đó cho thấy sản phẩm C không chỉ bán tốt mà còn duy trì doanh thu ổn định ở mức cao.

Vì vậy, có thể kết luận rằng sản phẩm C là sản phẩm bán chạy nhất trong ba sản phẩm A, B và C.

Trực quan hóa dữ liệu

Biểu đồ tổng doanh thu theo khu vực

library(ggplot2)
tong_kv <- aggregate(doanh_thu ~ khu_vuc, dulieu_hh, sum)

ggplot(tong_kv, aes(x = khu_vuc, y = doanh_thu)) +
  geom_col(fill = "steelblue") +
  labs(title = "Tong doanh thu theo khu vuc",
       x = "Khu vuc",
       y = "Tong doanh thu")

Biểu đồ tổng doanh thu theo sản phẩm

library(ggplot2)
tong_sp <- aggregate(doanh_thu ~ san_pham, dulieu_hh, sum)

ggplot(tong_sp, aes(x = san_pham, y = doanh_thu)) +
  geom_col(fill = "orange") +
  labs(title = "Tong doanh thu theo san pham ",
       x = "San pham",
       y = "Tong doanh thu")

Biểu đồ tổng doanh thu theo khu vực và sản phẩm

library(ggplot2)

tong_kv_sp <- aggregate(doanh_thu ~ khu_vuc + san_pham, dulieu_hh, sum)

ggplot(tong_kv_sp, aes(x = khu_vuc, y = doanh_thu, fill = san_pham)) +
  geom_col(position = "dodge") +
  labs(title = "Tong doanh thu theo khu vuc va san pham",
       x = "Khu vuc",
       y = "Tong doanh thu",
       fill = "San pham")

Biểu đồ phân bố doanh thu sử dụng histogram

hist(dulieu_hh$doanh_thu,
     main = "Phân bố doanh thu",
     xlab = "Doanh thu",
     col = "lightblue",
     border = "black")

Dựa trên phân tích dữ liệu doanh thu bán lẻ, ba khu vực Bắc, Nam và Trung có tổng doanh thu bằng nhau, mỗi khu vực đạt 11.880 đơn vị (tổng cộng 35.640). Thống kê mô tả cho thấy giá trị trung bình và trung vị đều giống nhau (Mean = 330, Median = 330), với mức dao động từ 170 đến 490. Điều này phản ánh doanh nghiệp đang phân bổ hiệu suất kinh doanh đồng đều giữa các vùng, không có khu vực nào vượt trội, thể hiện chiến lược phân phối ổn định. Tuy nhiên, để xác định thị trường trọng điểm, cần xem xét thêm các yếu tố như chi phí vận hành, tiềm năng tăng trưởng và mức độ cạnh tranh.

Xét theo sản phẩm, trong ba dòng A, B và C, sản phẩm C dẫn đầu với tổng doanh thu 13.680 đơn vị, tiếp theo là B (11.880) và A (10.080). Doanh thu trung bình của C đạt 380 (SD = 70), cao hơn so với B (330) và A (280). Xu hướng tăng từ A → B → C diễn ra nhất quán, và sản phẩm C duy trì vị thế dẫn đầu ở cả ba khu vực, cho thấy sức hút thị trường ổn định.

Từ góc độ quản lý, nhóm đề xuất một số định hướng.Đầu tiêt, tập trung phát triển sản phẩm C thông qua tăng cường marketing, mở rộng kênh phân phối và phát triển phiên bản cao cấp.Tiếp đó, cải thiện hiệu suất sản phẩm A bằng cách phân tích nguyên nhân doanh thu thấp và tái định vị phù hợp. Kế tiếp, cần phân tích sâu từng khu vực để xác định nơi có chi phí thấp hoặc tiềm năng cao nhằm ưu tiên mở rộng. Cuối cùng, doanh nghiệp nên xem xét thâm nhập thị trường mới, tận dụng sản phẩm C như một lợi thế cạnh tranh.