Bài tập về nhà tuần 2
Dữ liệu nghiên cứu
Dữ liệu được thu thập từ dữ liệu lịch sử bán hàng của cửa hàng
DQLabs từ năm 2009-2010, với tổng cộng 2000 quan sát và gồm 5 biến.
Giải thích các biến
1. order_status: trạng thái của đơn hàng (order finished/order
cancelled/order returned).
2. order_quantity: số lượng sản phẩm trên một đơn hàng.
3. sales: doanh số bán hàng trên mỗi đơn hàng (đơn vị: IDR)
4. discount: phần trăm chiết khấu
5. product_category: loại sản phẩm (office
supplies/furniture/technology)
Dữ liệu nghiên cứu gồm 2000 quan sát và 5 biến trong đó có 3 biến
định lượng và hai biến định tính.
Lựa chọn các biến phụ thuộc: 2 biến gồm 1 biến định tính và 1 biến
định lượng
Biến định lượng: sales(doanh số bán hàng trên mỗi đơn hàng)
Biến định tính: order_status (tình trạng đơn hàng)
Phân tích doanh số bán hàng của cửa hàng sẽ có liên quan đến các yếu
tố như số lượng sản phẩm, phần trăm chiết khấu và loại sản phẩm. Vậy
liệu rằng doanh thu của đơn hàng khi đơn hàng đã được giao, đơn hàng bị
hủy bỏ hay đơn hàng bị trả lại có gì khác biệt không. Nên 2 biến sales
và order_status được chọn để phân tích dựa trên dữ liệu của các biến độc
lập còn lại.