📘 Giới thiệu tổng quan về phân tích dữ liệu

🎯 Mục tiêu của phần học:

  • Hiểu rõ khái niệm phân tích dữ liệu (Data Analysis) trong bối cảnh hiện đại
  • Phân biệt các cấp độ phân tích dữ liệu
  • Nhận biết các công cụ phân tích dữ liệu phổ biến hiện nay
  • Làm rõ mối quan hệ giữa phân tích dữ liệu và thống kê

1️⃣ Khái niệm phân tích dữ liệu là gì?

Chiến lược chuyển đổi số hiện nay cho doanh nghiệp

Bức tranh toàn cảnh

Phân tích dữ liệu là quá trình thu thập, xử lý, trực quan và mô hình hóa dữ liệu để: - Khám phá thông tin có giá trị - Hỗ trợ ra quyết định - Dự đoán xu hướng hoặc tối ưu hóa hoạt động

🧠 Có thể hiểu đơn giản là:
> “Biến dữ liệu thành thông tin có thể hành động được.”


2️⃣ Bốn cấp độ chính phân tích dữ liệu (4 Levels of Analytics)

Cấp độ Tên gọi Câu hỏi chính Ví dụ
1️⃣ Descriptive (Mô tả) Chuyện gì đã xảy ra? Tổng kết doanh số, số khách hàng
2️⃣ Diagnostic (Chẩn đoán) Tại sao lại xảy ra? Vì sao lợi nhuận giảm ở khu vực A?
3️⃣ Predictive (Dự báo) Điều gì sẽ xảy ra? Dự đoán doanh số tháng sau
4️⃣ Prescriptive (Khuyến nghị) Nên làm gì tiếp theo? Đề xuất chiến lược tối ưu hóa chi phí

👉 Trong khóa học này, ta tập trung vào cấp 1–3, đặc biệt là ứng dụng thống kê và mô hình dự báo bằng R.


3️⃣ Công cụ phân tích dữ liệu hiện nay

Loại công cụ Phổ biến hiện nay Mô tả
Ngôn ngữ lập trình R, Python Phân tích dữ liệu chuyên sâu, mô hình hóa, báo cáo
BI tools Power BI, Tableau Trực quan hóa dữ liệu, dashboard
Bảng tính Excel Phân tích nhanh, phổ thông
CSDL & truy vấn SQL Lấy dữ liệu từ hệ thống, xử lý ban đầu

💡 Trong khóa học này, chúng ta sử dụng R kết hợp với tidyverse, ggplot2, stats,… để phân tích & mô hình hóa thống kê.


4️⃣ Mối quan hệ giữa thống kêphân tích dữ liệu

Khía cạnh Thống kê Phân tích dữ liệu
Mục tiêu Hiểu hiện tượng, kiểm định giả thuyết Khám phá, dự đoán, hỗ trợ ra quyết định
Công cụ Hồi quy, kiểm định, phân phối Kết hợp thống kê, trực quan hóa, học máy
Loại học Học suy diễn (inference) Học từ dữ liệu (exploration, prediction)
Ví dụ Kiểm định sự khác biệt giữa hai nhóm Dự đoán xác suất khách hàng rời bỏ

📌 Thống kê là nền tảng cốt lõi của phân tích dữ liệu – giúp ta diễn giải, kiểm định, đánh giá tính chính xác của mô hình.


✅ Tổng kết đầu buổi:

  • Phân tích dữ liệu không chỉ là “vẽ biểu đồ” – mà là hiểu sâu và ra quyết định từ dữ liệu
  • Cần hiểu mức độ phân tích để áp dụng công cụ/mô hình phù hợp
  • Thống kê giúp giải thích và kiểm soát dữ liệu, còn phân tích dữ liệu hướng đến tối ưu hóa, hành động và dự đoán

📝 Gợi ý cho học viên: - Bạn đã từng sử dụng phân tích dữ liệu ở cấp độ nào? - Trong công việc, bạn cần phân tích gì nhất: mô tả, chẩn đoán hay dự báo?