Chủ đề 1: QUY TRÌNH BI

Khái niệm cơ bản

Business Intelligence được hiểu là hoạt động phân tích kinh doanh. Đây là một vị trí công việc thường xuyên tận dụng các phần mềm, dịch vụ cung cấp thông tin để có thể chuyển đổi lại thành các quyết định có liên quan đến chiến lược kinh doanh, marketing cho một doanh nghiệp bất kỳ trên thị trường. Những công cụ thu thập thông tin phân tích kinh doanh sẽ tập hợp, trình bày các thông tin dưới dạng bảng biểu, biểu đồ, tóm tắt để giúp cho người dùng có thể hiểu rõ hơn về tình hình kinh doanh của doanh nghiệp mình. Có thể hiểu đơn giản, BI là một giải pháp hữu dụng trong việc hỗ trợ ra quyết định nhằm giúp tổ chức cải thiện lợi nhuận và hiệu suất bằng cách kết hợp các kỹ thuật xử lý thông tin một cách hiệu quả nhất.

Quy trình BI cơ bản

1. DATA SOURCES (NGUỒN DỮ LIỆU):

  • Là cơ sở dữ liệu thô (thường là cơ sở dữ liệu quan hệ) đến từ nhiều nguồn khác nhau như các ứng dụng business như Human Resource Management (HRM), Customer relationship management (CRM), phần mềm bán hàng, website thương mại điện tử…
  • Có thể là bất cứ hệ quản trị cơ sở dữ liệu nào như MySQL, Oracle, SQL, DB2, …
  • Thường được thiết kế theo mô hình cơ sở dữ liệu quan hệ ( vì dạng mô hình này đang rất phổ biến trong thực tế )

2. DATA WAREHOUSE (NHÀ KHO DỮ LIỆU):

  • Là cơ sở dữ liệu được thiết kế theo mô hình khác với CSDL quan hệ và là nơi lưu trữ dữ liệu lâu dài của tổ chức
  • Dữ liệu của Data Warehouse chỉ có thể đọc, không ghi hay cập nhật được và chỉ được cập nhật bởi gói ETL khi được vận hành bởi Integrating Server để chuyển đổi dữ liệu từ Data Sources vào Data Warehouse. Mình sẽ bàn kỹ hơn về Data Warehouse ở phần tiếp theo.

3. DATA MINING (KHAI THÁC DỮ LIỆU):

  • Là quá trình trích xuất thông tin dữ liệu đã qua xử lý (phù hợp với yêu cầu riêng của doanh nghiệp) từ Data Warehouse rồi kết hợp với các thuật toán để đưa ra các quyết định (hoặc dự đoán) có lợi cho việc kinh doanh của doanh nghiệp.
  • Đây là một quá trình quan trọng trong BI, thông thường một doanh nghiệp muốn sử dụng giải pháp BI thường kèm theo về Data Mining.

4. DATA PRESENTATION (TRÌNH BÀY DỮ LIỆU):

  • Từ quá trình data mining, doanh nghiệp phải hiểu được cách làm ra các mô hình tối ưu hóa cho phép chúng ta xác định các giải pháp tốt nhất trong tập hợp các giải pháp được đưa ra.

5. MAKING DECISIONS (RA QUYẾT ĐỊNH):

  • Đưa ra sự lựa chọn và áp dụng thực tế của một quyết định cụ thể. Ngay cả khi các phương pháp BI được áp dụng thành công, thì việc lựa chọn quyết định thuộc về các nhà ra quyết định, những người nắm bắt được những thông tin không có cấu trúc để hiệu chỉnh các kết luận thông qua việc sử dụng các mô hình toán học.

Những thuật ngữ thường gặp

1. BIG DATA

Là các tập dữ liệu có khối lượng lớn và phức tạp đến mức khó hoặc không thể sử dụng các phương pháp xử lý truyền thống để phân tích. Những tập dữ liệu lớn này có thể bao gồm các dữ liệu có cấu trúc, không có cấu trúc và bán cấu trúc.

2. DATA SOURCE

Là nơi tích hợp và thu thập các dữ liệu được lưu trữ trong các nguồn dữ liệu khác nhau, không đồng nhất về nguồn gốc và loại.

3. DATA WAREHOUSING

Còn được gọi là Nhà kho dữ liệu, sử dụng các công cụ trích xuất và chuyển đổi điển hình như ETL (Extract - Transform - Load) để lưu trữ các nguồn dữ liệu khác nhau vào một CSDL chung nhằm hỗ trợ phân tích kinh doanh.

4. ETL

Quy trình truy xuất dữ liệu từ một hoặc nhiều nguồn khác nhau (từ Data Source), chuyển đổi và làm sạch khối dữ liệu đó trước khi tải lên Nhà kho dữ liệu để lưu trữ và sẵn sàng được sử dụng để phân tích.

5. DATA MINING

Khai thác dữ liệu bao gồm việc tìm tòi và phân tích các khối dữ liệu lớn để chắt lọc ra được những mẫu hình và xu hướng có ý nghĩa. Nó được sử dụng trong nhiều mục đích khác nhau như tiếp thị theo cơ sở dữ liệu, quản trị rủi ro tín dụng, phòng chống gian lận, lọc mail rác, hoặc đơn giản là để tìm hiểu tâm lí và ý kiến của người dùng.

6. DATA VISUALIZATION

Được dịch là trực quan hóa dữ liệu, là cách biểu diễn dữ liệu dưới các hình ảnh, biểu đồ, bản đồ trực quan. Từ đó, truyền tải thông tin đến người xem một cách sinh động hơn, dễ hiểu hơn.

Bibliography

[1] [ITB CLUB || CHUỖI BÀI HỌC THUẬT VỀ BUSINESS INTELLIGENCE]