Khóa học được thiết kế với định hướng thực hành và trang bị kĩ năng nhằm hướng đến các mục tiêu sau:
Tạo ra các báo cáo có ý nghĩa, có những thông tin hữu ích cho nhà quản trị dựa trên phân tích dữ liệu bằng ngôn ngữ R.
Hệ thống R codes để tạo ra những báo cáo đó có thể được duy trì, cập nhật, hoặc thay đổi tương thích với các điều kiện thay đổi của môi trường kinh doanh hoặc nhu cầu quản lí.
Trang bị cho người học cách tư duy về xử lí dữ liệu và kĩ năng cần có với ngôn ngữ R để xử lí các công việc tương ứng.
Data Wrangling. Đây là bước đầu tiên cần phải làm khi thực hiện bất kì phân tích nào và cũng là công việc chiếm từ 50 đến 80% thời gian (tham khảo thêm bài báo của New York Times). Đây là có thể là một chuỗi công việc như load dữ liệu (đọc dữ liệu vào R) từ các định dạng khác nhau, các cơ sở dữ liệu – nguồn dữ liệu khác nhau (SQL, Oracle, Internet), đọc hang ngàn dữ file dữ liệu và thực hiện tiền xử lí Data Pre-processing để chuẩn bị cho phân tích.
Data Visualization. Không một công cụ nào truyền tải hiệu quả thông tin bằng những hình ảnh. Ở nội dung này sẽ trình bày các nguyên lí cơ bản cũng như kĩ năng sử dụng R cho việc thiết kế hình ảnh theo các nguyên lí của Tufte mà ở đó hình ảnh đóng vai trò là người kể một câu chuyện tiềm ẩn trong bộ dữ liệu.
Business Intelligence - BI. Tạo ra các báo cáo có thể giúp ích cho nhu cầu quản lí và điều hành tổ chức dựa trên phân tích dữ liệu có được căn cứ vào các con số thống kê, hình ảnh và biểu đồ.
Programming. Lập trình là kĩ năng then chốt của việc sử dụng bất kì một ngôn ngữ phân tích dữ liệu nào và không ngoại lệ với R vì điều này sẽ đẩy mạnh năng suất / hiệu quả khi thực hiện phân tích dữ liệu.
Xây dựng các mô hình dự báo (Predictive Models) cơ bản bằng cách tiếp cận của thống kê truyền thống hoặc Machine Learning / Deep Learning nhằm giải quyết các đòi hỏi của công việc.
Chọn một số tình huống công việc của học viên hoặc từ một tình huống công việc điển hình đã có trong thực tế với data kèm theo (case study) để áp dụng các kĩ năng được học ở trên.
Nặng về thực hành và trang bị kĩ năng sử dụng R.
Sử dụng case studies.
Có động lực đủ mạnh để sử dụng R – một công cụ phân tích dữ liệu hiệu quả và mạnh nhưng cũng tương đối kén người sử dụng so với các công cụ khác như Stata, Excel, SPSS, SQL.
Có sự tò mò đối với số liệu và luôn bị thúc đẩy bởi trước hết là trách nhiệm với công việc được giao theo hướng bắt dữ liệu phải bộc lộ một thông tin hữu ích nào đó mà đáp ứng được những đòi hỏi của công việc.
Dự kiến cần đến 10 - 12 buổi học và mỗi buổi học kéo dài liên tục 120 phút vào các ngày thứ 2, 4, 6 và CN vào giữa tháng 3 (khoảng từ ngày 15 trở đi).
Thời gian học từ 18h đến 20h.
Địa điểm học: 25 Trần Hưng Đạo – Hoàn Kiếm – Hà Nội.
Lớp trưởng sẽ thành lập một nhóm kín để cả lớp có thể trao đổi với nhau về tài liệu cũng như các vấn đề khác (sẽ gửi cho học viên sau).
R codes và data của khóa học sẽ được post sau khi nhóm được thành lập.
Ngôn ngữ sử dụng: tiếng Việt.
Vì nội dung và phạm vi của khóa học là tương đối nhiều nên những nội dung học dự kiến có thể được điều chỉnh theo hướng rút gọn lại và sự điều chỉnh theo hướng giảm nếu xẩy ra sẽ phụ thuộc vào: (1) mức độ ôn luyện – thực hành của học viên, (2) khả năng + kiến thức nền của người học, (3) mức độ khó và dài (đối với học viên) của các case studies được chọn.
Thời gian học có thể được điều chỉnh theo hướng tăng lên. Điều này xẩy ra khi: (1) người học yêu cầu, (2) đủ sức khỏe để ngồi lâu hơn 120 phút.