THỰC HÀNH QUẢN LÍ VÀ PHÂN TÍCH DỮ LIỆU

Đa số những người trong ngành y tế, học phân tích dữ liệu với những ngôn ngữ R, SPSS, STATA … khi họ có những nhu cầu cụ thể như học để thi lấy chứng chỉ môn Thống Kê lúc còn đi học hoặc để thực hiện một nghiên cứu nào đó.

Sau khi hoàn tất việc học hoặc dự án nghiên cứu, thì hầu hết người học không có hoặc có quá ít cơ hội để tiếp tục thực hành việc quản lí và phân tích dữ liệu. Từ đó họ quên dần kiến thức và kĩ năng thực hành về công cụ thống kê này. Chỉ một số ít có công việc hằng ngày liên quan đến xử lí và phân tích dữ liệu, hoặc giảng dạy thống kê mới tiếp tục học hỏi, phát triển kĩ năng thực hành các công cụ thống kê nói trên. Có thể người học từng có kiến thức và xử lí được những mô hình logistic regression, survival hoặc machine learning để đánh giá những giả thiết nghiên cứu. Nhưng sau một thời gian không thực hành, những gì còn lại chỉ là kiến thức cơ bản để đọc hiểu các bài báo cáo về các nghiên cứu.

Từ đó, dẫn đến một thực tế là người học các ngôn ngữ thống kê thì nhiều, nhưng người tiếp tục sử dụng các công cụ này vào công việc quản lí, phân tích dữ liệu để phục vụ cho công việc hằng ngày, hay các dự án nghiên cứu thì rất ít. Nguyên nhân, như đã nói trên là không có cơ hội làm việc để tiếp tục phát triển với các công cụ thống kê.

QUẢN LÍ DỮ LIỆU TRONG CÔNG VIỆC HẰNG NGÀY

Một điều rõ ràng là những người sở hữu các công cụ quản lí và phân tích dữ liệu sẽ giải quyết công việc hằng ngày tốt hơn và sẽ được sếp của họ đánh giá cao về năng lực. Trước những yêu cầu đánh giá công việc, họ có thể đưa ra những báo cáo dữ liệu nhanh hơn, đồ họa hấp dẫn và thuyết phục hơn.

Ví dụ, nếu bạn đang quản lí một phòng khám đa khoa thì kĩ năng quản lí và phân tích dữ liệu sẽ giúp ích bạn rất nhiều trong việc phân tích hoạt động, đề xuất các giải pháp cải thiện hoạt động chuyên môn và kinh doanh của phòng khám.

Nếu bạn cho rằng việc nhập dữ liệu bệnh nhân, kho thuốc, xét nghiệm … đã có những phần mềm chuyên dụng được các công ty IT cung cấp thì điều đó không sai. Tuy nhiên, không có IT provider nào hiểu công việc phòng khám của bạn bằng chính bản thân bạn. Mỗi cơ sở y tế có những dịch vụ, hoạt động chuyên môn khác nhau về loại hình và qui mô công việc. Vì vậy không có giải pháp IT nào được các nhà cung cấp có thể thỏa mãn hoàn toàn yêu cầu của bạn. Bên cạnh đó, vẫn còn những hoạt động, dịch vụ bỏ sót hoặc mới phát sinh mà phần mềm chưa bao gồm vào được. Vì vậy, bạn cần có kĩ năng sử dụng các công cụ quản lí dữ liệu để cải thiện tốt nhất hiệu quả công việc của bạn vì bạn là người hiểu công việc của mình nhiều nhất (domain expert).

Qua thời gian thực hành, tôi thấy các công cụ sau đây khá hữu hiệu cho việc quản lí, phân tích dữ liệu và tạo báo cáo hoạt động:

MS ACCESS

Ưu điểm của công cụ này là các forms nhập dữ liệu trực quan, thiết kế mĩ thuật giúp người nhập dữ liệu dẽ dàng như đang điền các biểu mẫu trên giấy. Dữ liệu được lưu trữ trong các tables có liên quan với nhau (relational tables), giúp data gọn gàng hơn. Khi một giá trị của collumn trong một table được chỉnh sửa thì giá trị của collumn đó trong các bảng liên quan khác cũng thay đổi tương ứng tự động. Điều này giúp giảm thiểu sai sót, giảm thời gian chỉnh sửa. Những query sẽ được viết để truy xuất dữ liệu hoạt động cung cấp dịch vụ như chích ngừa, xét nghiệm, phòng nhận bệnh, khoa dược … trong nhóm đối tượng hoặc khoảng thời gian nhất định nào đó (tháng, quí, năm) sẽ được xây dựng dễ dàng.

Với những dự án không quá lớn, database nhỏ hơn 1 gigabite thì MS Acess sẽ bảo đảm khả năng hoạt động tốt. Như vậy hoạt động xét nghiệm, xuất kho thuốc, chích ngừa … của các cơ sở y tế như phòng khám đa khoa, bạn có thể quản lí hiệu quả với công cụ Access.

Dữ liệu có thể export ra dưới nhiều dạng như excel, csv để phân tích với Python, R hoặc link với SQL SERVER để truy vấn linh động hơn.

MS SQL SERVER

Công cụ này tương tự như Access nhưng phương thức truy vấn dữ liệu linh động hơn, đặc biệt có khả năng làm việc với những big data, hay khi dung lượng database vượt quá 1 gigabyte. Các query được viết bằng code nên đồng thời viết hàng loạt query một các nhanh chóng, lưu lại các tác vụ để dễ dàng quay lại trong lần tới.

Các bảng tóm tắt dữ liệu theo nhóm, thứ tự, tính trung bình, đếm số lượng, min, max đều có thể dễ dàng thực hiện trong SQL.

Chúng ta có thể link những database giữa Aceess và SQL để truy vấn dữ liệu và xuất ra các datasets dưới dạng csv một cách rất tiện lợi. Từ đó sử dụng Python, R để phân tích và tạo những biểu đồ sinh động, hấp dẫn.

SPSS, STATA, PYTHON, R

Khi đã có những datasets dưới các dạng excel, csv hoặc text sẳn sàng thì các công cụ phân tích dữ liệu kể trên sẽ giúp các bạn mô tả, tóm tắt dữ liệu, vẽ biểu đồ, kiểm định các giả thiết thống kê … một cách hữu hiệu. Điều này các bạn đều đã biết rõ.

Nếu không có nhiều cơ hội làm việc với các nghiên cứu để phát triển kĩ năng sử dụng các ngôn ngữ phân tích thống kê đã học được thì các bạn có thể vận dụng chúng trong sự kết hợp với các công cụ quản lí dữ liệu khác vừa kể trên vào công việc hằng ngày. Điều này giúp chúng ta có sự hiểu biết về khả năng của chúng, điểm mạnh, điểm yếu, trong mối quan hệ bổ sung cho nhau, từ nhập dữ liệu cho đến kết quả phân tích cuối cùng.

Với các công cụ trên thì công việc hằng ngày của chúng ta sẽ được quản lí khoa học, hiệu quả hơn. Dữ liệu hoạt động hằng ngày sẽ cho chúng ta biết những lợi thế cũng như điểm còn yếu kém trong hoạt động chuyên môn, kinh doanh của cơ sở cung cấp dịch vụ y tế mà chúng ta đang làm việc.

Cũng từ việc vận dụng các công cụ này trong công việc hằng ngày, chúng ta có thêm cơ hội để học tập hiệu quả, cải thiện kĩ năng thực hành các ngôn ngữ như R, Python, SPSS… trong phân tích dữ liệu.