Chương 3: Thiết kế nghiên cứu phi thực nghiệm
R Data Science Series
Nghiên cứu định lượng phi thực nghiệm đa dạng hơn so với nghiên cứu thực nghiệm, vốn là một phương pháp nghiên cứu được xác định rõ ràng. Các phương pháp phi thực nghiệm bao gồm: (1) nghiên cứu khảo sát, (2) nghiên cứu lịch sử, (3) quan sát và phân tích các tập dữ liệu hiện có. Trong chương này, chúng ta sẽ tìm hiểu các phương pháp phổ biến nhất trong nghiên cứu giáo dục: nghiên cứu khảo sát, nghiên cứu quan sát và phân tích dữ liệu sẵn có.
1. Nghiên cứu khảo sát
Có lẽ thiết kế nghiên cứu định lượng phổ biến nhất trong khoa học xã hội là nghiên cứu khảo sát (survey research). Các thiết kế nghiên cứu khảo sát rất linh hoạt và do đó có thể tồn tại dưới nhiều hình thức khác nhau, nhưng tất cả đều có điểm chung là thu thập dữ liệu bằng cách sử dụng bảng hỏi (questionnaire) tiêu chuẩn, được thực hiện trực tuyến, qua điện thoại, trực tiếp mặt đối mặt, hoặc đôi khi vẫn là bảng hỏi giấy gửi qua đường bưu điện.
Tất cả chúng ta hầu như đều đã từng có trải nghiệm với nghiên cứu khảo sát — nếu không phải với tư cách là người thiết kế thì cũng là người tham gia vào một trong vô số cuộc khảo sát về hành vi tiêu dùng. Chính sự phổ biến này khiến nhiều người cho rằng nghiên cứu khảo sát là hình thức nghiên cứu dễ nhất, có thể thực hiện một cách “nhanh và cẩu thả”. Nhiều tổ chức thiết kế các khảo sát nội bộ để tìm hiểu nhiều vấn đề khác nhau. Tuy nhiên, như chúng ta sẽ thấy ở phần sau, thiết kế nghiên cứu khảo sát không hề đơn giản. Có rất nhiều cạm bẫy và rủi ro, và nhiều nghiên cứu thực tế đã vướng phải gần như toàn bộ những điều đó.
Ví dụ 3.1: Mối liên hệ giữa các yếu tố trường học và phúc lợi của học sinh
Có rất nhiều ví dụ về các nghiên cứu khảo sát trong lĩnh vực nghiên cứu giáo dục.
Trong một nghiên cứu, tôi đã xem xét các yếu tố trường học có thể ảnh hưởng đến hành vi bắt nạt (Muijs, 2017). Mục tiêu là tìm hiểu xem các điều kiện của trường học (ví dụ: quy mô), chính sách của trường (ví dụ: chính sách hành vi) và các quy trình trong trường (ví dụ: chất lượng giảng dạy) có liên quan đến mức độ phổ biến của hành vi bắt nạt ở các trường tiểu học tại Anh hay không. Chúng tôi đã khảo sát 1.411 học sinh và 68 giáo viên lớp 6 tại 35 trường tiểu học ở bốn cơ quan địa phương ở Anh. Chúng tôi sử dụng nhiều loại khảo sát khác nhau, và nghiên cứu dựa trên các nguồn dữ liệu sau:
1. Khảo sát học sinh về các hành vi bắt nạt
2. Khảo sát giáo viên về chính sách và quy trình trong trường học
3. Phân tích dữ liệu về quy trình nhà trường từ các báo cáo thanh tra giáo dục
4. Phân tích dữ liệu thứ cấp về điều kiện trường học và đặc điểm học sinh.
Phân tích của chúng tôi cho thấy có ảnh hưởng đáng kể ở cấp độ trường học và lớp học đối với mức độ phổ biến của hành vi bắt nạt. Các chính sách hiệu quả của nhà trường có ảnh hưởng đến mức độ bắt nạt, điều này cho thấy rằng các chính sách và thực tiễn hàng ngày trong trường học có thể tác động tích cực đến việc giảm thiểu bắt nạt.
2 Thiết kế một nghiên cứu khảo sát
Các giai đoạn trong việc thiết kế một nghiên cứu khảo sát tương tự như trong nghiên cứu thực nghiệm. Sự khác biệt nằm ở cách chúng ta thiết kế nghiên cứu, thiết kế công cụ đo lường và thu thập dữ liệu.
2.1 Định nghĩa các mục tiêu nghiên cứu
Cũng giống như nghiên cứu thực nghiệm, chúng ta bắt đầu bằng việc xác định mục tiêu nghiên cứu. Có rất nhiều loại câu hỏi nghiên cứu có thể được nghiên cứu bằng phương pháp nghiên cứu khảo sát. Nếu mối quan tâm chính của chúng ta là xác định quan hệ nhân quả, thì có thể chúng ta sẽ cân nhắc việc sử dụng các phương pháp thực nghiệm hoặc bán thực nghiệm. Trong khi đó, nghiên cứu khảo sát lại đặc biệt phù hợp với các nghiên cứu mô tả, hoặc khi nhà nghiên cứu muốn khảo sát mối quan hệ giữa các biến trong những bối cảnh thực tế cụ thể.
Thiết kế nghiên cứu cần phải thực tế và khả thi. Trong nghiên cứu khảo sát, người ta thường có xu hướng xây dựng một thiết kế quá rộng, cố gắng phản ánh toàn bộ sự phức tạp của thế giới thực. Tuy nhiên, trên thực tế, thường không thể thu thập được dữ liệu cho tất cả các biến mà ta mong muốn, do bị giới hạn về tài chính và thời gian; và do đó ta có thể phải chấp nhận cỡ mẫu nhỏ hơn mức mong đợi. Trong những trường hợp như vậy, điều quan trọng là phải lựa chọn những biến mà ta cho rằng có khả năng nhất ảnh hưởng đến biến phụ thuộc (outcomes) của chúng ta.
Khi mà chúng ta đã xác định được mục tiêu nghiên cứu, ta có thể tiến hành bước tiếp theo là thiết kế nghiên cứu, và điều này sẽ phụ thuộc vào chính những mục tiêu đó. Ví dụ, nếu chúng ta muốn nghiên cứu quan điểm của giáo viên về phương pháp sư phạm hiệu quả thay đổi theo thời gian như thế nào, thì chúng ta sẽ cần thực hiện một nghiên cứu theo thời gian (longitudinal study) (còn gọi là nghiên cứu theo chiều dọc), tức là khảo sát giáo viên trong một khoảng thời gian kéo dài qua nhiều năm. Nếu chúng ta muốn nghiên cứu ý kiến của giáo viên về một sáng kiến chính sách mới do Bộ Giáo dục ban hành, thì một nghiên cứu theo chiều ngang (cross-sectional study), trong đó chỉ khảo sát (các giáo viên) một lần duy nhất, là đủ. Nếu chúng ta muốn xác định xem ý kiến của giáo viên có thay đổi sau một can thiệp hay không, thì khảo sát trước và sau can thiệp (pre- and post-surveys) sẽ phù hợp.
Chúng ta cũng có thể muốn kết hợp nhiều phương pháp khác nhau, chẳng hạn như thực hiện một cuộc khảo sát quy mô lớn, rồi sau đó tiến hành các cuộc phỏng vấn sâu (in-depth interviews) với một nhóm nhỏ được chọn từ mẫu khảo sát ban đầu. Có rất nhiều lựa chọn khả thi, tùy thuộc vào mục tiêu nghiên cứu và, không kém phần quan trọng, là ngân sách nghiên cứu. Yếu tố ngân sách là một rào cản lớn trong nghiên cứu giáo dục (và nghiên cứu khoa học xã hội nói chung), và đã dẫn đến tình trạng phần lớn các nghiên cứu hiện nay đều là các nghiên cứu cắt ngang, thực hiện một lần duy nhất. Đây là điều đáng tiếc, vì nhiều câu hỏi nghiên cứu sẽ mang lại kết quả sâu sắc hơn nếu được tiếp cận bằng phương pháp nghiên cứu theo thời gian.
2.2 Thiết lập các giả thuyết nghiên cứu
Trong khi ở các thiết kế thực nghiệm là phổ biến cho việc phát triển và kiểm định giả thuyết trong mọi tình huống nghiên cứu, thì điều này không nhất thiết đúng với các thiết kế khảo sát. Trong một số trường hợp, chúng ta sẽ muốn đưa ra những dự đoán cụ thể về mối quan hệ giữa các biến dưới dạng giả thuyết (ví dụ: “Tồn tại mối quan hệ giữa nhận thức bản thân (self-concept) và thành tích học tập”). Nói chung, sự linh hoạt của nghiên cứu khảo sát cho phép những giả thuyết nghiên cứu có thể rộng và phức tạp hơn so với các giả thuyết nghiên cứu trong các nghiên cứu thực nghiệm (ví dụ: “Mối quan hệ giữa nhận thức bản thân và thành tích học tập sẽ tăng lên khi trẻ lớn lên” hay “Mối quan hệ giữa nhận thức bản thân và thành tích học tập sẽ bị điều tiết bởi trí tuệ cảm xúc”).
Tuy nhiên, không phải mọi nghiên cứu khảo sát đều kiểm định các giả thuyết cụ thể. Một số nghiên cứu khảo sát có thể hoàn toàn mang tính mô tả. Ví dụ, một ứng dụng phổ biến của nghiên cứu khảo sát là tìm hiểu ý định bỏ phiếu. Các nhà nghiên cứu không bắt đầu với những giả thuyết cụ thể (ví dụ: “Tỷ lệ phiếu bầu cho đảng Dân chủ được giả định là lớn hơn 0.40”), mà chỉ đơn giản là muốn kiểm tra xem ý định bỏ phiếu hiện tại ra sao. Do đó, việc bạn có muốn kiểm định một giả thuyết cụ thể hay thực hiện một nghiên cứu mang tính mô tả hơn (ví dụ: “Tỷ lệ giáo viên tham gia hoạt động phát triển chuyên môn trong năm qua là bao nhiêu phần trăm?”) sẽ phụ thuộc vào chính câu hỏi nghiên cứu của bạn.
2.3 Xác định những thông tin cần thiết
Khi đã xác định được câu hỏi nghiên cứu và, nếu cần, cả các giả thuyết, bạn cần suy nghĩ về loại thông tin cần thu thập để trả lời các câu hỏi nghiên cứu đó. Nếu mục tiêu nghiên cứu của bạn cho thấy rằng nghiên cứu khảo sát là phù hợp, thì bạn cần quyết định những thông tin nào sẽ được thu thập thông qua khảo sát. Điều này bao gồm việc xác định sẽ hỏi những câu hỏi nào, có nên sử dụng các thang đo đã được công bố trước đó hay không, khảo sát nên dài bao nhiêu, v.v. Chúng ta sẽ tìm hiểu một số vấn đề này ở các chương tiếp theo.
2.4 Lựa chọn quần thể
Bên cạnh việc xác định loại thông tin cần thu thập, bạn cũng phải xác định rõ ràng quần thể (population) nghiên cứu của mình là gì. Quần thể chính là nhóm đối tượng mà bạn muốn khái quát hóa kết quả nghiên cứu. Ví dụ, bạn có thể muốn thực hiện một nghiên cứu về mối quan hệ giữa nhận thức bản thân và thành tích học tập. Quần thể của bạn có thể là tất cả học sinh 10 tuổi trong một bang, hoặc tất cả học sinh 10 tuổi trên toàn quốc, v.v. Việc xác định rõ quần thể là rất quan trọng, vì điều này sẽ quyết định (trong phần lớn các trường họp) bạn sẽ chọn mẫu từ đâu. Tất nhiên, trong một số trường hợp, bạn có thể không cần lấy mẫu. Có thể bạn sẽ khảo sát toàn bộ quần thể. Ví dụ, nếu tôi muốn khảo sát ý kiến của sinh viên về cách tôi giảng dạy trong lớp thống kê bậc đại học, tôi có thể phát bảng hỏi cho toàn bộ quần thể, vì số lượng sinh viên có thể là khá nhỏ (14 người). Việc khảo sát (hay còn gọi là chọn mẫu) toàn bộ quần thể được gọi là điều tổng khảo sát (census). Trên thực tế, ngay cả với những quần thể lớn, vẫn có thể (cố gắng) tiến hành tổng khảo sát nếu có đủ nguồn lực. Ví dụ, các chính phủ thường xuyên tiến hành tổng điều tra dân số.
Tuy nhiên, trong hầu hết các trường hợp, chúng ta không có đủ nguồn lực để khảo sát toàn bộ quần thể, và do đó sẽ cần phải lấy mẫu. Điều quan trọng cần ghi nhớ là: chúng ta chỉ có thể khái quát hóa kết quả cho quần thể mà chúng ta đã lấy mẫu từ đó. Vì vậy, cần suy nghĩ kỹ về việc quần thể của chúng ta chính xác sẽ là ai.
2.5 Lựa chọn cách lấy mẫu từ quần thể
Trong phần lớn các trường hợp, chúng ta sẽ cần lấy mẫu từ quần thể nghiên cứu. Sau đó, chúng ta thường sẽ muốn khái quát hóa kết quả tìm được từ mẫu sang toàn bộ quần thể. Xét cho cùng, một cuộc khảo sát về ý định bỏ phiếu trên mẫu gồm 1.000 người sẽ không có nhiều ý nghĩa nếu chúng ta không thể suy rộng kết quả đó cho toàn thể cử tri!
Để có thể khái quát hóa như vậy, chúng ta cần chọn mẫu không thiên lệch (unbiased), nghĩa là mẫu đó phải đại diện cho toàn bộ quần thể đang được nghiên cứu và không nghiêng về bất kỳ nhóm nào. Ví dụ, nếu chúng ta muốn khái quát hóa kết quả cho tất cả học sinh 10 tuổi, thì rõ ràng không thể chỉ lấy mẫu từ các bé gái. Cách tốt nhất để đảm bảo rằng mẫu không thiên lệch là sử dụng các phương pháp lấy mẫu dựa trên xác suất (probability sampling methods).
Phương pháp lấy mẫu dựa trên xác suất được biết đến nhiều nhất là lấy mẫu ngẫu nhiên đơn giản (simple random sampling). Đặc điểm điển hình của phương pháp này là mọi cá thể trong quần thể đều có cơ hội ngang nhau để được chọn vào mẫu. Điều này là do mẫu được rút ra một cách ngẫu nhiên từ toàn bộ quần thể (ví dụ: bằng cách bỏ tên người được phỏng vấn vào một cái mũ và rút ngẫu nhiên, hoặc phổ biến hơn hiện nay là sử dụng trình tạo số ngẫu nhiên). Chính vì vậy, đây được xem là hình thức lấy mẫu ít thiên lệch nhất.
Khi nói rằng đây là phương pháp lấy mẫu ít thiên lệch nhất có thể khiến ta nghĩ rằng nên luôn cố gắng sử dụng phương pháp lấy mẫu ngẫu nhiên đơn giản. Tuy nhiên, khi nhìn vào thực tế nghiên cứu giáo dục, ta thấy rằng đa số các nghiên cứu lại không (hoặc khó) sử dụng phương pháp này. Vì sao lại như vậy? Có một số lý do – một số thì hợp lý, một số thì kém thuyết phục hơn.
Một lý do hợp lý là tuy các mẫu ngẫu nhiên đơn giản là phù hợp để khái quát hóa cho toàn bộ quần thể, nhưng trong một số trường hợp, chúng ta lại muốn khái quát hóa cho một tiểu quần thể cụ thể (specific subpopulation), mà nhóm này lại quá nhỏ để có thể được đại diện một cách đáng tin cậy trong bất kỳ mẫu nào ngoại trừ các mẫu rất lớn. Chẳng hạn, chúng ta có thể muốn so sánh mức độ hài lòng/hạnh phúc của học sinh trong các trường tư thục và công lập. Nếu lấy ngẫu nhiên một mẫu gồm 1.000 học sinh, có thể chúng ta chỉ thu được một nhóm rất nhỏ các học sinh từ trường tư. Do đó, để đảm bảo có đủ số lượng đại diện trong cả hai nhóm, chúng ta có thể sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling). Việc này bao gồm hai bước: (1) đầu tiên là chia quần thể thành các nhóm mà chúng ta muốn nghiên cứu — trong ví dụ này là học sinh trường tư và học sinh trường công, rồi (2) sau đó tiến hành lấy mẫu ngẫu nhiên riêng biệt từ từng nhóm. Kết quả, chúng ta sẽ có một mẫu gồm 500 học sinh từ trường tư và 500 từ trường công.
Trong một số trường hợp, chúng ta có thể muốn đảm bảo rằng các nhóm nhỏ khác nhau trong quần thể đều được đại diện trong mẫu khảo sát theo đúng tỷ lệ mà chúng xuất hiện trong quần thể. Tuy nhiên, điều này sẽ rất khó đạt được đối với những nhóm nhỏ, trừ khi chúng ta lấy một mẫu rất lớn. Do đó, đôi khi chúng ta xác định trước tỷ lệ đại diện của các nhóm đó trong mẫu, và tiếp tục lấy mẫu cho đến khi tỉ lệ đó đạt được. Ví dụ, giả sử trong quần thể có 10% học sinh là người gốc Phi-Caribbean. Trong phương pháp lấy mẫu theo hạn ngạch, gọi là quota sampling, chúng ta sẽ tiếp tục lấy mẫu từ học sinh gốc Phi-Caribbean cho đến khi đạt được tỷ lệ đã định — trong trường hợp này là 10% của 1.000, tức là 100 học sinh gốc Phi-Caribbean.
Một lý do khác khiến chúng ta không sử dụng phương pháp lấy mẫu ngẫu nhiên đơn giản nằm ở khó khăn trong việc rút ra kết luận khi mà các cá thể trong quần thể được lồng ghép vào. Chẳng hạn, trong nghiên cứu giáo dục, chúng ta thường quan tâm đến các hiện tượng xảy ra trong trường học, hay tác động của trường học, và những điều này ảnh hưởng như thế nào đến học sinh trong cùng một trường. Việc đưa ra bất kỳ kết luận nào về ảnh hưởng của trường học (hoặc cách giảng dạy trong lớp học) sẽ rất khó khăn nếu chúng ta sử dụng lấy mẫu ngẫu nhiên đơn giản từ các học sinh.
Ngay cả khi chúng ta có một mẫu lớn đến 1.000 học sinh, thì nhiều khả năng số học sinh đó sẽ được phân bổ ở rất nhiều trường học khác nhau (ví dụ: 900 trường), có nghĩa là trong hầu hết các trường hợp, chúng ta chỉ có một hoặc hai học sinh ở mỗi trường. Rõ ràng là không hợp lý nếu rút ra kết luận về tác động của trường học hoặc giáo viên chỉ dựa trên dữ liệu của một học sinh trong trường đó! Do đó, khi muốn nghiên cứu tác động của trường học, chúng ta thường lấy mẫu ngẫu nhiên các trường rồi khảo sát tất cả học sinh trong các trường đó. Nói rộng hơn, khi sử dụng phương pháp lấy mẫu cụm (cluster sampling), ta sẽ lấy mẫu ngẫu nhiên ở cấp cao hơn – nơi mà các cá thể trong quần thể được tập trung thành cụm – và sau đó khảo sát toàn bộ các đối tượng trong cụm đó.
Một phương pháp liên quan là phương pháp lấy mẫu nhiều giai đoạn (multistage sampling) trong đó chúng ta lần lượt lấy mẫu ngẫu nhiên theo các cấp: ví dụ, đầu tiên chọn ngẫu nhiên các khu học chính (school districts), sau đó chọn ngẫu nhiên các trường học trong những khu đó, rồi chọn ngẫu nhiên học sinh trong các trường đã chọn. Quá trình này có thể thực hiện qua nhiều cấp, không chỉ giới hạn ở ba cấp như trong ví dụ, và thường được sử dụng trong các nghiên cứu bầu cử.
Tuy nhiên, một vấn đề với các phương pháp lấy mẫu cụm và lấy mẫu nhiều giai đoạn là chúng không còn ngẫu nhiên nữa. Điều này là vì, nói chung, những người được tập trung trong cùng một cụm (ví dụ: học sinh trong một trường) có xu hướng giống nhau hơn so với những người ở các cụm khác nhau. Chúng ta biết rằng, trong một trường học, học sinh thường đồng đều hơn về mặt bối cảnh xã hội (do ảnh hưởng từ khu vực tuyển sinh) so với toàn bộ học sinh trong tổng thể. Ngoài ra, chính việc cùng học trong một môi trường (như một trường học) khiến các cá nhân chịu ảnh hưởng chung từ văn hóa tổ chức và tác động từ bạn bè, khiến họ trở nên tương đồng hơn. Điều này gây ra một số vấn đề trong phân tích thống kê, khiến ta cần sử dụng các phương pháp phân tích được thiết kế riêng cho loại mẫu này, như sẽ được trình bày trong Chương 12.
Những phương pháp trình bày ở trên đều là các phương pháp lấy mẫu dựa trên xác suất, và nếu được sử dụng đúng cách, chúng ta có thể tương đối yên tâm rằng mẫu thu được không thiên lệch và có thể đại diện cho toàn bộ quần thể. Tuy nhiên, các phương pháp lấy mẫu dựa trên xác suất lại chưa hẳn là phương pháp phổ biến nhất trong nghiên cứu giáo dục. Còn hai phương pháp lấy mẫu khác xuất hiện khá thường xuyên. Một trong số đó là lấy mẫu tình nguyện (volunteer sampling), tức là khi chúng ta mời người tham gia nghiên cứu một cách tự nguyện, chẳng hạn thông qua quảng cáo trên báo địa phương, ấn phẩm chuyên ngành hoặc dán thông báo trong khuôn viên trường đại học. Phương pháp này có ưu điểm rõ ràng là dễ thực hiện và ít tốn kém, nhưng lại gặp vấn đề nghiêm trọng về độ thiên lệch của mẫu. Những người tình nguyện tham gia khảo sát thường không đại diện cho toàn bộ quần thể. Họ có thể là những người có quan điểm đặc biệt mạnh mẽ về chủ đề nghiên cứu, hoặc đơn giản là có nhiều thời gian rảnh. Việc tình nguyện tham gia khảo sát thường được khuyến khích bằng phần thưởng (thường là tiền mặt). Điều này có thể phần nào giảm bớt thiên lệch, nhưng trừ khi phần thưởng đủ lớn, phương pháp này sẽ khó thu hút những người có thu nhập cao. Vì vậy, thiên lệch mẫu là một vấn đề nghiêm trọng đối với phương pháp lấy mẫu tình nguyện này.
Có lẽ phương pháp lấy mẫu phổ biến nhất hiện nay trong các nghiên cứu giáo dục là phương pháp lấy mẫu thuận tiện (convenience sampling). Phương pháp này được áp dụng khi nhà nghiên cứu có quyền tiếp cận dễ dàng với một số địa điểm nhất định — chẳng hạn như các giáo viên mà cô ấy đã từng làm việc cùng, hoặc học sinh trong chính ngôi trường của cô — và sử dụng những người này trong nghiên cứu của mình. Phương pháp này có ưu điểm rõ ràng về chi phí thấp và sự tiện lợi, nhưng lại gặp vấn đề nghiêm trọng về độ thiên lệch, vì những địa điểm mà người nghiên cứu dễ tiếp cận không nhất thiết đại diện cho toàn bộ quần thể. Ví dụ, nếu một người làm việc tại một trường học ở vùng nông thôn, thì học sinh tại đó sẽ khác biệt về nhiều mặt so với học sinh ở khu vực nội đô. Điều này khiến khả năng khái quát hóa kết quả chỉ giới hạn trong các khu vực nông thôn tương tự.
Vì vậy, nếu có thể, nên ưu tiên sử dụng các phương pháp lấy mẫu dựa trên xác suất để đảm bảo độ đại diện và tính khách quan trong nghiên cứu.
2.6 Thiết kế công cụ nghiên cứu
Giai đoạn tiếp theo trong nghiên cứu khảo sát là thiết kế công cụ khảo sát (research instruments), chẳng hạn như một bảng hỏi trực tuyến. Như đã đề cập trong chương về nghiên cứu thực nghiệm, đây là một bước cực kỳ quan trọng, bởi vì một khi dữ liệu đã được thu thập thì sẽ không thể sửa chữa những vấn đề trong công cụ khảo sát nữa. Rõ ràng, chất lượng dữ liệu thu được sẽ phụ thuộc vào chất lượng của công cụ khảo sát, và chúng ta sẽ bàn sâu hơn về các vấn đề liên quan đến thiết kế công cụ khảo sát trong những phần tiếp theo.
2.7 Thu thập dữ liệu
Thu thập dữ liệu (data colection) là giai đoạn tiếp theo và cũng là khâu mà các vấn đề có thể phát sinh trong nghiên cứu khảo sát. Dữ liệu thường được thu thập thông qua bảng hỏi trực tuyến hoặc qua điện thoại, nhưng cũng có thể được thu thập bằng các ứng dụng di động, bảng hỏi giấy (pencil-and-paper questionnaires), hoặc phỏng vấn trực tiếp (face-to-face inverviews).
Dù chúng ta sử dụng phương pháp lấy mẫu nào đi nữa, chúng ta đều phải đối mặt với vấn đề không phản hồi (non-response) trong khảo sát. Tình trạng không phản hồi trong các khảo sát trực tuyến hoặc bảng hỏi giấy có thể rất nghiêm trọng, với nhiều bảng hỏi có tỷ lệ phản hồi dưới 50%, và gần như không có khảo sát nào đạt 100% tỷ lệ phản hồi, ngoại trừ một số khảo sát quy mô nhỏ và buộc phải trả lời như đánh giá bắt buộc (compulsory feedback) của sinh viên về giảng viên.
Tình trạng không phản hồi sẽ không phải là vấn đề nghiêm trọng nếu chúng ta chắc chắn rằng những người không phản hồi cũng giống như những người đã phản hồi về mọi biến liên quan, và do đó họ sẽ trả lời tương tự nếu tham gia khảo sát. Tuy nhiên, điều này là hoàn toàn không chắc chắn, và trong nhiều trường hợp, ta có thể khẳng định điều ngược lại. Thông thường, những người có quan điểm mạnh mẽ hoặc quan tâm đặc biệt đến chủ đề khảo sát sẽ có xu hướng phản hồi cao hơn, cũng như những người có hứng thú với nghiên cứu nói chung. Ngoài ra, những người có nhiều thời gian rảnh cũng thường phản hồi khảo sát dễ dàng hơn. Tỷ lệ phản hồi thấp rõ ràng sẽ khiến kích thước mẫu cuối cùng bị thu hẹp, đồng nghĩa với việc ta có ít “sức mạnh thống kê” hơn để kiểm định các giả thuyết. Vì vậy, chúng ta cần nỗ lực tối đa để tăng tỷ lệ phản hồi. Có một số cách mà chúng ta có thể áp dụng để hỗ trợ việc này:
Giữ cho bảng hỏi đủ ngắn gọn (sufficiently short) (tối đa 30 phút để trả lời) và trình bày hấp dẫn.
Giảm thiểu chi phí và công sức cho người tham gia khảo sát.
Hứa hẹn (và thực hiện!) về việc thông báo lại kết quả nghiên cứu cho những người hoàn thành bảng hỏi.
Cung cấp phần thưởng cho người tham gia hoàn tất bảng hỏi. Các phần thưởng như phiếu quà tặng, thẻ mua sách,… thường phù hợp (dù đây là lựa chọn tốn kém).
Gọi điện hoặc đến gặp trực tiếp để có thể giúp tăng đáng kể tỷ lệ phản hồi.
Một yếu tố quan trọng cuối cùng ảnh hưởng đến tỷ lệ phản hồi là mức độ uy tín (credibility) của cá nhân hoặc tổ chức thực hiện khảo sát. Các trường đại học và cơ quan chính phủ thường có uy tín cao hơn so với các tổ chức thương mại, nên sẽ thu được tỷ lệ phản hồi cao hơn. Ngoài ra, việc có mối quan hệ sẵn có với người tham gia cũng sẽ giúp tăng tỷ lệ phản hồi.
Tình trạng không phản hồi trong các khảo sát qua điện thoại và phỏng vấn trực tiếp có một số điểm khác biệt so với khảo sát trực tuyến hay bảng hỏi giấy, đó là chúng ta luôn có thể tiếp tục gọi điện hoặc phỏng vấn cho đến khi đạt được số lượng phản hồi mục tiêu. Tuy nhiên, điều này không giải quyết được vấn đề những người từ chối tham gia khảo sát có thể khác biệt so với những người đồng ý tham gia, và các vấn đề tương tự như trong khảo sát trực tuyến và bảng hỏi giấy vẫn còn tồn tại. Vì vậy, tốt nhất vẫn là cố gắng tối đa hóa tỷ lệ phản hồi ban đầu và giảm thiểu tỉ lệ người không phản hồi. Các biện pháp có thể áp dụng để đạt được điều này tương tự như với bảng hỏi trực tuyến và bảng hỏi giấy:
Giữ bảng hỏi đủ ngắn gọn.
Gọi điện hoặc liên hệ với người tham gia vào thời điểm thuận tiện cho họ, và nếu cần, hẹn lại vào ngày hoặc giờ khác để phỏng vấn.
Hứa hẹn và thực sự cung cấp kết quả về dự án nghiên cứu cho người tham gia.
Cung cấp phần thưởng cho người hoàn thành bảng hỏi.
Thực hiện các cuộc gọi nhắc nhở và đến gặp trực tiếp.
Nhận thức rằng mức độ uy tín của người hoặc tổ chức thực hiện khảo sát cũng là một yếu tố quan trọng.
Tất cả những phương pháp này sẽ không thể loại bỏ hoàn toàn tình trạng không phản hồi, do đó chúng ta cần cân nhắc cẩn thận các yếu tố có thể dẫn đến không phản hồi và xem xét cách điều chỉnh sự khác biệt giữa những người không phản hồi và những người đã phản hồi.
Ưu điểm và nhược điểm của các phương pháp thu thập dữ liệu
Có nhiều cách khác nhau để thực hiện khảo sát, và mỗi cách đều có những ưu điểm và nhược điểm riêng.
Là truyền thống, phương pháp phổ biến nhất trong nghiên cứu giáo dục là sử dụng bảng hỏi giấy. Ưu điểm chính của phương pháp này là sự quen thuộc với người dùng, cho phép người tham gia trả lời bảng hỏi vào thời điểm thuận tiện cho họ, và có thời gian suy nghĩ kỹ lưỡng trước khi đưa ra câu trả lời. Tuy nhiên, nhược điểm là tỷ lệ phản hồi thấp (như đã đề cập ở trên), đồng thời tốn thời gian để theo dõi và nhập liệu thủ công.
Ngày nay, các bảng hỏi thường được thiết kế trực tuyến (online). Về bản chất, chúng tương tự như bảng hỏi giấy, nhưng có lợi thế là dữ liệu trả lời được lưu trực tiếp vào cơ sở dữ liệu, và nhiều hệ thống trực tuyến cho phép thực hiện các phân tích cơ bản một cách tự động, giúp tiết kiệm đáng kể thời gian và chi phí nhờ loại bỏ công đoạn nhập liệu. Ngoài ra, bảng hỏi trực tuyến còn dễ dàng được thiết kế theo kiểu thích ứng (adaptive), nghĩa là câu hỏi có thể thay đổi tùy thuộc vào câu trả lời trước đó. Một biến thể khác là ứng dụng khảo sát qua điện thoại, mang lại lợi ích là sử dụng trên thiết bị quen thuộc với người tham gia, có thể thực hiện ngoại tuyến và tải dữ liệu lên sau.
Phỏng vấn qua điện thoại (telephone interviews) giúp người phỏng vấn tiếp tục gọi đến khi đạt được kích thước mẫu mong muốn và phù hợp với phương pháp lấy mẫu theo hạn ngạch hơn so với bảng hỏi trực tuyến. Dữ liệu cũng có thể được nhập trực tiếp vào hệ thống máy tính, giúp tiết kiệm thời gian nhập liệu. Tương tự bảng hỏi trực tuyến, phỏng vấn qua điện thoại cũng có thể thiết kế theo kiểu thích ứng.Tuy nhiên, phỏng vấn qua điện thoại cũng có thể gặp thiên lệch. Mặc dù ở các quốc gia phương Tây, hầu hết mọi người đều có điện thoại, nhưng một số không có tên trong danh bạ điện thoại, và điều này ngày càng phổ biến khi nhiều người chỉ sử dụng điện thoại di động mà không dùng điện thoại bàn. Ngoài ra, số điện thoại di động thường không có trong danh bạ. Nhiều người cũng cho rằng khảo sát qua điện thoại là phiền toái và từ chối tham gia ngay từ đầu. Một điểm bất lợi nữa là người trả lời ít có thời gian để suy nghĩ để trả lời và thường trả lời ẩu. Vì vậy, cần gọi vào thời điểm phù hợp khi người tham gia có thể nhận cuộc gọi.
Phỏng vấn trực tiếp (face-to-face interviews) cũng giúp người thực hiện khảo sát đạt được số lượng mẫu cần thiết và hoàn thành hạn ngạch, và có thể điều chỉnh theo phản hồi của người tham gia (adaptive). Tuy nhiên, tương tự như khảo sát qua điện thoại, hình thức này có thể bị coi là xâm phạm quyền riêng tư, dẫn đến việc người được hỏi từ chối hợp tác. Ngoài ra, địa điểm tiến hành phỏng vấn trực tiếp cũng có thể gây thiên lệch, ví dụ như phỏng vấn tại trung tâm thương mại vào ban ngày sẽ khó tiếp cận được những người đang đi làm. Phỏng vấn trực tiếp cũng đòi hỏi công đoạn nhập liệu tương đương với bảng hỏi giấy.
2.8 Phân tích dữ liệu
Bước cuối cùng trong nghiên cứu khảo sát là phân tích dữ liệu. Chúng ta có thể sử dụng nhiều phương pháp (thống kê) khác nhau để phân tích dữ liệu khảo sát, và các phương pháp này sẽ được trình bày trong các chương tiếp theo.
3. Ưu điểm và nhược điểm của nghiên cứu khảo sát
Nghiên cứu khảo sát có nhiều ưu điểm khiến nó trở thành loại hình nghiên cứu phổ biến nhất trong các ngành khoa học xã hội. Trước hết, nó có tính linh hoạt rất cao: chúng ta có thể sử dụng phương pháp khảo sát để nghiên cứu rất nhiều loại câu hỏi nghiên cứu khác nhau — từ mô tả hiện trạng cho đến phân tích mối quan hệ giữa các biến. Khác với thực nghiệm, khảo sát không tạo ra tình huống nhân tạo (như trong phòng thí nghiệm), nên dễ khái quát hóa kết quả vào bối cảnh thực tế — và cũng chính là nơi diễn ra nghiên cứu. Nghiên cứu khảo sát cũng hiệu quả về mặt chi phí và công sức, giúp thu thập lượng lớn dữ liệu với chi phí thấp hơn so với các phương pháp khác như quan sát. Ngoài ra, việc đảm bảo ẩn danh cho người tham gia dễ dàng hơn trong khảo sát, điều này có thể giúp họ trả lời thành thật hơn so với các phương pháp ít ẩn danh hơn như phỏng vấn. Việc sử dụng bảng hỏi chuẩn hóa cũng giúp so sánh dễ dàng giữa các nhóm người trả lời (ví dụ: nam và nữ).
Tuy nhiên, nghiên cứu khảo sát không cho phép nhà nghiên cứu kiểm soát môi trường, nên khó xác định quan hệ nhân quả hơn so với thiết kế thực nghiệm. Dù vậy, bằng cách thu thập dữ liệu về nhiều biến liên quan, sử dụng thiết kế nghiên cứu theo chiều dọc (longitudinal) và mô hình hóa thống kê cẩn thận, đôi khi ta vẫn có thể đưa ra suy luận sơ bộ về quan hệ nhân quả, dù không rõ ràng như trong thực nghiệm.
Một hạn chế khác là khó đạt được hiểu biết sâu sắc về quá trình và sự khác biệt bối cảnh qua bảng hỏi, vì bảng hỏi được chuẩn hóa và giới hạn về độ dài cũng như độ sâu của câu trả lời. Kết hợp khảo sát với các phương pháp định tính (như phỏng vấn sâu hoặc quan sát) có thể giúp khắc phục điều này.
Cuối cùng, mặc dù bảng hỏi rất phù hợp để thu thập thông tin về nhận thức và quan điểm của người trả lời, nhưng việc thu thập thông tin về hành vi thực tế của họ có thể gặp vấn đề, bởi báo cáo tự thuật không phải lúc nào cũng đáng tin cậy. Một số nghiên cứu, chẳng hạn, đã phát hiện ra sự khác biệt lớn giữa báo cáo của giáo viên về việc giảng dạy trong lớp và hành vi thực tế của họ được quan sát bởi người ngoài.
4. Thiết kế bảng hỏi cho nghiên cứu khảo sát
Tôi đã đề cập trước đó rằng cách thu thập dữ liệu có vai trò quyết định đến chất lượng của nghiên cứu. Do đó, thiết kế bảng hỏi là một phần then chốt trong nghiên cứu khảo sát.
Đáng tiếc là quá nhiều nhà nghiên cứu cho rằng việc này đơn giản và không đầu tư công sức đúng mức, dẫn đến việc nhiều bảng hỏi kém chất lượng được sử dụng. Cách thiết kế bảng hỏi và cách diễn đạt câu hỏi sẽ ảnh hưởng trực tiếp đến câu trả lời của người tham gia khảo sát. Vì vậy, việc cân nhắc kỹ lưỡng về loại câu hỏi cần sử dụng là hết sức quan trọng.
Có nhiều loại câu hỏi khác nhau mà chúng ta có thể đưa vào bảng khảo sát. Đầu tiên cần phân biệt sự khác biệt là câu hỏi mở (open-ended questions) và câu hỏi đóng (closed questions). Câu hỏi mở cho phép người trả lời một cách tự do câu trả lời theo cách của họ. Câu hỏi đóng buộc họ phải chọn một trong các phương án đã được nhà nghiên cứu đưa ra. Ví dụ về một câu hỏi mở là:
“Theo bạn, phương pháp dạy đọc tốt nhất là gì?”
Còn dưới đây là một câu hỏi đóng:
Phương pháp nào bạn nghĩ là tốt nhất cho việc dạy đọc? (chỉ chọn 1 đáp án):
a. Phân tích ngữ âm
b. Tổng hợp ngữ âm
c. Phương pháp tiếp cận cân bằng
d. Phương pháp ngôn ngữ toàn diện
Bạn có thể sẽ không ngạc nhiên khi biết rằng cả hai loại câu hỏi (mở và đóng) đều có những ưu điểm và nhược điểm riêng.
Câu hỏi mở có ưu điểm là cho phép người trả lời tự do diễn đạt câu trả lời của họ. Điều này rất quan trọng, vì nó giúp nhà nghiên cứu phát hiện ra những ý kiến hoặc câu trả lời mà trước đó chưa từng nghĩ tới.
Trong khi đó, câu hỏi đóng chỉ giới hạn câu trả lời trong các phương án đã được xây dựng sẵn từ trước, nên không tạo cơ hội cho những bất ngờ xuất hiện. Dù đôi khi ta có thêm tùy chọn “khác” (other), điều này chỉ khắc phục phần nào vì người trả lời thường bị ảnh hưởng bởi các phương án đã được liệt kê trước đó và ít khi chọn “khác”. Tuy nhiên, câu hỏi mở lại khó xử lý hơn và tốn thời gian, vì câu trả lời cần được mã hóa và định lượng thông qua phân tích nội dung (content analysis). Ngoài ra, việc sử dụng câu hỏi mở làm giảm mức độ chuẩn hóa và khả năng so sánh giữa các người trả lời. Cuối cùng, câu hỏi mở cũng khiến người tham gia phải mất nhiều thời gian hơn, nên họ có thể không muốn trả lời kiểu câu hỏi này bằng câu hỏi đóng.
Nhóm hỏi đóng trên thực tế lại là một danh mục rộng, bao gồm nhiều dạng câu hỏi khác nhau. Một dạng đầu tiên là câu hỏi dạng có/không, ví dụ: “Bạn có đồng ý với chính sách của Chính phủ về trợ giảng lớp học không – Có hay Không?” Đây là dạng câu hỏi dễ trả lời đối với người tham gia, nhưng không cho phép thể hiện mức độ hay sắc thái trong câu trả lời. Ví dụ, bạn có thể muốn biết mức độ đồng tình của người trả lời với chính sách đó. Trong trường hợp này, nên dùng thang đo mức độ (rating scale). Thang đo mức độ cho phép người trả lời chọn một trong số các phương án thể hiện mức độ đồng ý hay quan điểm của họ. Loại thang đo này có thể được thiết kế với nhiều hình thức và số lượng các mức độ (đồng tình) khác nhau. Dưới đây là một thang đo mức độ 5 mức, phổ biến trong nghiên cứu và thường được gọi là thang đo Likert 5 (5-point Likert Scale):
Tôi nghĩ tất cả giáo viên trong bang này nên được tăng lương 10.000 đô la (xin chọn một phương án trả lời):
Hoàn toàn không đồng ý
Không đồng ý
Trung lập
Đồng ý
Hoàn toàn đồng ý.
Một ví dụ khác về thang đo mức độ là:
Tôi nghĩ tất cả giáo viên trong bang này nên được tăng lương 10.000 đô la (xin đánh giá mức độ đồng ý của bạn trên thang điểm 10, trong đó 10 là Rất đồng ý, và 0 là Rất không đồng ý):
Rất đồng ý 10-9-8-7-6-5-4-3-2-1-0 Rất phản đối.
Ví dụ đầu tiên (thang đo Likert 5 mức) là những thang đo mức độ truyền thống được sử dụng, trong đó người trả lời có thể chọn một phương án cụ thể trong một dải các lựa chọn, thường là từ 3 đến 7 mức. Lý do mà chúng ta thường không sử dụng nhiều hơn 7 mức là vì người trả lời sẽ gặp khó khăn khi phải phân biệt giữa các lựa chọn. Hãy tưởng tượng một thang đo 9 mức cho câu hỏi ở trên bao gồm các mức như sau: “Rất đồng ý”, “Khá đồng ý”, “Đồng ý”, “Hơi đồng ý”,“Không đồng ý cũng không phản đối”… Rõ ràng là việc phân biệt giữa các mức độ như “khá đồng ý” và “hơi đồng ý” trở nên rất khó khăn. Giờ hãy tưởng tượng nếu ta thêm vào 4 mức nữa. Như bạn có thể thấy, thang đo sẽ nhanh chóng trở nên khó kiểm soát và không thực tế.
Một câu hỏi gây tranh cãi là có nên đưa vào một lựa chọn trung lập (neutral point) cho giữa thang đo hay không?. Một lý do để không đưa vào lựa chọn này là vì các câu trả lời thuộc mục trung lập thường khó diễn giải, do một số người chọn phương án này là vì không hiểu câu hỏi hoặc không có ý kiến gì cả. Trong những trường hợp như vậy, bạn sẽ băn khoăn không biết câu trả lời trung lập thực sự có nghĩa là gì trong số sau: “Theo tôi thì đúng là không đúng cũng không sai”, (2) “Tôi không biết”, hoặc (3) “Tôi không hiểu câu hỏi”? Vấn đề này có thể được giải quyết phần nào bằng cách thêm một lựa chọn “Không biết” ở cuối thang đo (tuyệt đối không đặt ở giữa, nếu không sẽ lại gây ra sự mơ hồ tương tự).
Một vấn đề khác là việc thêm lựa chọn trung lập có thể khiến người trả lời có xu hướng né tránh, không chọn phe nào – một hành vi mà một số người làm rất thường xuyên. Hiện tượng này được gọi là vấn đề thiên lệch trung tâm (central tendency problem) và thường xảy ra khi câu hỏi mang tính nhạy cảm hoặc gây tranh cãi. Để tránh điều này, ta có thể chọn cách loại bỏ lựa chọn trung lập. Tuy nhiên, một số người thực sự có quan điểm trung lập, và nếu không cho họ lựa chọn đó, ta có thể làm sai lệch cách thể hiện quan điểm của họ.
Vấn đề với loại thang đo đánh giá này là nó thuộc loại thang thứ bậc (ordinal) (xem Chương 6), nghĩa là chúng ta không thể xác định được sai khác về mặt toán học giữa các mức độ, ví dụ như giữa “đồng ý” và “rất đồng ý” có bằng khoảng cách giữa “đồng ý” và “không đồng ý” hay không?. Điều này hạn chế khả năng phân tích thống kê của chúng ta, vì vậy nhiều nhà nghiên cứu đã cố gắng phát triển những loại thang đo liên tục (continuous), tương tự như một thước đo. Chẳng hạn ví dụ 2 ở trên đưa ra một giải pháp cho người trả lời đánh giá trên thang điểm từ 1 đến 10, để họ cảm thấy đây là một thang đo liên tục. Tuy nhiên bất kể thế nào, đây vẫn là một thang đo thứ bậc.
Về mặt lý thuyết, một số cách thiết kế câu hỏi có thể cung cấp thang đo liên tục hoặc gần với thang đo liên tục, nhưng một số người cho rằng người được phỏng vấn thật ra không phân biệt rõ ràng đến mức như vậy khi đưa ra câu trả lời. Mặc dù trên lý thuyết là thang đo liên tục hoàn hảo, nhưng trong thực tế có thể bị ảnh hưởng bởi cách người trả lời đánh dấu, khiến kết quả không còn chính xác như mong đợi.
Một vấn đề thường gặp trong các bảng câu hỏi là thiên lệch phản hồi tích cực (positive response bias). Hiện tượng này thường xảy ra khi người trả lời được hỏi về quan điểm của họ đối với nhiều lựa chọn đều hấp dẫn hoặc được ưa chuộng. Trong trường hợp đó, người trả lời có thể đánh giá tất cả các phương án một cách tích cực như nhau, khiến khó xác định đâu là lựa chọn mà họ thực sự ưu tiên hơn. Hãy lấy ví dụ về các mục tiêu giáo dục sau đây:
Thành tích học tập
Một môi trường được quan tâm, chăm sóc
Phát triển thái độ tích cực đối với việc học
Phát triển khả năng tự điều chỉnh
Phát triển công dân có tinh thần khởi nghiệp
Nâng cao lòng tự trọng của học sinh
Nếu chúng ta yêu cầu người trả lời (trong trường hợp này là giáo viên) đánh giá từng mục tiêu bằng thang đo mức độ, rất có thể họ sẽ đánh giá tất cả các mục tiêu này ở mức cao. Điều đó sẽ không cho chúng ta biết rõ yếu tố nào thực sự được họ xem là quan trọng nhất. Để khắc phục điều này, chúng ta cần sử dụng một dạng câu hỏi bắt buộc lựa chọn (forced-choice format). Chẳng hạn bằng cách yêu cầu họ sắp xếp các lựa chọn từ 1 đến 6 theo thứ tự quan trọng (xem ví dụ 5 bên dưới), hoặc bắt buộc họ chọn giữa hai phương án (xem ví dụ 6 bên dưới). Nếu sử dụng đủ số lượng lựa chọn, chúng ta vẫn có thể tính toán được thứ hạng ưu tiên.
Ví dụ 5 về thang đo mức độ: Vui lòng xếp hạng các mục tiêu sau đây theo mức độ quan trọng đối với trường của bạn, từ thứ nhất đến thứ sáu, trong đó 1 là mục tiêu quan trọng nhất, 2 là mục tiêu quan trọng thứ hai, và cứ tiếp tục như vậy.
– Thành tích học tập cao
– Môi trường giáo dục quan tâm, chăm sóc
– Phát triển khả năng tự điều chỉnh
– Phát triển thái độ tích cực đối với việc học
– Phát triển công dân có tinh thần khởi nghiệp
– Nâng cao lòng tự trọng của học sinh
Ví dụ 6 về thang đo mức độ số 6: Vui lòng cho biết trong hai mục tiêu sau, bạn cho rằng mục tiêu nào quan trọng hơn: Thành tích học tập cao hay môi trường giáo dục quan tâm, chăm sóc.
Bên cạnh những vấn đề liên quan đến loại câu hỏi cần sử dụng, còn có một số yếu tố khác cần cân nhắc khi xây dựng bảng hỏi:
1. Giữ cho bảng hỏi ngắn gọn. Yếu tố đầu tiên của một bảng hỏi tốt – bất kể được thực hiện dưới hình thức nào – là không quá dài. Lý do là vì các bảng hỏi dài sẽ khiến người trả lời cảm thấy khó chịu, dẫn đến tỷ lệ không phản hồi cao hơn, hoặc người trả lời cảm thấy chán nản và không hoàn thành bảng hỏi một cách chính xác. Điều này có phần mâu thuẫn với yêu cầu cố gắng thu thập càng nhiều dữ liệu càng tốt, nhưng cần nhớ rằng nếu dữ liệu bạn thu thập là không chính xác thì dù có thu được nhiều đến đâu cũng chẳng ích gì! Chính xác như thế nào là “quá dài” sẽ phụ thuộc vào đối tượng trả lời (nếu họ đặc biệt quan tâm đến chủ đề thì có thể kéo dài hơn một chút), nhưng thông thường, nên đảm bảo rằng bảng hỏi không mất quá 20 phút để hoàn thành (và càng ngắn càng tốt).
2. Giữ cho câu hỏi rõ ràng và đơn giản. Những câu hỏi được diễn đạt mơ hồ sẽ dẫn đến những câu trả lời không rõ ràng, do đó, điều quan trọng là cần diễn đạt câu hỏi một cách sao cho tất cả người trả lời đều có thể hiểu được. Cần nhớ rằng có những vấn đề có vẻ rõ ràng với bạn với tư cách là nhà nghiên cứu nhưng có thể lại không rõ ràng đối với người được hỏi. Tránh sử dụng từ viết tắt, và trong trường hợp cần sử dụng các thuật ngữ kỹ thuật, nên có phần giải thích kèm theo.
3. Bao gồm tùy chọn “tôi không biết” trong thang đo đánh giá. Cần cung cấp một phương án lựa chọn “tôi không biết” trong thang đo, để những người không có câu trả lời hoặc không có ý kiến có thể lựa chọn phương án này. Điều này đặc biệt quan trọng nếu bạn sử dụng thang đo có điểm trung lập; nếu không có phương án “tôi không biết”, những người muốn chọn nó có thể sẽ chọn điểm trung lập, làm cho câu trả lời trở nên khó diễn giải.
4. Tránh sử dụng câu phủ định kép. Những cấu trúc như “nếu bạn không phản đối…” nên được loại bỏ hoàn toàn khỏi bảng hỏi, bởi chúng gây nhầm lẫn cho người trả lời, khiến họ phải thực hiện thao tác tư duy bổ sung để diễn giải câu hỏi.
5. Mỗi câu hỏi chỉ nên hỏi một nội dung. Mặc dù điều này nghe có vẻ hiển nhiên, nhưng trên thực tế thường xuyên bị bỏ qua. Rất dễ bị cám dỗ khi đưa hai nội dung muốn hỏi vào một mục, ví dụ như: “Bạn có nghĩ rằng chương trình Reading Recovery là một phương pháp hiệu quả và tiết kiệm chi phí trong việc cải thiện điểm đọc của học sinh yếu kém không?” Vấn đề ở đây là cả người trả lời và người nghiên cứu đều sẽ gặp khó khăn trong việc diễn giải câu hỏi và câu trả lời. Một người có thể cho rằng chương trình này hiệu quả nhưng lại không tiết kiệm về chi phí hoặc thời gian. Vậy họ nên chọn phương án nào? Tương tự, khi nhận được câu trả lời, bạn sẽ diễn giải như thế nào? Một câu trả lời phủ định có nghĩa là người đó cho rằng chương trình vừa không hiệu quả vừa không tiết kiệm, hay chỉ là không hiệu quả?
6. Cân nhắc đến sự khác biệt văn hóa. Lưu tâm đến tính nhạy cảm về mặt văn hóa của câu hỏi/bảng hỏi là rất quan trọng. Tránh sử dụng các mục hoặc cách diễn đạt có thể gây mơ hồ hoặc thiên lệch về văn hóa, chẳng hạn như yêu cầu người trả lời cung cấp tên thánh (Christian name) của họ.
Chiến lược hiệu quả nhất để giảm thiểu các vấn đề trên là tiến hành khảo nghiệm thử nghiệm bảng hỏi. Trước tiên, hãy nhờ đồng nghiệp đọc qua bảng hỏi. Sau đó, áp dụng bảng hỏi với một nhóm nhỏ đại diện cho đối tượng khảo sát. Yêu cầu họ đưa ra phản hồi về công cụ này và kiểm định thống kê các câu trả lời để xác định liệu có những mô thức phản hồi bất thường nào cho thấy một số mục/câu hỏi chưa được hiểu đúng hay không.
Một hình thức thử nghiệm bảng hỏi hữu ích và ngày càng được sử dụng rộng rãi là phỏng vấn nhận thức (cognitive interviews). Phỏng vấn nhận thức là phương pháp nhằm tìm hiểu quá trình suy nghĩ của người trả lời khi họ hoàn thành bảng hỏi. Cách tiếp cận này giúp chúng ta xác định xem người trả lời có thực sự hiểu các câu hỏi theo cách mà nhà nghiên cứu mong đợi hay không, và liệu có tồn tại những liên tưởng không cần thiết hoặc không hữu ích nào hay không. Có hai hình thức chính của phỏng vấn nhận thức: trong phỏng vấn nghĩ to thành lời (think-aloud interviews), người tham gia được yêu cầu nói ra suy nghĩ của họ khi cố gắng trả lời các câu hỏi trong bảng hỏi. Hình thức thứ hai là gợi hỏi bằng lời (verbal probing). Trong trường hợp này, nhà nghiên cứu đưa ra một loạt các câu hỏi thăm dò liên quan đến bảng hỏi – chẳng hạn như họ hiểu một thuật ngữ cụ thể trong câu hỏi như thế nào, liệu câu hỏi đó dễ hay khó trả lời, họ đã suy luận như thế nào để đưa ra câu trả lời, hoặc mức độ chắc chắn của họ đối với câu trả lời đó. Nhà nghiên cứu cũng có thể yêu cầu người trả lời lặp lại câu hỏi theo cách hiểu của họ nhằm kiểm tra mức độ lĩnh hội nội dung.
5. Nghiên cứu quan sát
Một phương pháp nghiên cứu khác được sử dụng khá phổ biến trong lĩnh vực giáo dục là nghiên cứu quan sát (observational research). Việc quan sát trong lớp học hoặc trong các cơ sở mầm non được xem là một cách hữu ích để khám phá nhiều câu hỏi nghiên cứu trong giáo dục, chẳng hạn như: liệu trẻ em trai và trẻ em gái có cách chơi khác nhau hay không, hoặc hành vi của giáo viên có ảnh hưởng đến thành tích học tập của học sinh hay không.
5.1 Những điểm mạnh và hạn chế
Các nghiên cứu quan sát có một số ưu điểm so với nghiên cứu khảo sát. Những ưu điểm chính bao gồm:
- Nghiên cứu quan sát có thể tiếp cận trực tiếp vào các tương tác xã hội. Đây là một lợi thế khi chúng ta muốn tìm hiểu điều gì thực sự xảy ra trong một bối cảnh thay vì chỉ dựa vào những gì người tham gia báo cáo. Điều này rất quan trọng, vì có một lượng lớn nghiên cứu cho thấy, ví dụ, các báo cáo tự đánh giá của giáo viên về hành vi và phong cách giảng dạy của họ thường không chính xác và mâu thuẫn với các báo cáo từ quan sát viên bên ngoài và từ chính học sinh của họ (Muijs, 2006). Một lý do là bởi vì con người thường khó tự phản ánh và biết được chính xác mình đang làm gì. Nhiều giáo viên không có nhiều cơ hội để so sánh phương pháp giảng dạy của mình với đồng nghiệp, do đó khó có thể xác định xem họ có thường xuyên sử dụng phương pháp dạy học theo nhóm hay không, chẳng hạn. Trong một số trường hợp, người tham gia có thể thiên về việc đưa ra câu trả lời được xã hội chấp nhận trong bảng hỏi. Hãy tưởng tượng bạn đang đánh giá một chiến lược giảng dạy mới của chính phủ. Giáo viên có thể biết rằng câu trả lời “đúng” là câu trả lời phù hợp với phương pháp giảng dạy mới và có thể bị cám dỗ trả lời như vậy ngay cả khi họ không thực sự sử dụng phương pháp đó. Tiếp cận trực tiếp vào các tình huống xã hội cũng đặc biệt cần thiết khi chúng ta nghiên cứu trẻ em. Trẻ nhỏ có thể gặp nhiều khó khăn khi trả lời các câu hỏi liên quan đến tương tác với bạn bè, và ngay cả việc đo lường quá trình học tập của các em cũng thường tốt hơn khi thực hiện qua phương pháp quan sát, vì các bài kiểm tra có thể không đáng tin cậy với trẻ nhỏ.
2 Các phương pháp quan sát rất đa dạng và linh hoạt. Có thể quan sát nhiều tình huống khác nhau theo nhiều cách khác nhau. Điều này có nghĩa là, giống như nghiên cứu khảo sát, chúng ta có thể xem xét khá nhiều câu hỏi nghiên cứu khác nhau bằng cách sử dụng các phương pháp quan sát.
- Vì chúng ta đang quan sát trong các bối cảnh tự nhiên, nên chúng ta có thể dễ dàng khái quát hóa kết quả cho các bối cảnh thực tế so với phương pháp thực nghiệm.
Tuy nhiên, nghiên cứu quan sát cũng có những nhược điểm quan trọng sau đây:
Nhược điểm đầu tiên là phương pháp này đòi hỏi nhiều thời gian, công sức và nguồn lực. Các buổi quan sát thường rất căng thẳng và tốn thời gian. Bản thân ngay quá trình quan sát đã mất nhiều thời gian (ví dụ: một tiết học 50 phút cộng thêm thời gian ghi chép lại), và trong nhiều trường hợp, chúng ta cần quan sát cùng một học sinh hoặc giáo viên nhiều lần để đảm bảo độ tin cậy. Nếu chỉ quan sát một lần, chúng ta sẽ không biết hành vi đó có điển hình hay chỉ là một tình huống nhất thời. Quan sát cũng đòi hỏi người quan sát phải được đào tạo bài bản, vì điều quan trọng là họ cần đạt được độ tin cậy; nghĩa là nếu quan sát cùng một tình huống hai lần, chúng ta mong muốn có cùng một kết quả. Điều này càng quan trọng hơn khi có nhiều người quan sát trong cùng một nghiên cứu, vì cần đảm bảo họ đều sử dụng tiêu chí giống nhau khi quan sát. Một cách để giảm bớt vấn đề này là quay video tình huống được quan sát, điều này cho phép phân tích và mã hóa dữ liệu sau đó.
Quan sát có thể gây phiền toái cho người bị quan sát, những người có thể cảm thấy căng thẳng và vì vậy không sẵn lòng tham gia. Điều này đặc biệt đúng trong bối cảnh phần lớn các buổi quan sát được thực hiện bởi những người có vị trí quyền lực, với mục đích đánh giá hiệu suất hoặc giám sát, như thường thấy trong lĩnh vực giáo dục. Là một nhà nghiên cứu, bạn có thể giảm bớt điều này bằng cách giải thích rõ rằng bạn đang thực hiện nghiên cứu chứ không phải giám sát, đồng thời thể hiện thái độ thân thiện khi quan sát. Tuy nhiên, như bất kỳ ai từng bị quan sát đều biết, điều này không thể loại bỏ hoàn toàn vấn đề.
Việc quan sát gây ra cảm giác bị xâm nhập cũng đồng nghĩa với việc người quan sát có thể dễ dàng ảnh hưởng đến tình huống. Nếu bạn bị quan sát, bạn có thể trở nên lo lắng hơn hoặc cố gắng thể hiện tốt hơn bình thường. Trẻ em đôi khi có thể cư xử khác lạ trước người quan sát lạ mặt; giáo viên có thể giảng dạy theo cách mà họ nghĩ người quan sát muốn thấy hoặc chuẩn bị kỹ hơn cho các tiết học được quan sát. Trên thực tế, người quan sát không thể làm nhiều để khắc phục điều này, ngoài việc tăng số lần quan sát để người được quan sát quen với sự hiện diện của mình. Bạn cũng cần lưu ý rằng sự hiện diện của bạn có thể gây ra thiên lệch. Một dạng thiên lệch khác là thiên lệch từ người quan sát (observer bias); tức là bạn, với tư cách người quan sát, có thể diễn giải tình huống theo một cách chủ quan nào đó. Nếu có nhiều người quan sát trong nghiên cứu, vấn đề này sẽ càng nghiêm trọng. Điều này chỉ có thể được khắc phục bằng cách huấn luyện kỹ lưỡng, thực hành và có hướng dẫn rõ ràng cùng tiêu chí quan sát cụ thể.
4 Cuối cùng, vì phương pháp quan sát, cũng giống như khảo sát, là phương pháp phi thực nghiệm, nên nó cũng gặp phải những hạn chế tương tự khi cố gắng đưa ra suy luận về quan hệ nhân quả (causal inferences).
Ví dụ 3.2: Mối quan hệ giữa hành vi của giáo viên và kết quả học tập của học sinh
Nghiên cứu quy mô lớn này về ảnh hưởng của hành vi (trong giảng dạy) của giáo viên đến kết quả môn toán được thực hiện tại các trường tiểu học ở Anh (Muijs & Reynolds, 2002). Trong khuôn khổ của nghiên cứu này, mỗi năm có hơn 100 giáo viên được quan sát, và học sinh của họ được làm bài kiểm tra toán tiêu chuẩn vào đầu năm và cuối năm học.
Quy trình thực hiện quan sát bao gồm nhiều phần: các quan sát viên ghi lại mô tả chi tiết về tiết học, bao gồm nội dung và các sự kiện chính diễn ra trong suốt buổi học. Họ cũng ghi chú xem hoạt động trong lớp thuộc loại làm việc nhóm, làm việc cá nhân, giảng dạy theo kiểu thuyết trình cho cả lớp, hay tương tác cả lớp (các chuyển tiếp giữa các phần của tiết học và phần hành chính cũng được ghi nhận). Cứ mỗi 5 phút, họ kiểm tra lớp học một lần để đếm số học sinh đang tập trung và không tập trung. Sau tiết học, quan sát viên hoàn thành một thang đo đánh giá, ghi nhận hơn 50 hành vi khác nhau của giáo viên.
Kết quả cho thấy nhiều hành vi giảng dạy của giáo viên có mối quan hệ tích cực với thành tích môn toán của học sinh. Các hành vi này cũng có mối liên hệ với nhau, tạo thành một cấu trúc gọi là “giảng dạy hiệu quả - effective teaching”. Việc học với giáo viên hiệu quả nhất so với giáo viên kém hiệu quả nhất có thể tạo ra sự khác biệt lên đến 20% về điểm số cuối năm học, ngay cả khi đã tính đến điểm số đầu năm và hoàn cảnh của học sinh. Nghiên cứu cũng cho thấy rằng trong các lớp học có nhiều hoạt động tương tác cả lớp, giáo viên có xu hướng có hành vi giảng dạy hiệu quả cao hơn so với các lớp sử dụng nhiều hình thức làm việc cá nhân.
5.2 Thiết kế nghiên cứu quan sát
Về bản chất, một nghiên cứu quan sát được cấu trúc tương tự như một nghiên cứu khảo sát. Các yếu tố như mục tiêu nghiên cứu, xác định quần thể và chọn mẫu đều giống nhau. Một điểm khác biệt là trong nghiên cứu quan sát, chúng ta không chỉ lấy mẫu từ người tham gia hoặc bối cảnh, mà còn lấy mẫu từ các “lát cắt thời gian” (hoặc các thời điểm quan sát - occasions). Điều đó có nghĩa gì? Về cơ bản, khi quan sát một tiết học chẳng hạn, điều chúng ta thường muốn làm là khái quát hóa kết quả quan sát được cho tất cả các tiết học của giáo viên đó; hoặc khi quan sát trẻ em chơi đùa, chúng ta muốn khái quát hành vi chơi đùa đã quan sát được cho toàn bộ hành vi chơi đùa nói chung của trẻ. Vì vậy, mỗi lần quan sát là một mẫu được rút ra từ tập hợp các tiết học hoặc giờ chơi có thể xảy ra. Chúng ta đang thực hiện việc lấy mẫu hai lần: một là từ quần thể người tham gia, hai là từ tập hợp các lần quan sát có thể thực hiện được đối với những người tham gia đó. Khi thực hiện lấy mẫu ngẫu nhiên, về bản chất, chúng ta đang thực hiện lấy mẫu ngẫu nhiên từ hai quần thể: một là người tham gia và một là các lần quan sát lồng ghép trong mỗi người tham gia.
Thiết kế công cụ (designing instruments) là một bước then chốt cho nghiên cứu dựa trên quan sát, và có nhiều cách khác nhau để thiết kế công cụ quan sát. Công cụ chính trong bất kỳ nghiên cứu quan sát nào dĩ nhiên là lịch trình quan sát (observation schedule), và nó có thể được triển khai theo nhiều hình thức khác nhau.
Hình thức dễ thiết kế nhất, nhưng lại khó sử dụng và phân tích nhất, là bản ghi mô tả quan sát (descriptive observation record). Trong loại biểu mẫu này, người quan sát được yêu cầu ghi lại tất cả những gì có liên quan xảy ra trong buổi quan sát, tập trung vào các yếu tố liên quan trực tiếp đến câu hỏi nghiên cứu, chẳng hạn như tương tác giữa học sinh trong các nhóm nhỏ. Đặc tính mở và thiên về định tính của kiểu công cụ (hay biểu mẫu) này mang lại lợi thế cho phép người quan sát phát hiện ra những yếu tố mà họ chưa nghĩ đến trước đó (khác với thang đo), và có thể cung cấp thông tin rất chi tiết và phong phú. Tuy nhiên, điểm bất lợi là loại dữ liệu này khó mã hóa và tốn nhiều thời gian, yêu cầu người quan sát phải có mức độ tập trung và tỉnh táo rất cao, đồng thời khó so sánh kết quả giữa các lần quan sát, đặc biệt khi có nhiều người quan sát trong dự án. Một ví dụ về mẫu mô tả được trình bày trong Phụ lục 3.1 của chương này, trong đó người quan sát được yêu cầu ghi lại các yếu tố chính của tiết học và ghi thời gian mỗi khi có sự thay đổi diễn ra. Tính chủ quan và sai lệch có thể là vấn đề cả khi ghi chép và khi mã hóa dữ liệu.
Một phương pháp phổ biến hơn là sử dụng thang đo xếp hạng (rating scale), trong đó người quan sát đánh giá tần suất hoặc chất lượng của các hành vi quan sát được. Ví dụ (xem Phụ lục 3.2), chúng ta có thể đánh giá chất lượng của các tương tác giữa giáo viên và học sinh. Loại thang đo này được gọi là công cụ quan sát suy luận cao (high-inference observation instrument) vì nó yêu cầu người quan sát phải đưa ra phán đoán về những gì đã được quan sát. Điều này trái ngược với công cụ suy luận cấp thấp (low-inference instrument), nơi người quan sát chỉ đơn giản là đếm hành vi (ví dụ: số câu hỏi giáo viên đặt ra cho học sinh nam và nữ). Các công cụ suy luận cấp thấp rõ ràng đòi hỏi ít sự đánh giá chủ quan hơn từ người quan sát và do đó khách quan hơn, ít thiên lệch hơn. Tuy nhiên, điều này cũng giới hạn phạm vi nghiên cứu. Thật dễ dàng để đếm số lần giáo viên tương tác với học sinh trong một tiết học, nhưng ta không thể đếm được chất lượng của các tương tác đó. Vì vậy, đối với nhiều câu hỏi nghiên cứu, việc sử dụng công cụ suy luận cao là cần thiết. Giống như thang đo trong bảng hỏi, thang đo quan sát tốt cần rõ ràng, dễ hiểu và không nên có quá nhiều mức đánh giá.
Lấy mẫu theo thời gian (Time sampling) là phương pháp ghi lại một “bức ảnh” của sự kiện tại những khoảng thời gian cố định (ví dụ: cứ mỗi 5 phút một lần). Phương pháp này thường được sử dụng khi nhà nghiên cứu muốn đo lường mức độ học sinh tập trung vào nhiệm vụ trong lớp học. Cứ mỗi 5 hoặc 10 phút, nhà nghiên cứu sẽ quan sát toàn bộ lớp và đếm số học sinh đang tập trung hoặc không tập trung vào hoạt động học tập. Từ đó, có thể tính được tỷ lệ phần trăm thời gian học sinh tập trung trong suốt tiết học. Khi áp dụng phương pháp này, cần lưu ý rằng chúng ta đang lấy mẫu theo các thời điểm nhất định, do đó cần có số lượng mẫu đủ lớn để đảm bảo kết quả không bị sai lệch chỉ vì rơi vào một thời điểm không điển hình — chẳng hạn lúc học sinh đặc biệt ngoan ngoãn hoặc ngược lại, mất trật tự hơn bình thường.
Các loại thang đo khác nhau có thể được kết hợp trong một công cụ quan sát duy nhất để đồng thời theo dõi nhiều yếu tố, chẳng hạn như thời gian học sinh tập trung và hành vi giảng dạy của giáo viên. Điều này có thể thực hiện bằng cách sử dụng kết hợp giữa thang đánh giá và công cụ đếm thời gian tập trung, mặc dù điều này rõ ràng sẽ gia tăng áp lực và yêu cầu cao hơn đối với người quan sát.
Việc thu thập dữ liệu được thực hiện bằng cách quan sát một tình huống, bối cảnh hoặc tương tác, sử dụng công cụ đã được thiết kế trước đó. Khi quan sát, bạn phải luôn tập trung vào các yếu tố cần theo dõi, tránh bị phân tâm bởi những yếu tố không liên quan. Nếu hành vi cần đếm xảy ra với tần suất cao, bạn có thể cần áp dụng phương pháp lấy mẫu theo thời gian. Khi sử dụng thang đánh giá, thông thường nên ghi chép mô tả trong quá trình quan sát và hoàn thành phần đánh giá sau đó, nhằm đảm bảo có cái nhìn tổng thể về tiết học. Trong nhiều trường hợp, chúng ta sẽ quay video tiết học và tiến hành mã hóa (coding) từ bản ghi hình. Cách làm này cho phép chúng ta phân tích và mã hóa dữ liệu từ thang đánh giá sau buổi học, đồng thời có thể xem lại tiết học nhiều lần thay vì chỉ một lần, qua đó tạo ra một bản ghi lâu dài. Tuy nhiên, một số người có thể cảm thấy không thoải mái khi bị quay video, và video thường cũng không ghi lại được toàn bộ mọi diễn biến trong lớp do bị giới hạn bởi góc quay của máy.
6. Phân tích dữ liệu có sẵn
Thay vì phải tự thu thập dữ liệu, chúng ta thường có thể sử dụng các bộ dữ liệu đã có sẵn để tìm hiểu những câu hỏi cụ thể trong lĩnh vực giáo dục. Việc làm này mang lại nhiều lợi ích quan trọng. Trước hết, nó rẻ hơn nhiều so với việc tự đi thu thập dữ liệu. Thứ hai, chúng ta không cần phải tự xây dựng công cụ khảo sát hay đo lường. Và trong một số trường hợp, các dữ liệu và công cụ đã được kiểm chứng là có độ tin cậy và tính hợp lệ cao. Tuy nhiên, cần nhớ rằng những dữ liệu có sẵn này thường được thu thập với mục đích khác với nghiên cứu của chúng ta. Vì vậy, có thể các khái niệm được định nghĩa và đo lường khác với cách chúng ta mong muốn, và chúng ta cũng không thể thêm mới hay thay đổi các biến số có trong bộ dữ liệu.
Chẳng hạn, nếu chúng ta muốn tìm hiểu trường nào có sự tiến bộ lớn nhất về thành tích học tập trong vòng 5 năm qua, chúng ta có thể sử dụng các dữ liệu công khai như kết quả các bài kiểm tra tiêu chuẩn do bang hoặc quốc gia tổ chức để xem trường nào cải thiện điểm số nhiều nhất. Ngoài ra, hiện nay có khá nhiều bộ dữ liệu mà các nhà nghiên cứu có thể mua hoặc truy cập miễn phí để phục vụ cho công trình của mình. Ví dụ, chương trình Nghiên cứu Dọc Quốc gia về Giáo dục của Trung tâm Thống kê Giáo dục Quốc gia Hoa Kỳ (National Center for Education Statistics) cung cấp các dữ liệu theo dõi dài hạn về sự phát triển học tập, nghề nghiệp và cá nhân của thanh thiếu niên ở Mỹ – bắt đầu từ bậc tiểu học hoặc trung học và theo dõi qua nhiều năm. Tổ chức này cũng đã khởi động một nghiên cứu dọc về giai đoạn đầu đời của trẻ em.
Một nguồn dữ liệu rất hữu ích và hoàn toàn miễn phí khác là các nghiên cứu so sánh quốc tế trong giáo dục. Trong số đó, hai chương trình lâu đời nhất là “Xu hướng trong Nghiên cứu Toán và Khoa học Quốc tế” (TIMSS) và “Tiến bộ trong Nghiên cứu Khả năng Đọc hiểu” (PIRLS), do Hiệp hội Giáo dục Quốc tế (International Education Association) điều hành. TIMSS đo lường kết quả học toán và khoa học ở hơn 30 quốc gia. Đợt khảo sát đầu tiên được tiến hành vào năm 1995 và gần đây nhất là năm 2019. PIRLS bắt đầu từ năm 2001 và lần gần nhất là năm 2021. Cả hai chương trình này không chỉ thu thập dữ liệu về kết quả học tập mà còn thu thập thông tin về môi trường lớp học và nhà trường.
Một tập hợp các nghiên cứu khác có ảnh hưởng lớn đến chính sách giáo dục là Chương trình Đánh giá Học sinh Quốc tế (Programme for International Student Assessment - PISA). Chương trình này do Tổ chức Hợp tác và Phát triển Kinh tế (OECD) tài trợ và được triển khai tại nhiều quốc gia thành viên OECD cũng như các nước đối tác. PISA đánh giá kết quả học tập của học sinh trong các môn đọc hiểu, toán và khoa học – mỗi năm khảo sát sẽ chọn một môn làm trọng tâm và thu thập thêm dữ liệu chuyên sâu về môn đó. Đợt khảo sát gần nhất của PISA diễn ra vào năm 2018. Ngoài điểm số, PISA còn thu thập dữ liệu về thái độ của học sinh, đặc điểm lớp học và các yếu tố liên quan đến nhà trường thông qua bảng hỏi khảo sát. Báo cáo và dữ liệu PISA có thể truy cập tại địa chỉ www.pisa.oecd.org.
Những lợi thế lớn nhất của các nghiên cứu quốc tế là chúng tạo cơ hội cho việc so sánh giữa các quốc gia, đồng thời các công cụ đo lường được sử dụng trong các nghiên cứu này thường rất đáng tin cậy và hợp lệ vì đã được xây dựng một cách cẩn thận và kỹ lưỡng. Tuy nhiên, nhược điểm rõ ràng là chúng ta bị giới hạn trong phạm vi những biến số mà nhóm phát triển nghiên cứu coi là quan trọng.
Ngoài ra, dữ liệu từ các cơ quan quản lý và chính sách cũng là một nguồn rất hữu ích. Tại Anh, dữ liệu từ các báo cáo thanh tra của Ofsted (Office for Standards in Education - Văn phòng Tiêu chuẩn Giáo dục) có thể được truy cập miễn phí tại trang web www.ofsted.gov.uk. Trong các báo cáo này có thông tin như tỷ lệ học sinh có nhu cầu đặc biệt, quy mô trường học, và các đánh giá định lượng về chất lượng của nhiều khía cạnh trong hoạt động giáo dục. Tương tự, Liên minh châu Âu (EU) cũng công bố nhiều số liệu liên quan đến giáo dục và các chỉ số xã hội khác thông qua nền tảng Eurostat.
Cuối cùng, bạn cũng nên xem xét các loại dữ liệu hiện hiện có ngay tại các trường ở địa phương hoặc tại trường học mà bạn đang làm việc. Ngày nay, các trường học và cơ quan quản lý giáo dục địa phương ngày càng trở thành những tổ chức “giàu dữ liệu”, vì họ thường thu thập nhiều loại thông tin như kết quả học tập, hành vi học sinh, tình hình chuyên cần,… và những dữ liệu này hoàn toàn có thể trở thành nguồn tài nguyên quý giá cho nghiên cứu.
Tuy nhiên, khi sử dụng dữ liệu chính thức từ các báo cáo thanh tra, cần đặc biệt lưu ý rằng mục đích ban đầu của những dữ liệu này thường không phải để phục vụ cho nghiên cứu. Ví dụ, dữ liệu thanh tra không được thiết kế cho mục đích nghiên cứu khoa học nên có thể không phù hợp với tất cả các dạng nghiên cứu. Độ tin cậy của dữ liệu thường không được kiểm chứng rõ ràng. Ngay cả với các bài kiểm tra tiêu chuẩn do nhà nước ban hành, các đặc tính đo lường (như độ tin cậy và độ hợp lệ) đôi khi cũng không được công bố. Ngoài ra, điều kiện tổ chức khảo sát và thu thập dữ liệu không phải lúc nào cũng rõ ràng với các nhà nghiên cứu bên ngoài. Những vấn đề này ít nghiêm trọng hơn đối với các bộ dữ liệu được xây dựng phục vụ riêng cho nghiên cứu, chẳng hạn như dữ liệu từ các chương trình như PISA. Tuy vậy, bạn vẫn cần lưu ý rằng các thang đo và cách định nghĩa khái niệm trong các nghiên cứu đó có thể khác với cách bạn mong muốn trong nghiên cứu của mình. Hơn nữa, vì lý do bảo mật, nhiều dữ liệu chính thức chỉ được công bố ở cấp độ trường học chứ không phải ở cấp độ học sinh cá nhân. Điều này có thể gây khó khăn trong việc phân tích và diễn giải dữ liệu, vì các số liệu tổng hợp có thể che giấu sự khác biệt giữa các học sinh trong cùng một trường. Ngoài ra, còn có những vấn đề kỹ thuật thống kê khác sẽ được bàn sâu hơn ở Chương 12.
Dù vậy, các bộ dữ liệu có sẵn vẫn là nguồn tài nguyên vô giá cho các nhà nghiên cứu giáo dục và thường là một cách tiết kiệm chi phí và hiệu quả để trả lời một số câu hỏi nghiên cứu nhất định.
Mặc dù chúng ta đã xem xét các phương pháp nghiên cứu này một cách riêng lẻ, nhưng trong thực tế, việc kết hợp nhiều phương pháp khác nhau trong một nghiên cứu có thể đem lại giá trị lớn hơn. Ví dụ, nếu bạn muốn tìm hiểu các yếu tố lớp học và nhà trường ảnh hưởng như thế nào đến thành tích học tập, bạn có thể kết hợp dữ liệu điểm số từ các bài kiểm tra chuẩn hóa với kết quả khảo sát hiệu trưởng về phong cách quản lý và quan sát trực tiếp hành vi giảng dạy của giáo viên. Việc kết hợp giữa các phương pháp thu thập dữ liệu định lượng và định tính cũng có thể giúp làm giàu thêm nghiên cứu của bạn. Chẳng hạn, nếu bạn muốn tìm hiểu điều gì tạo nên sự khác biệt ở các trường học hiệu quả nhất, bạn có thể sử dụng dữ liệu định lượng (như điểm thi chuẩn hóa và thông tin nền của học sinh) để xác định các trường học đạt kết quả cao, rồi sau đó tiến hành phỏng vấn định tính các giáo viên và cán bộ quản lý để tìm hiểu sâu hơn về những chiến lược mà họ đang áp dụng.
Lời khuyên tốt nhất tôi có thể đưa ra khi bạn lựa chọn phương pháp nghiên cứu là hãy dựa vào mục đích nghiên cứu. Hãy chọn phương pháp phù hợp nhất để trả lời câu hỏi mà bạn đặt ra. Những ưu và nhược điểm của từng phương pháp đã được tóm tắt ở trên sẽ giúp bạn đưa ra quyết định phù hợp.
Những ngộ nhận phổ biến
1. Tôi muốn nghiên cứu xem liệu việc dành quá nhiều thời gian trên mạng xã hội có gây ra kết quả học tập kém ở học sinh tiểu học hay không. Tôi đã thu thập dữ liệu điểm kiểm tra và dữ liệu từ bảng hỏi về việc sử dụng mạng xã hội của các em, và tôi thấy có mối liên hệ giữa hai yếu tố này. Vậy điều đó có nghĩa là tôi có thể khẳng định giả thuyết của mình là đúng và nói rằng sử dụng mạng xã hội gây ra kết quả học tập kém, đúng không?
Không phải. Rất khó để rút ra kết luận chắc chắn về mối quan hệ nhân quả chỉ dựa trên nghiên cứu khảo sát. Việc bạn tìm thấy mối liên hệ giữa hai yếu tố không đồng nghĩa với việc một yếu tố gây ra yếu tố kia. Mối liên hệ đó có thể bị ảnh hưởng bởi một biến gây nhiễu thứ ba — ví dụ: những học sinh có nhận thức bản thân thấp (low self-concept) có xu hướng dành nhiều thời gian hơn trên mạng xã hội và cũng có kết quả học tập thấp hơn. Ngoài ra, nguyên nhân có thể đi theo chiều ngược lại: học sinh học kém có thể bị giảm lòng tự trọng và tìm cách “thoát khỏi thực tại” bằng cách dành thời gian trên mạng xã hội nhiều hơn. Để có cơ sở chắc chắn hơn, bạn cần ít nhất phải tiến hành một nghiên cứu theo thời gian (longitudinal study) và thu thập thêm nhiều dữ liệu về các biến gây nhiễu có thể tồn tại. Nhưng xét cho cùng, phương pháp thực nghiệm (experimental methods) vẫn là công cụ phù hợp hơn để xác định mối quan hệ nhân quả.
2. Nghiên cứu khảo sát là dạng nghiên cứu dễ nhất, đúng không?
Không phải. Nghiên cứu khảo sát có thể là cách hiệu quả nhất để thu thập một lượng lớn dữ liệu, nhưng việc thiết kế một nghiên cứu khảo sát tốt hoàn toàn không đơn giản. Cần đầu tư thời gian và công sức để xây dựng và kiểm tra các công cụ khảo sát, chọn mẫu đúng cách, và hạn chế tối đa việc người được hỏi không phản hồi. Những cuộc khảo sát được thực hiện qua loa và thiếu cẩn trọng rất phổ biến, và thường dẫn đến những kết quả không đáng tin cậy hoặc vô nghĩa.
3.Nghiên cứu quan sát ít thiên lệch hơn khảo sát vì nó phản ánh thế giới thực đúng như nó vốn có.
Điều này chỉ đúng một phần. Nghiên cứu quan sát không phụ thuộc vào cảm nhận chủ quan của người được hỏi như khảo sát, nhưng lại phụ thuộc vào góc nhìn của người quan sát – người có thể mang theo định kiến hoặc sự thiên lệch cá nhân nào đó. Hơn nữa, sự xuất hiện của người quan sát bên ngoài có thể khiến hành vi của người được quan sát thay đổi. Do đó, quan sát không bao giờ là một “bức tranh nguyên bản” hoàn toàn trung thực về thực tế.
7. Tóm tắt chương
Nghiên cứu khảo sát là một trong những phương pháp phổ biến nhất trong khoa học xã hội và giáo dục. Nguyên nhân chủ yếu là vì đây là cách hiệu quả để thu thập một lượng lớn dữ liệu, đồng thời rất linh hoạt — nhiều chủ đề khác nhau có thể được nghiên cứu bằng phương pháp khảo sát. Tuy nhiên, quan niệm rằng nghiên cứu khảo sát là dễ làm là hoàn toàn sai. Cần xem xét kỹ lưỡng quần thể nghiên cứu là ai/là gì và cách chọn mẫu như thế nào, vì chỉ những mẫu được chọn theo phương pháp dựa trên xác suất mới đảm bảo không bị thiên lệch. Tình trạng người tham gia không phản hồi (non-response) khá phổ biến và có thể dẫn đến sai lệch trong kết quả nghiên cứu, tương tự như các bảng hỏi được thiết kế kém chất lượng. Việc tránh các câu phủ định kép, câu hỏi mơ hồ hoặc không rõ ràng, câu hỏi kép, giữ cho bảng hỏi ngắn gọn và nhạy cảm với yếu tố văn hóa có thể giúp giảm thiểu thiên lệch.
Nghiên cứu quan sát mang lại khả năng tiếp cận trực tiếp với các tình huống xã hội, nhờ đó chúng ta không phải phụ thuộc vào những câu trả lời mang tính chủ quan của người tham gia như trong khảo sát. Điều này đặc biệt quan trọng khi nghiên cứu các lĩnh vực mà người trả lời có thể bị ảnh hưởng bởi xu hướng muốn trả lời theo cách “được xã hội chấp nhận”. Tuy nhiên, quan sát là một phương pháp rất tốn thời gian, đòi hỏi huấn luyện kỹ lưỡng cho người quan sát và vẫn có thể mang thiên lệch, vì người quan sát khó tránh khỏi việc ảnh hưởng đến hành vi của người bị quan sát. Quan sát có hệ thống đòi hỏi phải xây dựng công cụ quan sát, và những công cụ này có thể có nhiều hình thức khác nhau. Mô tả chi tiết các tình huống quan sát mang lại thông tin phong phú nhưng lại rất khó mã hóa thành dữ liệu. Việc đếm số lần xuất hiện của một hành vi nào đó cho độ tin cậy cao hơn, nhưng lại giới hạn phạm vi những gì chúng ta có thể quan sát. Thang đánh giá (rating scales) giúp khắc phục vấn đề này nhưng lại có thể kém tin cậy hơn, vì đòi hỏi người quan sát phải đưa ra nhiều suy luận hơn.
Cuối cùng, chúng ta thường có thể sử dụng các bộ dữ liệu đã có sẵn, chẳng hạn như điểm thi tiêu chuẩn của nhà nước, các báo cáo thanh tra, hoặc những bộ dữ liệu giáo dục công khai do các nghiên cứu quốc tế thu thập. Đây có lẽ là cách tiết kiệm nhất để thu thập dữ liệu, nhưng cần lưu ý rằng các bộ dữ liệu này được xây dựng nhằm mục đích khác với mục tiêu nghiên cứu của chúng ta, và có thể sử dụng những định nghĩa khác cho các khái niệm cốt lõi. Độ tin cậy của chúng cũng có thể chưa được xác định rõ.
Việc kết hợp nhiều loại dữ liệu khác nhau thường có thể giúp làm sáng tỏ các câu hỏi nghiên cứu phức tạp hơn.
8. Bài tập
Sự khác biệt chính giữa nghiên cứu thực nghiệm và nghiên cứu phi thực nghiệm là gì?
“Nghiên cứu quan sát cho chúng ta một bức tranh chân thực về thực tế, trong khi nghiên cứu khảo sát chỉ phản ánh nhận thức”. Bạn đồng ý hay không đồng ý với nhận định này? Tại sao?
Nếu khảo sát là phương pháp linh hoạt và hiệu quả nhất để thực hiện nghiên cứu, tại sao chúng ta lại cần đến các loại nghiên cứu khác?
Tôi muốn biết liệu thực hành giảng dạy của giáo viên có ảnh hưởng đến nhận thức bản thân của học sinh không. Bạn có thể thiết kế một nghiên cứu về điều này không?
Tôi muốn biết cả giáo viên và học sinh trong trường tôi nghĩ gì về hệ thống cố vấn (mentoring system ) mới mà tôi đã triển khai. Bạn có thể thiết kế một nghiên cứu về điều này không?
Tôi muốn biết liệu nhận thức bản thân có ảnh hưởng đến thành tích học tập của học sinh, hay ngược lại – thành tích học tập cao hơn dẫn đến nhận thức bản thân tích cực hơn. Liệu có thể xác định điều này bằng nghiên cứu phi thực nghiệm không? Nếu có, tôi nên làm thế nào?
9. Tài liệu nghiên cứu thêm
Một tài liệu hướng dẫn dễ tiếp cận và mang tính thực tiễn cao về cách thiết kế bảng hỏi là cuốn Write a Questionnaire: Little Quick Fix của Kara, H. (2019), do NXB Sage phát hành.
Tài liệu tổng quan toàn diện nhất về nghiên cứu khảo sát có lẽ là bộ sách The Survey Kit (ấn bản lần thứ 2) của Fink, A. (2002), cũng do Sage xuất bản.
Có một điều khá bất ngờ là hiện nay vẫn còn thiếu các tài liệu chuyên sâu về quan sát định lượng trong lớp học. Tác phẩm kinh điển trong lĩnh vực này – dù hiện không dễ tìm – là cuốn Systematic Classroom Observation của Croll, P. (1986), do Falmer Press xuất bản.
Một bài báo khoa họa liên quan đến chủ đề này là Muijs, D. (2006), Measuring teacher effectiveness: Some methodological reflections, Educational Research and Evaluation, 12(1), 53–75.
10. Tài liệu tham khảo
Muijs, D. (2017). Can schools reduce bullying? The relationship between school characteristics and the prevalence of bullying behaviours. British Journal of Educational Psychology, 87(2), 255–272
Muijs, D. (2006). Measuring teacher effectiveness: Some methodological reflections. Educational Research and Evaluation, 12(1), 53–75.
Muijs, D., & Reynolds, D. (2002). Effective teaching: Evidence and practice. Paul Chapman Publishing.