1. Trong phân tích đường dẫn (path analysis), mục đích chính là:
A. So sánh trung bình của nhiều nhóm.
B. Xác định mối quan hệ tương quan giữa các biến.
C. Mô hình hóa và kiểm định các mối quan hệ nhân quả phức tạp giữa nhiều biến.
D. Phân tích tần số xuất hiện của các biến định tính.
2. Khoảng tin cậy (confidence interval) cho phép:
A. Xác định giá trị chính xác của tham số tổng thể.
B. Ước lượng một khoảng giá trị mà tham số tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định giả thuyết về tham số tổng thể.
D. Mô tả đặc điểm của mẫu nghiên cứu.
3. Độ lệch chuẩn (standard deviation) là căn bậc hai của:
A. Trung bình (mean).
B. Trung vị (median).
C. Phương sai (variance).
D. Khoảng biến thiên (range).
4. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường:
A. Mức độ khác biệt giữa trung bình của hai biến.
B. Mức độ phụ thuộc lẫn nhau giữa hai biến định tính.
C. Mức độ và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Sự thay đổi của một biến khi biến kia thay đổi một đơn vị.
5. Khi phân tích dữ liệu khảo sát, trọng số (weighting) có thể được sử dụng để:
A. Tăng cỡ mẫu nghiên cứu.
B. Điều chỉnh sự không cân bằng trong mẫu để phản ánh đúng hơn đặc điểm của tổng thể.
C. Đơn giản hóa quá trình phân tích dữ liệu.
D. Tăng mức ý nghĩa thống kê của kết quả.
6. Phân tích hồi quy tuyến tính được sử dụng chủ yếu để:
A. So sánh trung bình của hai nhóm độc lập.
B. Đo lường mức độ liên kết giữa hai biến định tính.
C. Mô hình hóa và dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập.
D. Xác định sự khác biệt có ý nghĩa thống kê giữa các nhóm.
7. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị:
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả mẫu nếu giả thuyết null đúng.
C. Mức độ quan trọng thực tế của kết quả nghiên cứu.
D. Ngưỡng ý nghĩa thống kê được đặt ra trước khi kiểm định.
8. Trong nghiên cứu định lượng, 'tính giá trị' (validity) của một công cụ đo lường đề cập đến:
A. Khả năng công cụ đo lường cho kết quả nhất quán qua thời gian.
B. Mức độ dễ sử dụng và thực tế của công cụ đo lường.
C. Mức độ công cụ đo lường thực sự đo lường được khái niệm mà nó được thiết kế để đo lường.
D. Chi phí thấp để sử dụng công cụ đo lường.
9. Khi báo cáo kết quả nghiên cứu định lượng, giá trị 'effect size′ (cỡ hiệu ứng) cung cấp thông tin gì?
A. Mức độ ý nghĩa thống kê của kết quả.
B. Độ lớn hoặc cường độ của hiệu ứng quan sát được.
C. Xác suất sai số loại I.
D. Khoảng tin cậy của kết quả.
10. Trong phân tích nội dung định lượng (quantitative content analysis), đơn vị mã hóa (coding unit) có thể là:
A. Ý nghĩa tiềm ẩn của văn bản.
B. Cảm xúc của người đọc văn bản.
C. Từ, cụm từ, câu hoặc đoạn văn bản cụ thể.
D. Bối cảnh lịch sử của văn bản.
11. Khi trình bày kết quả thống kê, việc sử dụng biểu đồ hộp (boxplot) đặc biệt hữu ích để:
A. Hiển thị tần số của các giá trị trong dữ liệu.
B. So sánh trung bình của các nhóm.
C. Trực quan hóa phân phối của dữ liệu, xác định giá trị ngoại lệ và so sánh phân phối giữa các nhóm.
D. Mô tả mối quan hệ tuyến tính giữa hai biến.
12. Phương pháp nào sau đây giúp giảm thiểu sai số do yếu tố nhiễu (confounding variables) trong nghiên cứu quan sát?
A. Tăng cỡ mẫu.
B. Sử dụng lấy mẫu ngẫu nhiên đơn giản.
C. Sử dụng phân tích hồi quy đa biến để kiểm soát các biến nhiễu.
D. Giảm mức ý nghĩa thống kê (alpha level).
13. Phương pháp 'bootstrap′ trong thống kê được sử dụng chủ yếu để:
A. Kiểm định giả thuyết về trung bình tổng thể.
B. Ước lượng độ tin cậy của ước tính thống kê (ví dụ: sai số chuẩn, khoảng tin cậy) khi không có giả định về phân phối.
C. Phân tích phương sai giữa các nhóm.
D. Mô hình hóa mối quan hệ tuyến tính giữa các biến.
14. Chọn câu phát biểu đúng về mối quan hệ giữa cỡ mẫu và sai số chuẩn (standard error):
A. Cỡ mẫu càng lớn, sai số chuẩn càng lớn.
B. Cỡ mẫu càng nhỏ, sai số chuẩn càng nhỏ.
C. Cỡ mẫu càng lớn, sai số chuẩn càng nhỏ.
D. Cỡ mẫu và sai số chuẩn không liên quan đến nhau.
15. Phương sai (variance) đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Mức độ phân tán hoặc biến động của dữ liệu xung quanh giá trị trung bình.
D. Vị trí trung tâm của dữ liệu.
16. Trong thống kê, 'phân phối lấy mẫu′ (sampling distribution) đề cập đến:
A. Phân phối của dữ liệu trong mẫu nghiên cứu.
B. Phân phối của tất cả các giá trị có thể có của một thống kê mẫu (ví dụ: trung bình mẫu) nếu lấy nhiều mẫu từ cùng một tổng thể.
C. Phân phối của tổng thể nghiên cứu.
D. Phân phối của sai số ngẫu nhiên trong dữ liệu.
17. Khi nào việc sử dụng thống kê mô tả trở nên đặc biệt quan trọng trong nghiên cứu khoa học xã hội?
A. Khi muốn dự đoán xu hướng tương lai.
B. Khi cần so sánh trung bình của các nhóm.
C. Khi cần tóm tắt và trình bày dữ liệu một cách rõ ràng và dễ hiểu, đặc biệt với dữ liệu lớn và phức tạp.
D. Khi muốn kiểm định các giả thuyết nhân quả.
18. Khi nào thì kiểm định phi tham số (non-parametric tests) được ưu tiên sử dụng hơn kiểm định tham số (parametric tests)?
A. Khi cỡ mẫu lớn (n > 30).
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi cần tính toán khoảng tin cậy.
19. Loại thang đo nào cho phép xác định thứ hạng và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).
20. Trong nghiên cứu khoa học xã hội, việc sử dụng thống kê suy luận (inferential statistics) cho phép:
A. Mô tả đặc điểm của mẫu nghiên cứu.
B. Khái quát hóa kết quả từ mẫu nghiên cứu lên tổng thể lớn hơn.
C. Trình bày dữ liệu một cách trực quan.
D. Đảm bảo tính chính xác tuyệt đối của kết quả nghiên cứu.
21. Phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) được sử dụng khi:
A. Tổng thể nghiên cứu quá lớn và không thể tiếp cận toàn bộ.
B. Các nhóm nhỏ (strata) trong tổng thể có đặc điểm khác biệt và cần được đại diện đầy đủ trong mẫu.
C. Muốn chọn mẫu một cách nhanh chóng và tiết kiệm chi phí.
D. Không có thông tin về cấu trúc tổng thể nghiên cứu.
22. Trong phân tích dữ liệu định tính, khái niệm 'tam giác hóa′ (triangulation) đề cập đến:
A. Sử dụng ba biến độc lập trong phân tích hồi quy.
B. So sánh ba nhóm đối tượng nghiên cứu khác nhau.
C. Sử dụng nhiều nguồn dữ liệu hoặc phương pháp khác nhau để xác nhận tính hợp lệ của kết quả.
D. Chia mẫu nghiên cứu thành ba phần bằng nhau.
23. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện cho tổng thể.
D. Sử dụng phương pháp thống kê không phù hợp.
24. Thống kê mô tả trong khoa học xã hội chủ yếu tập trung vào:
A. Dự đoán xu hướng tương lai dựa trên dữ liệu mẫu.
B. Mô tả và tóm tắt các đặc điểm chính của một tập dữ liệu.
C. Kiểm định các giả thuyết về mối quan hệ giữa các biến.
D. Ước lượng tham số của tổng thể dựa trên thống kê mẫu.
25. Ý nghĩa thống kê (statistical significance) khác với ý nghĩa thực tế (practical significance) ở điểm nào?
A. Ý nghĩa thống kê liên quan đến cỡ mẫu, còn ý nghĩa thực tế thì không.
B. Ý nghĩa thống kê cho biết kết quả có phải do ngẫu nhiên hay không, còn ý nghĩa thực tế đánh giá tầm quan trọng hoặc ứng dụng của kết quả trong thực tế.
C. Ý nghĩa thống kê luôn quan trọng hơn ý nghĩa thực tế.
D. Ý nghĩa thực tế chỉ áp dụng cho nghiên cứu định tính.
26. Trong kiểm định giả thuyết, mức ý nghĩa α (alpha level) thường được đặt ở 0.05. Điều này có nghĩa là:
A. Có 5% khả năng giả thuyết null là đúng.
B. Có 5% khả năng mắc sai số loại II.
C. Có 5% khả năng bác bỏ giả thuyết null khi nó thực sự đúng (sai số loại I).
D. Có 95% khả năng chấp nhận giả thuyết null khi nó đúng.
27. Phương pháp thống kê nào phù hợp để kiểm tra mối quan hệ giữa hai biến định tính?
A. Hồi quy tuyến tính.
B. T-test độc lập.
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).
28. Phân tích ANOVA (Analysis of Variance) được sử dụng để:
A. Đo lường mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của ba nhóm trở lên.
C. Phân tích tần số xuất hiện của các biến định tính.
D. Dự đoán giá trị của một biến phụ thuộc dựa trên một biến độc lập.
29. Giá trị trung vị (median) là thước đo vị trí trung tâm phù hợp nhất khi dữ liệu:
A. Phân phối chuẩn (normal distribution).
B. Không có giá trị ngoại lệ (outliers).
C. Bị lệch (skewed) hoặc có giá trị ngoại lệ.
D. Được đo bằng thang đo tỷ lệ (ratio scale).
30. Trong nghiên cứu khoa học xã hội, đạo đức thống kê yêu cầu điều gì?
A. Luôn sử dụng các phương pháp thống kê phức tạp nhất để đảm bảo độ chính xác.
B. Báo cáo tất cả các kết quả thống kê, kể cả những kết quả không ủng hộ giả thuyết nghiên cứu.
C. Chỉ công bố những kết quả có ý nghĩa thống kê cao.
D. Bảo mật thông tin cá nhân của người tham gia nghiên cứu và báo cáo kết quả một cách trung thực, khách quan.