1. Lý do chính khiến 'tính đại diện của mẫu′ (sample representativeness) quan trọng trong nghiên cứu khoa học xã hội là gì?
A. Để giảm chi phí nghiên cứu.
B. Để kết quả nghiên cứu có thể khái quát hóa (generalize) cho tổng thể mà mẫu được chọn ra từ đó.
C. Để đảm bảo tính tin cậy của đo lường.
D. Để đơn giản hóa phân tích dữ liệu.
2. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường độ mạnh của mối quan hệ tuyến tính.
3. Khi thực hiện phân tích đa biến (multivariate analysis), điều gì quan trọng cần xem xét?
A. Chỉ mối quan hệ giữa hai biến.
B. Sự tương quan giữa các biến độc lập và tác động đồng thời của chúng lên biến phụ thuộc.
C. Chỉ biến phụ thuộc.
D. Cỡ mẫu nhỏ.
4. Khái niệm 'hiệu ứng cỡ mẫu′ (sample size effect) trong thống kê đề cập đến điều gì?
A. Ảnh hưởng của phương pháp lấy mẫu đến kết quả.
B. Ảnh hưởng của cỡ mẫu đến độ chính xác và độ tin cậy của ước lượng thống kê. Cỡ mẫu lớn hơn thường dẫn đến ước lượng chính xác hơn.
C. Ảnh hưởng của giá trị ngoại lai đến thống kê.
D. Ảnh hưởng của biến số gây nhiễu.
5. Trong phân tích dữ liệu lớn (big data analytics) cho khoa học xã hội, thách thức chính thường là gì?
A. Thiếu dữ liệu.
B. Quản lý và phân tích khối lượng dữ liệu khổng lồ, đa dạng và tốc độ cao, đồng thời đảm bảo tính riêng tư và đạo đức.
C. Dữ liệu quá chính xác.
D. Thiếu công cụ thống kê phù hợp.
6. Trong thống kê Bayes, 'ước lượng hậu nghiệm′ (posterior estimate) được tính toán dựa trên những thông tin nào?
A. Chỉ dữ liệu mẫu hiện tại.
B. Kết hợp thông tin tiên nghiệm (prior information) và dữ liệu mẫu.
C. Chỉ thông tin tiên nghiệm.
D. Không sử dụng thông tin tiên nghiệm.
7. Ưu điểm chính của việc sử dụng nghiên cứu hỗn hợp (mixed methods research) là gì?
A. Tiết kiệm thời gian và chi phí.
B. Cung cấp cái nhìn toàn diện và sâu sắc hơn về vấn đề nghiên cứu bằng cách kết hợp cả phương pháp định lượng và định tính.
C. Loại bỏ hoàn toàn sai số nghiên cứu.
D. Dễ dàng khái quát hóa kết quả nghiên cứu.
8. Trong nghiên cứu khoa học xã hội, 'sai số hệ thống′ (systematic error) thường phát sinh từ đâu?
A. Sự biến động ngẫu nhiên trong dữ liệu.
B. Mẫu nghiên cứu quá nhỏ.
C. Lỗi do người nhập liệu.
D. Thiết kế nghiên cứu có lỗi hoặc phương pháp đo lường không phù hợp, dẫn đến sai lệch nhất quán theo một hướng.
9. Trong phân tích hồi quy tuyến tính, hệ số xác định R-bình phương (R-squared) cho biết điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu, tức là tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng hệ số hồi quy.
D. Ý nghĩa thống kê của hệ số hồi quy.
10. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ tác động của một biến độc lập lên biến phụ thuộc.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt trung bình giữa hai nhóm.
D. Tỷ lệ phương sai được giải thích bởi mô hình hồi quy.
11. Phương pháp lấy mẫu phân tầng (stratified sampling) phù hợp khi nào?
A. Khi tổng thể đồng nhất.
B. Khi muốn đảm bảo tính đại diện của các nhóm nhỏ (strata) trong tổng thể có sự khác biệt.
C. Khi cỡ mẫu rất lớn.
D. Khi không có thông tin về tổng thể.
12. Ý nghĩa của 'khoảng tin cậy′ (confidence interval) là gì?
A. Khoảng giá trị chắc chắn chứa tham số tổng thể.
B. Khoảng giá trị ước tính chứa tham số tổng thể với một mức độ tin cậy nhất định.
C. Phạm vi dữ liệu mẫu.
D. Ngưỡng ý nghĩa thống kê.
13. Phân tích nội dung (content analysis) thường được sử dụng trong nghiên cứu khoa học xã hội để làm gì?
A. Phân tích dữ liệu số từ khảo sát.
B. Phân tích dữ liệu định tính dạng văn bản, hình ảnh hoặc video để xác định các chủ đề, mẫu và xu hướng.
C. Thực hiện thí nghiệm trong phòng thí nghiệm.
D. Phỏng vấn sâu cá nhân.
14. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi cỡ mẫu lớn.
B. Khi dữ liệu không đáp ứng các giả định của thống kê tham số, như phân phối chuẩn, hoặc khi làm việc với dữ liệu thứ bậc (ordinal).
C. Khi muốn tính toán trung bình và độ lệch chuẩn.
D. Khi dữ liệu là biến định lượng liên tục.
15. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện.
D. Sử dụng kiểm định thống kê không phù hợp.
16. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán hoặc biến động của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ giữa hai biến.
17. Trong nghiên cứu theo chiều dọc (longitudinal study), ưu điểm nổi bật so với nghiên cứu cắt ngang (cross-sectional study) là gì?
A. Thu thập dữ liệu nhanh chóng và ít tốn kém hơn.
B. Cho phép nghiên cứu sự thay đổi và phát triển theo thời gian, cũng như mối quan hệ nhân quả theo trình tự thời gian.
C. Loại bỏ hoàn toàn sai số hệ thống.
D. Dễ dàng khái quát hóa kết quả hơn.
18. Trong nghiên cứu định lượng, 'tính giá trị' (validity) của một đo lường đề cập đến điều gì?
A. Mức độ đo lường cho kết quả nhất quán qua thời gian.
B. Mức độ đo lường thực sự đo lường được khái niệm mà nó được thiết kế để đo lường.
C. Mức độ dễ dàng thực hiện đo lường.
D. Mức độ đo lường được chấp nhận rộng rãi trong cộng đồng khoa học.
19. Trong kiểm định giả thuyết thống kê, 'giá trị p′ (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Ngưỡng ý nghĩa thống kê được đặt ra.
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả hiện tại, giả định rằng giả thuyết null là đúng.
D. Mức độ mạnh mẽ của hiệu ứng nghiên cứu.
20. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. So sánh trung bình của hai nhóm độc lập.
B. Kiểm tra mối quan hệ giữa hai biến định lượng.
C. Kiểm tra mối quan hệ giữa hai biến định tính (categorical variables).
D. Dự đoán giá trị của một biến dựa trên biến khác.
21. Khi nào thì việc sử dụng số trung vị (median) phù hợp hơn so với số trung bình (mean) để mô tả xu hướng trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối chuẩn (normal distribution).
B. Khi dữ liệu có giá trị ngoại lai (outliers) hoặc phân phối lệch (skewed distribution).
C. Khi cỡ mẫu rất lớn.
D. Khi muốn tính toán độ lệch chuẩn.
22. Chọn mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
A. Mẫu đại diện hoàn hảo cho tổng thể.
B. Mỗi cá thể trong tổng thể có cơ hội được chọn vào mẫu như nhau.
C. Giảm thiểu sai số hệ thống.
D. Đảm bảo cỡ mẫu lớn nhất có thể.
23. Thước đo tỷ lệ (Ratio scale) khác biệt cơ bản so với thước đo khoảng (Interval scale) ở điểm nào?
A. Thước đo tỷ lệ không có thứ tự, trong khi thước đo khoảng có thứ tự.
B. Thước đo tỷ lệ có khoảng cách bằng nhau giữa các giá trị, còn thước đo khoảng thì không.
C. Thước đo tỷ lệ có điểm gốc 0 tuyệt đối, thể hiện sự vắng mặt hoàn toàn của thuộc tính đo lường, trong khi thước đo khoảng không có.
D. Thước đo tỷ lệ chỉ đo lường các biến định tính, còn thước đo khoảng đo lường các biến định lượng.
24. Trong nghiên cứu khoa học xã hội, vấn đề 'đa cộng tuyến′ (multicollinearity) xuất hiện khi nào?
A. Khi biến phụ thuộc có nhiều giá trị.
B. Khi các biến độc lập trong mô hình hồi quy có tương quan cao với nhau.
C. Khi cỡ mẫu quá lớn.
D. Khi sử dụng biến định tính trong mô hình hồi quy.
25. Trong kiểm định một đuôi (one-tailed test) và kiểm định hai đuôi (two-tailed test), sự khác biệt chính là gì?
A. Kiểm định một đuôi luôn mạnh hơn kiểm định hai đuôi.
B. Kiểm định một đuôi chỉ xét sự khác biệt theo một hướng cụ thể, còn kiểm định hai đuôi xét sự khác biệt theo cả hai hướng.
C. Kiểm định một đuôi dùng cho mẫu nhỏ, kiểm định hai đuôi dùng cho mẫu lớn.
D. Kiểm định một đuôi dùng cho biến định tính, kiểm định hai đuôi dùng cho biến định lượng.
26. Trong nghiên cứu can thiệp (intervention research), mục tiêu chính của việc đo lường 'điểm cơ sở' (baseline measurement) là gì?
A. Để so sánh với dữ liệu từ các nghiên cứu khác.
B. Để có được dữ liệu trước khi can thiệp, làm cơ sở so sánh với dữ liệu sau can thiệp để đánh giá hiệu quả của can thiệp.
C. Để xác định cỡ mẫu cần thiết.
D. Để kiểm tra tính tin cậy của công cụ đo lường.
27. Điều gì KHÔNG phải là một yếu tố cần xem xét khi đánh giá chất lượng của một nghiên cứu định lượng?
A. Tính giá trị (validity) của đo lường.
B. Tính tin cậy (reliability) của đo lường.
C. Tính chủ quan của người nghiên cứu.
D. Tính khái quát hóa (generalizability) của kết quả.
28. Phương pháp 'bootstrapping′ trong thống kê được sử dụng để làm gì?
A. Tăng cỡ mẫu nghiên cứu.
B. Ước tính độ tin cậy của các thống kê mẫu bằng cách lấy mẫu lại có hoàn lại từ mẫu gốc.
C. Kiểm tra tính phân phối chuẩn của dữ liệu.
D. Xử lý dữ liệu ngoại lai.
29. Thang đo Likert thường được sử dụng để đo lường loại biến nào trong khoa học xã hội?
A. Biến định lượng liên tục.
B. Biến định lượng rời rạc.
C. Biến định tính thứ bậc (ordinal).
D. Biến định tính danh nghĩa (nominal).
30. Mục đích chính của thống kê mô tả (descriptive statistics) là gì?
A. Đưa ra kết luận về tổng thể dựa trên mẫu.
B. Tóm tắt và mô tả các đặc điểm chính của một tập dữ liệu.
C. Kiểm định giả thuyết về mối quan hệ giữa các biến.
D. Dự đoán xu hướng tương lai.