1. Trong phân tích hồi quy tuyến tính (linear regression), hệ số hồi quy (regression coefficient) cho biết:
A. Mức độ phù hợp của mô hình với dữ liệu.
B. Sự thay đổi của biến độc lập khi biến phụ thuộc thay đổi một đơn vị.
C. Sự thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
D. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
2. Trong thống kê suy luận (inferential statistics), sai số loại I (Type I error) xảy ra khi:
A. Chấp nhận giả thuyết không (null hypothesis) khi nó sai.
B. Bác bỏ giả thuyết không khi nó đúng.
C. Không bác bỏ giả thuyết không khi nó sai.
D. Chấp nhận giả thuyết nghiên cứu khi nó sai.
3. Trong thống kê cho khoa học xã hội, đạo đức nghiên cứu yêu cầu điều gì liên quan đến dữ liệu?
A. Tự do chỉnh sửa dữ liệu để đạt được kết quả mong muốn.
B. Bảo mật thông tin cá nhân của người tham gia nghiên cứu và sử dụng dữ liệu một cách trung thực.
C. Chỉ công bố kết quả có ý nghĩa thống kê.
D. Không cần xin phép người tham gia nếu dữ liệu được thu thập công khai.
4. Thống kê Bayesian khác với thống kê tần suất (frequentist statistics) chủ yếu ở điểm nào?
A. Thống kê Bayesian sử dụng dữ liệu mẫu, còn thống kê tần suất thì không.
B. Thống kê Bayesian dựa trên khái niệm xác suất chủ quan, còn thống kê tần suất dựa trên tần suất lặp lại.
C. Thống kê Bayesian chỉ dùng cho dữ liệu định tính, còn thống kê tần suất cho dữ liệu định lượng.
D. Thống kê Bayesian không sử dụng giả thuyết không.
5. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết nghiên cứu là đúng.
B. Xác suất quan sát được kết quả như mẫu, giả định giả thuyết không là đúng.
C. Mức độ ý nghĩa thống kê của kết quả.
D. Kích thước của hiệu ứng nghiên cứu.
6. Trong phân tích dữ liệu khảo sát, 'trọng số mẫu′ (sample weights) được sử dụng để:
A. Giảm kích thước mẫu để tiết kiệm chi phí.
B. Điều chỉnh cho việc chọn mẫu không đồng đều và tăng tính đại diện của mẫu.
C. Đo lường mức độ tin cậy của dữ liệu khảo sát.
D. Xử lý dữ liệu bị thiếu.
7. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Thang đo nhiệt độ Celsius.
B. Thang đo Likert (hoàn toàn không đồng ý - hoàn toàn đồng ý).
C. Thang đo giới tính (nam, nữ, khác).
D. Thang đo thu nhập (triệu đồng∕tháng).
8. Thống kê phi tham số (non-parametric statistics) thường được sử dụng khi:
A. Dữ liệu tuân theo phân phối chuẩn.
B. Kích thước mẫu lớn (n > 30).
C. Giả định về phân phối của dữ liệu không được đáp ứng.
D. Phân tích mối quan hệ tuyến tính là mục tiêu chính.
9. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với sai số chuẩn của trung bình mẫu?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm đi.
C. Sai số chuẩn không thay đổi.
D. Sai số chuẩn biến động ngẫu nhiên.
10. Kiểm định Chi-bình phương (Chi-square test) thường được dùng để phân tích:
A. Mối quan hệ tuyến tính giữa hai biến định lượng.
B. Sự khác biệt về trung bình giữa hai nhóm.
C. Sự khác biệt giữa tần số quan sát và tần số kỳ vọng của biến định tính.
D. Phương sai của một tổng thể.
11. Trong nghiên cứu khoa học xã hội, biến định tính (qualitative variable) được sử dụng để:
A. Đo lường các thuộc tính số lượng một cách chính xác.
B. Phân loại đối tượng nghiên cứu vào các nhóm hoặc phạm trù.
C. Xác định mối quan hệ nhân quả giữa các hiện tượng.
D. Tính toán giá trị trung bình và độ lệch chuẩn.
12. Phân tích phương sai (ANOVA) được sử dụng để:
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa các biến.
13. Phương pháp 'phân tích đường dẫn′ (path analysis) thường được dùng để:
A. Phân tích mối quan hệ nhân quả trực tiếp và gián tiếp giữa các biến.
B. Phân loại đối tượng vào các nhóm.
C. Dự đoán giá trị của biến phụ thuộc dựa trên nhiều biến độc lập.
D. So sánh trung bình của nhiều nhóm.
14. Trong thống kê, 'đa cộng tuyến′ (multicollinearity) là vấn đề khi nào?
A. Khi có nhiều biến phụ thuộc trong mô hình hồi quy.
B. Khi các biến độc lập trong mô hình hồi quy có tương quan cao với nhau.
C. Khi dữ liệu không tuân theo phân phối chuẩn.
D. Khi kích thước mẫu quá nhỏ.
15. Phương pháp chọn mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo rằng:
A. Mỗi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu như nhau.
B. Mẫu thu được hoàn toàn đại diện cho tổng thể.
C. Kích thước mẫu là lớn nhất có thể.
D. Việc chọn mẫu được thực hiện một cách hệ thống, theo quy tắc nhất định.
16. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường:
A. Mức độ mạnh yếu của mối quan hệ nhân quả.
B. Mức độ mạnh yếu và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ khác biệt giữa hai nhóm.
D. Mức độ phù hợp của mô hình hồi quy.
17. Khái niệm 'tính tin cậy′ (reliability) trong nghiên cứu định lượng liên quan đến:
A. Mức độ đo lường chính xác khái niệm nghiên cứu mong muốn.
B. Mức độ nhất quán và ổn định của kết quả đo lường.
C. Mức độ khách quan của quá trình thu thập dữ liệu.
D. Mức độ phù hợp của phương pháp phân tích thống kê.
18. Khi nào thì việc sử dụng thống kê suy luận là không phù hợp trong nghiên cứu khoa học xã hội?
A. Khi nghiên cứu sử dụng mẫu ngẫu nhiên từ tổng thể lớn.
B. Khi mục tiêu nghiên cứu là khám phá và mô tả hiện tượng, không phải khái quát hóa.
C. Khi kích thước mẫu đủ lớn (n > 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
19. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mức độ lệch của phân phối dữ liệu.
D. Mức độ tin cậy của ước lượng.
20. Trong thiết kế nghiên cứu khoa học xã hội, 'nghiên cứu cắt ngang′ (cross-sectional study) khác với 'nghiên cứu dọc′ (longitudinal study) như thế nào?
A. Nghiên cứu cắt ngang thu thập dữ liệu tại một thời điểm, nghiên cứu dọc thu thập dữ liệu qua nhiều thời điểm.
B. Nghiên cứu cắt ngang chỉ sử dụng dữ liệu định tính, nghiên cứu dọc chỉ dùng dữ liệu định lượng.
C. Nghiên cứu cắt ngang tập trung vào mô tả, nghiên cứu dọc tập trung vào giải thích nhân quả.
D. Nghiên cứu cắt ngang luôn có kích thước mẫu lớn hơn nghiên cứu dọc.
21. Trong báo cáo kết quả nghiên cứu thống kê, 'khoảng tin cậy 95%' (95% confidence interval) có nghĩa là:
A. Có 95% khả năng giá trị trung bình mẫu bằng giá trị trung bình tổng thể.
B. Có 95% khả năng giá trị trung bình tổng thể nằm trong khoảng ước lượng.
C. Có 95% khả năng kết quả nghiên cứu là đúng.
D. Sai số chuẩn của ước lượng là 5%.
22. Mục đích chính của thống kê mô tả (descriptive statistics) trong khoa học xã hội là:
A. Dự đoán xu hướng tương lai của một hiện tượng xã hội.
B. Khái quát hóa kết quả nghiên cứu từ mẫu lên tổng thể.
C. Tóm tắt và mô tả các đặc điểm cơ bản của dữ liệu.
D. Kiểm định các giả thuyết nghiên cứu về mối quan hệ.
23. Phương pháp 'bootstrap′ trong thống kê được sử dụng để:
A. Kiểm định giả thuyết về trung bình tổng thể.
B. Ước lượng sai số chuẩn và khoảng tin cậy bằng cách lấy mẫu lại từ dữ liệu mẫu.
C. Phân tích phương sai giữa nhiều nhóm.
D. Xác định các nhân tố ẩn từ dữ liệu.
24. Phương pháp phân tích nhân tố (factor analysis) được sử dụng để:
A. Phân loại đối tượng vào các nhóm dựa trên đặc điểm.
B. Giảm số lượng biến quan sát bằng cách xác định các nhân tố ẩn.
C. Dự đoán giá trị của một biến dựa trên biến khác.
D. So sánh trung bình của nhiều nhóm.
25. Phân tích hồi quy đa biến (multiple regression) cho phép:
A. Dự đoán giá trị của một biến phụ thuộc dựa trên một biến độc lập.
B. Dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập.
C. So sánh trung bình của nhiều nhóm.
D. Phân tích mối quan hệ giữa hai biến định tính.
26. Giá trị trung vị (median) phù hợp nhất để đo xu hướng trung tâm của dữ liệu khi:
A. Dữ liệu tuân theo phân phối chuẩn (normal distribution).
B. Dữ liệu có giá trị ngoại lai (outliers) đáng kể.
C. Dữ liệu được đo bằng thang đo khoảng (interval scale).
D. Dữ liệu thể hiện tính đối xứng cao.
27. Phương pháp 'meta-analysis′ (phân tích tổng hợp) được sử dụng để:
A. Phân tích dữ liệu từ một nghiên cứu duy nhất.
B. Tổng hợp kết quả từ nhiều nghiên cứu khác nhau về cùng một chủ đề.
C. Phân tích dữ liệu định tính.
D. Kiểm định giả thuyết nhân quả.
28. Trong nghiên cứu khoa học xã hội, 'hiệu ứng cỡ mẫu′ (sample size effect) đề cập đến:
A. Ảnh hưởng của phương pháp chọn mẫu đến tính đại diện.
B. Ảnh hưởng của kích thước mẫu đến khả năng phát hiện ra hiệu ứng có ý nghĩa thống kê.
C. Ảnh hưởng của sai số lấy mẫu đến kết quả.
D. Sự khác biệt giữa kích thước mẫu lý thuyết và kích thước mẫu thực tế.
29. Khi nào nên sử dụng kiểm định t (t-test) độc lập?
A. Để so sánh trung bình của một mẫu với một giá trị xác định.
B. Để so sánh trung bình của hai mẫu phụ thuộc (paired samples).
C. Để so sánh trung bình của hai mẫu độc lập.
D. Để phân tích phương sai giữa nhiều nhóm.
30. Trong nghiên cứu định lượng, khái niệm 'tính giá trị' (validity) đề cập đến:
A. Mức độ nhất quán của kết quả đo lường theo thời gian.
B. Mức độ đo lường chính xác khái niệm nghiên cứu mong muốn.
C. Mức độ khái quát hóa kết quả nghiên cứu lên tổng thể.
D. Mức độ tin cậy của phương pháp chọn mẫu.