1. Hiện tượng đa cộng tuyến (multicollinearity) trong hồi quy đa biến đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau
C. Sự thiếu tuyến tính trong mối quan hệ giữa biến phụ thuộc và biến độc lập
D. Phương sai sai số thay đổi
2. Trong thống kê, 'degrees of freedom′ (bậc tự do) thường liên quan đến điều gì?
A. Kích thước mẫu
B. Số lượng biến trong mô hình
C. Số lượng giá trị trong dữ liệu có thể tự do biến đổi khi ước tính tham số
D. Mức ý nghĩa thống kê
3. Trong phân tích phương sai (ANOVA), giả thuyết không thường là gì?
A. Có sự khác biệt đáng kể giữa trung bình của tất cả các nhóm
B. Không có sự khác biệt giữa trung bình của tất cả các nhóm
C. Ít nhất một cặp trung bình nhóm khác nhau
D. Phương sai của tất cả các nhóm đều bằng nhau
4. Phương pháp thống kê nào thường được sử dụng để kiểm tra mối quan hệ giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính
B. Kiểm định t
C. Kiểm định Chi-bình phương
D. Phân tích phương sai (ANOVA)
5. Trong nghiên cứu khoa học xã hội, loại lỗi nào xảy ra khi chúng ta bác bỏ giả thuyết không đúng?
A. Lỗi Loại I
B. Lỗi Loại II
C. Sai số hệ thống
D. Sai số ngẫu nhiên
6. Ưu điểm chính của nghiên cứu theo chiều dọc (longitudinal study) so với nghiên cứu cắt ngang (cross-sectional study) là gì?
A. Chi phí thực hiện thấp hơn
B. Thời gian thu thập dữ liệu ngắn hơn
C. Khả năng nghiên cứu sự thay đổi và quá trình theo thời gian
D. Dễ dàng khái quát hóa kết quả cho tổng thể lớn hơn
7. Trong phân tích hồi quy, R bình phương (R²) thể hiện điều gì?
A. Độ mạnh của mối quan hệ tuyến tính
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Sai số chuẩn của ước lượng
D. Ý nghĩa thống kê của mô hình
8. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của tổng thể
B. Độ lệch chuẩn của mẫu
C. Độ lệch chuẩn của phân phối các trung bình mẫu
D. Trung bình của các trung bình mẫu
9. Phương pháp nào sau đây giúp đánh giá độ tin cậy (reliability) của thang đo trong nghiên cứu khoa học xã hội?
A. Phân tích hồi quy
B. Cronbach′s Alpha
C. Kiểm định t
D. Phân tích phương sai
10. Phương pháp nào sau đây là một kỹ thuật lấy mẫu phi xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản
B. Lấy mẫu phân tầng
C. Lấy mẫu cụm
D. Lấy mẫu thuận tiện
11. Trong kiểm định giả thuyết, mức ý nghĩa (alpha level) thường được đặt ở 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi Loại II là 5%
B. Xác suất mắc lỗi Loại I là 5%
C. Độ tin cậy của kết quả là 95%
D. Kích thước hiệu ứng phải lớn hơn 0.05 để có ý nghĩa
12. Trong thống kê Bayesian, 'prior probability′ (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu quan sát được
B. Xác suất của giả thuyết sau khi xem xét dữ liệu
C. Xác suất ban đầu của giả thuyết trước khi có dữ liệu
D. Xác suất của giả thuyết không
13. Phân tích trung gian (mediation analysis) được sử dụng để làm gì?
A. So sánh trung bình của nhiều nhóm
B. Xác định biến số trung gian giải thích mối quan hệ giữa biến độc lập và biến phụ thuộc
C. Dự đoán giá trị của biến phụ thuộc dựa trên nhiều biến độc lập
D. Giảm số lượng biến bằng cách nhóm chúng thành các yếu tố
14. Phương pháp nào giúp giảm thiểu ảnh hưởng của các yếu tố gây nhiễu trong nghiên cứu quan sát?
A. Thí nghiệm ngẫu nhiên có đối chứng
B. Lấy mẫu thuận tiện
C. Đối sánh (Matching) và Kiểm soát thống kê
D. Nghiên cứu cắt ngang
15. Thước đo mức độ nào cho phép xếp hạng các đối tượng và xác định khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm 0 tuyệt đối có ý nghĩa?
A. Tỷ lệ
B. Thứ bậc
C. Khoảng
D. Danh nghĩa
16. Sai số hệ thống (systematic error) khác với sai số ngẫu nhiên (random error) ở điểm nào?
A. Sai số hệ thống chỉ xảy ra trong nghiên cứu định tính
B. Sai số hệ thống có thể giảm bằng cách tăng kích thước mẫu
C. Sai số hệ thống là sai lệch nhất quán, ảnh hưởng đến kết quả theo một hướng cụ thể
D. Sai số ngẫu nhiên dễ dàng phát hiện và loại bỏ hơn sai số hệ thống
17. Trong bối cảnh thống kê suy luận, khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số tổng thể
B. Một khoảng giá trị mà tham số tổng thể có khả năng nằm trong
C. Xác suất giả thuyết không là đúng
D. Sai số chuẩn của trung bình mẫu
18. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết không là đúng
B. Xác suất quan sát được kết quả cực đoan như kết quả thu được nếu giả thuyết không là đúng
C. Mức độ quan trọng thực tế của kết quả
D. Kích thước của hiệu ứng nghiên cứu
19. Độ lệch chuẩn đo lường điều gì?
A. Giá trị trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trong tập dữ liệu
D. Giá trị nhỏ nhất trong tập dữ liệu
20. Khi nào sử dụng kiểm định tương quan Spearman thay vì Pearson?
A. Khi biến phụ thuộc là biến định tính
B. Khi muốn đo lường mối quan hệ phi tuyến tính hoặc dữ liệu thứ bậc
C. Khi kích thước mẫu lớn hơn 100
D. Khi dữ liệu tuân theo phân phối chuẩn
21. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của dữ liệu
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa các giá trị trung bình của hai nhóm
D. Khả năng xảy ra một sự kiện
22. Giá trị trung vị thể hiện điều gì trong một tập dữ liệu?
A. Giá trị trung bình cộng của tất cả các giá trị
B. Giá trị xuất hiện nhiều nhất
C. Giá trị ở giữa khi dữ liệu được sắp xếp
D. Độ lệch chuẩn của dữ liệu
23. Khi nào thì kiểm định phi tham số (non-parametric test) thích hợp hơn kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc khi đo lường ở mức độ thứ bậc hoặc danh nghĩa
D. Khi muốn ước tính tham số tổng thể
24. Khi so sánh hai nhóm độc lập về biến định lượng, kiểm định thống kê nào thường được sử dụng?
A. Kiểm định Chi-bình phương
B. Phân tích phương sai (ANOVA)
C. Kiểm định t độc lập
D. Hồi quy tuyến tính
25. Giá trị 'mode′ (mốt) của một tập dữ liệu biểu thị điều gì?
A. Giá trị trung bình cộng
B. Giá trị trung vị
C. Giá trị xuất hiện nhiều lần nhất
D. Phạm vi của dữ liệu
26. Trong nghiên cứu định lượng, 'operationalization′ (vận hành hóa) có nghĩa là gì?
A. Thu thập dữ liệu bằng phương pháp quan sát
B. Định nghĩa các khái niệm trừu tượng thành các biến có thể đo lường được
C. Phân tích dữ liệu bằng phần mềm thống kê
D. Trình bày kết quả nghiên cứu bằng biểu đồ
27. Phân tích yếu tố (factor analysis) thường được sử dụng để làm gì trong khoa học xã hội?
A. So sánh trung bình giữa các nhóm
B. Dự đoán giá trị của một biến phụ thuộc
C. Giảm số lượng biến bằng cách xác định các yếu tố tiềm ẩn
D. Kiểm tra mối quan hệ giữa hai biến định tính
28. Khi nào thì việc sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng đặc biệt hữu ích?
A. Khi muốn đảm bảo tính đại diện của các nhóm nhỏ trong tổng thể
B. Khi tổng thể nghiên cứu đồng nhất
C. Khi cần tiết kiệm chi phí và thời gian tối đa
D. Khi không có danh sách đầy đủ về tổng thể
29. Loại biểu đồ nào phù hợp nhất để thể hiện tần suất của các biến định tính?
A. Biểu đồ phân tán
B. Biểu đồ đường
C. Biểu đồ cột hoặc biểu đồ tròn
D. Biểu đồ hộp
30. Trong phân tích đường dẫn (path analysis), mục đích chính là gì?
A. So sánh trung bình giữa nhiều nhóm
B. Xác định các mối quan hệ nhân quả trực tiếp và gián tiếp giữa các biến
C. Dự đoán giá trị của biến phụ thuộc dựa trên biến độc lập
D. Giảm số lượng biến bằng cách nhóm chúng thành các yếu tố