1. Mục đích chính của việc chọn mẫu ngẫu nhiên (random sampling) là gì?
A. Giảm chi phí và thời gian thu thập dữ liệu.
B. Đảm bảo mẫu đại diện cho tổng thể và giảm thiểu thiên vị.
C. Tăng kích thước mẫu.
D. Đơn giản hóa quá trình phân tích dữ liệu.
2. Loại biểu đồ nào sau đây thường được sử dụng để thể hiện phân phối tần số của một biến số định lượng liên tục?
A. Biểu đồ cột (Bar chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ tần suất (Histogram).
D. Biểu đồ hộp (Box plot).
3. Mức đo lường nào sau đây cho phép thực hiện các phép toán cộng, trừ, nhân, chia một cách có ý nghĩa?
A. Mức danh nghĩa (Nominal).
B. Mức thứ bậc (Ordinal).
C. Mức khoảng (Interval).
D. Mức tỷ lệ (Ratio).
4. Phương pháp thống kê nào phù hợp để phân tích dữ liệu thứ cấp (secondary data)?
A. Phỏng vấn sâu.
B. Thực nghiệm.
C. Phân tích nội dung (Content analysis).
D. Quan sát tham gia.
5. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
D. Mức độ tin cậy của ước lượng.
6. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Có sự khác biệt đáng kể giữa các nhóm.
B. Không có sự khác biệt đáng kể giữa các nhóm.
C. Các nhóm có phương sai khác nhau.
D. Các nhóm có phân phối khác nhau.
7. Phương pháp thống kê nào thường được sử dụng để kiểm tra mối quan hệ giữa hai biến số định lượng?
A. Kiểm định Chi-square.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính (Linear Regression).
D. Thống kê mô tả.
8. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số định lượng.
B. Mức độ khác biệt giữa hai nhóm.
C. Xác suất xảy ra một sự kiện.
D. Độ phân tán của dữ liệu.
9. Khi báo cáo kết quả nghiên cứu định lượng, điều quan trọng là phải cung cấp thông tin gì về thống kê?
A. Chỉ cần báo cáo kết quả có ý nghĩa thống kê.
B. Cung cấp đầy đủ các thống kê mô tả, thống kê kiểm định, giá trị p, kích thước hiệu ứng và khoảng tin cậy (nếu có).
C. Chỉ cần báo cáo phương pháp thống kê đã sử dụng.
D. Chỉ cần báo cáo kết luận chính.
10. Biến số định tính (qualitative variable) khác biệt với biến số định lượng (quantitative variable) ở điểm nào?
A. Biến định tính có thể đo lường bằng số, biến định lượng thì không.
B. Biến định tính biểu thị thuộc tính hoặc phẩm chất, biến định lượng biểu thị số lượng.
C. Biến định tính luôn có giá trị lớn hơn biến định lượng.
D. Biến định tính được sử dụng trong thống kê mô tả, biến định lượng trong thống kê suy luận.
11. Thống kê mô tả trong khoa học xã hội chủ yếu tập trung vào:
A. Dự đoán xu hướng tương lai dựa trên dữ liệu quá khứ.
B. Mô tả và tóm tắt các đặc điểm chính của một tập dữ liệu.
C. Kiểm định giả thuyết về mối quan hệ giữa các biến số.
D. Suy rộng kết quả từ mẫu lên tổng thể.
12. Trong phân tích hồi quy, hệ số chặn (intercept) thể hiện điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0.
C. Mức độ mạnh mẽ của mối quan hệ.
D. Sai số ngẫu nhiên.
13. Trong nghiên cứu khoa học xã hội, 'tính giá trị' (validity) của một công cụ đo lường đề cập đến điều gì?
A. Mức độ nhất quán của kết quả đo lường qua thời gian.
B. Mức độ công cụ đo lường thực sự đo lường khái niệm mà nó được thiết kế để đo lường.
C. Mức độ dễ sử dụng của công cụ đo lường.
D. Kích thước mẫu cần thiết để sử dụng công cụ.
14. Ưu điểm chính của việc sử dụng phương pháp thống kê trong nghiên cứu khoa học xã hội là gì?
A. Luôn đảm bảo kết quả nghiên cứu là đúng tuyệt đối.
B. Cung cấp công cụ khách quan và hệ thống để phân tích dữ liệu, rút ra kết luận có căn cứ và kiểm định giả thuyết.
C. Thay thế hoàn toàn các phương pháp nghiên cứu định tính.
D. Giảm thiểu hoàn toàn sai sót trong nghiên cứu.
15. Phân tích hồi quy đa biến (multiple regression) được sử dụng khi nào?
A. Khi có một biến độc lập và một biến phụ thuộc.
B. Khi muốn so sánh trung bình của nhiều nhóm.
C. Khi muốn dự đoán biến phụ thuộc dựa trên nhiều biến độc lập.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
16. Kiểm định Chi-square thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến số định tính.
C. Đo lường mối quan hệ tuyến tính.
D. Ước lượng giá trị trung bình của tổng thể.
17. Trong thống kê suy luận, 'tổng thể' (population) và 'mẫu′ (sample) có mối quan hệ như thế nào?
A. Tổng thể là một tập con của mẫu.
B. Mẫu là một tập con của tổng thể, được chọn để nghiên cứu nhằm suy rộng kết luận cho tổng thể.
C. Tổng thể và mẫu là hai khái niệm độc lập, không liên quan.
D. Tổng thể và mẫu luôn có kích thước bằng nhau.
18. Trong kiểm định giả thuyết thống kê, 'giá trị p′ (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả đã quan sát, giả định giả thuyết null là đúng.
C. Mức độ ý nghĩa thực tế của kết quả.
D. Sai số loại I.
19. Khi nào nên sử dụng kiểm định Mann-Whitney U thay vì kiểm định t độc lập (independent t-test)?
A. Khi muốn so sánh trung bình của hai mẫu liên quan.
B. Khi dữ liệu không tuân theo phân phối chuẩn và muốn so sánh trung vị của hai nhóm độc lập.
C. Khi kích thước mẫu lớn hơn 30.
D. Khi muốn kiểm tra mối quan hệ giữa hai biến số định lượng.
20. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện.
D. Tính toán sai giá trị p.
21. Trong thống kê, 'phân phối chuẩn′ (normal distribution) có đặc điểm quan trọng nào?
A. Luôn đối xứng và có hai đỉnh.
B. Là nền tảng cho nhiều kiểm định thống kê tham số và mô tả nhiều hiện tượng tự nhiên.
C. Chỉ áp dụng cho dữ liệu định tính.
D. Luôn có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
22. Giá trị trung vị (median) thường được ưu tiên sử dụng hơn giá trị trung bình (mean) khi nào?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi kích thước mẫu lớn.
D. Khi muốn tính toán nhanh chóng.
23. Khái niệm 'ý nghĩa thống kê' (statistical significance) khác với 'ý nghĩa thực tế' (practical significance) như thế nào?
A. Ý nghĩa thống kê quan trọng hơn ý nghĩa thực tế.
B. Ý nghĩa thống kê chỉ ra rằng kết quả không thể xảy ra do ngẫu nhiên, ý nghĩa thực tế đánh giá tầm quan trọng của kết quả trong thực tế.
C. Ý nghĩa thống kê và ý nghĩa thực tế là giống nhau.
D. Ý nghĩa thực tế luôn được xác định trước ý nghĩa thống kê.
24. Khi nào thì việc sử dụng thống kê Bayesian trở nên hữu ích hơn so với thống kê tần suất truyền thống?
A. Khi kích thước mẫu rất lớn.
B. Khi có thông tin tiên验 (prior information) về tham số cần ước lượng và muốn kết hợp thông tin này vào phân tích.
C. Khi dữ liệu luôn tuân theo phân phối chuẩn.
D. Khi muốn đơn giản hóa quá trình tính toán.
25. Phương pháp nào sau đây giúp giảm thiểu sai số chọn mẫu (sampling error)?
A. Tăng cường thiên vị chọn mẫu.
B. Giảm kích thước mẫu.
C. Sử dụng phương pháp chọn mẫu ngẫu nhiên và tăng kích thước mẫu.
D. Chỉ sử dụng thống kê mô tả.
26. Khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị trung bình mẫu.
B. Một khoảng giá trị mà có khả năng chứa giá trị tham số tổng thể thực sự.
C. Sai số chuẩn.
D. Giá trị p.
27. So sánh thống kê tham số (parametric statistics) và thống kê phi tham số (non-parametric statistics), điểm khác biệt chính là gì?
A. Thống kê tham số dễ tính toán hơn.
B. Thống kê tham số yêu cầu giả định về phân phối dữ liệu (ví dụ: phân phối chuẩn), thống kê phi tham số thì không.
C. Thống kê phi tham số mạnh mẽ hơn thống kê tham số.
D. Thống kê tham số chỉ sử dụng cho dữ liệu định lượng, thống kê phi tham số cho dữ liệu định tính.
28. Khi nào thì việc sử dụng thống kê phi tham số là đặc biệt cần thiết?
A. Khi kích thước mẫu rất lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc mức đo lường thấp (ví dụ: mức thứ bậc, mức danh nghĩa).
D. Khi muốn thực hiện các phép toán phức tạp.
29. Trong bối cảnh đạo đức nghiên cứu thống kê, điều gì là quan trọng nhất khi thu thập và sử dụng dữ liệu về con người?
A. Tối đa hóa lợi ích nghiên cứu bất kể sự đồng ý của người tham gia.
B. Đảm bảo sự đồng ý tự nguyện và có hiểu biết của người tham gia, bảo vệ quyền riêng tư và bảo mật thông tin cá nhân.
C. Chỉ tập trung vào tính chính xác của dữ liệu, bỏ qua các vấn đề đạo đức.
D. Sử dụng dữ liệu cho bất kỳ mục đích nào sau khi thu thập.
30. 'Độ tin cậy′ (reliability) của một công cụ đo lường trong nghiên cứu khoa học xã hội nghĩa là gì?
A. Công cụ đo lường có đo lường đúng khái niệm cần đo hay không.
B. Công cụ đo lường cho kết quả nhất quán qua các lần đo khác nhau.
C. Công cụ đo lường dễ sử dụng và tiết kiệm chi phí.
D. Công cụ đo lường được chấp nhận rộng rãi trong cộng đồng khoa học.