1. Sự khác biệt chính giữa quần thể (population) và mẫu (sample) trong thống kê là gì?
A. Quần thể luôn lớn hơn mẫu.
B. Mẫu là tập hợp con của quần thể.
C. Quần thể chỉ được sử dụng trong thống kê mô tả, mẫu trong thống kê suy diễn.
D. Không có sự khác biệt đáng kể.
2. Ví dụ nào sau đây là biến số đo bằng thang đo thứ bậc (ordinal scale) trong khoa học xã hội?
A. Thu nhập hàng năm (VNĐ).
B. Nhiệt độ (°C).
C. Mức độ hài lòng (Rất hài lòng, Hài lòng, Bình thường, Không hài lòng).
D. Màu sắc yêu thích (Đỏ, Xanh, Vàng).
3. Sai lầm Loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không đưa ra quyết định về giả thuyết null.
D. Chọn mẫu không đại diện.
4. Khi báo cáo kết quả nghiên cứu định lượng, điều quan trọng là phải trình bày 'kích thước hiệu ứng′ (effect size) vì sao?
A. Để chứng minh kết quả có ý nghĩa thống kê.
B. Để đánh giá tầm quan trọng thực tế hoặc độ lớn của hiệu quả quan sát được, không chỉ ý nghĩa thống kê.
C. Để so sánh kết quả với các nghiên cứu định tính.
D. Để đảm bảo tính bảo mật của dữ liệu.
5. Trong kiểm định giả thuyết, giả thuyết null thường đại diện cho điều gì?
A. Mối quan hệ mà nhà nghiên cứu mong đợi tìm thấy.
B. Không có mối quan hệ hoặc không có sự khác biệt.
C. Kết quả nghiên cứu lý tưởng.
D. Giả thuyết phức tạp nhất.
6. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ giữa hai biến.
7. Khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị ước tính chứa tham số quần thể với một độ tin cậy nhất định.
C. Mức độ ý nghĩa thống kê của kết quả.
D. Kích thước mẫu cần thiết cho nghiên cứu.
8. Đâu là một lo ngại về đạo đức tiềm ẩn khi sử dụng dữ liệu thống kê trong nghiên cứu khoa học xã hội?
A. Sử dụng phần mềm thống kê phức tạp.
B. Giải thích sai lệch kết quả để hỗ trợ quan điểm cá nhân.
C. Thu thập dữ liệu quá nhiều.
D. Trình bày dữ liệu dưới dạng bảng.
9. Giá trị 'mốt′ (mode) của một tập dữ liệu là gì?
A. Giá trị trung bình cộng.
B. Giá trị ở giữa khi dữ liệu được sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
10. Trong kiểm định giả thuyết, 'mức ý nghĩa′ (alpha level) thường được đặt ở 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi Loại II là 5%.
B. Xác suất chấp nhận giả thuyết null là 95%.
C. Ngưỡng xác suất tối đa để bác bỏ giả thuyết null khi nó đúng (xác suất mắc lỗi Loại I) là 5%.
D. Độ tin cậy của kết quả nghiên cứu là 95%.
11. Ưu điểm chính của việc sử dụng kích thước mẫu lớn trong nghiên cứu khoa học xã hội là gì?
A. Giảm chi phí nghiên cứu.
B. Tăng tính đại diện của mẫu và độ chính xác của ước tính.
C. Làm cho dữ liệu dễ phân tích hơn.
D. Đảm bảo kết quả luôn có ý nghĩa thống kê.
12. Tầm quan trọng của việc lấy mẫu ngẫu nhiên trong nghiên cứu khoa học xã hội là gì?
A. Đảm bảo mẫu có kích thước lớn nhất có thể.
B. Tăng tính đại diện của mẫu cho quần thể.
C. Giảm chi phí nghiên cứu.
D. Làm cho dữ liệu dễ phân tích hơn.
13. Trong thống kê, 'trung vị' (median) là gì?
A. Giá trị trung bình cộng của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
14. Sai lầm Loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Tính toán giá trị p sai.
D. Sử dụng kiểm định thống kê không phù hợp.
15. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
B. Sự khác biệt giữa trung bình của hai nhóm.
C. Mức độ phù hợp của mô hình hồi quy.
D. Tỷ lệ biến thiên được giải thích bởi mô hình.
16. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo thứ bậc∕định danh.
D. Khi muốn tính trung bình cộng.
17. Đại lượng đo lường xu hướng trung tâm nào dễ bị ảnh hưởng nhất bởi các giá trị ngoại lệ?
A. Trung vị (Median).
B. Trung bình (Mean).
C. Mốt (Mode).
D. Khoảng tứ phân vị (Interquartile range).
18. Mục đích của thống kê suy diễn là gì?
A. Mô tả đặc điểm của mẫu.
B. Tổng quát hóa kết quả từ mẫu lên quần thể.
C. Thu thập dữ liệu.
D. Trình bày dữ liệu bằng đồ thị.
19. Loại tương quan nào chỉ ra rằng khi một biến tăng, biến kia giảm?
A. Tương quan dương.
B. Tương quan âm.
C. Không tương quan.
D. Tương quan phi tuyến tính.
20. Thang đo nào cho phép xếp hạng và sắp xếp thứ tự các danh mục nhưng không có khoảng cách bằng nhau giữa chúng?
A. Tỷ lệ (Ratio).
B. Khoảng (Interval).
C. Thứ bậc (Ordinal).
D. Định danh (Nominal).
21. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để phân tích loại dữ liệu nào?
A. Dữ liệu định lượng liên tục.
B. Dữ liệu định tính (danh mục).
C. Dữ liệu thứ bậc.
D. Dữ liệu tỷ lệ.
22. Phân tích hồi quy chủ yếu được sử dụng trong khoa học xã hội để làm gì?
A. Mô tả dữ liệu.
B. Kiểm định sự khác biệt giữa các nhóm.
C. Dự đoán giá trị của một biến dựa trên biến khác.
D. Xác định tần suất xuất hiện của các sự kiện.
23. Thang đo định danh (nominal scale) được sử dụng để đo lường loại dữ liệu nào?
A. Thứ hạng.
B. Khoảng cách bằng nhau.
C. Danh mục hoặc tên gọi.
D. Tỷ lệ có ý nghĩa.
24. Phân tích phương sai (ANOVA) chủ yếu được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến.
B. So sánh trung bình của ba nhóm trở lên.
C. Dự đoán giá trị của một biến dựa trên biến khác.
D. Mô tả dữ liệu.
25. Phương sai (variance) là gì?
A. Căn bậc hai của độ lệch chuẩn.
B. Trung bình cộng của các độ lệch tuyệt đối.
C. Trung bình cộng của bình phương độ lệch so với giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
26. Trong phân tích hồi quy tuyến tính, hệ số R-squared (R²) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Ý nghĩa thống kê của các hệ số hồi quy.
D. Độ chính xác của dự đoán.
27. Trong bối cảnh đạo đức nghiên cứu, việc 'ẩn danh′ (anonymity) khác với 'bảo mật′ (confidentiality) như thế nào?
A. Ẩn danh bảo vệ danh tính nhà nghiên cứu, bảo mật bảo vệ danh tính người tham gia.
B. Ẩn danh đảm bảo không ai, kể cả nhà nghiên cứu, biết danh tính người tham gia; bảo mật đảm bảo nhà nghiên cứu biết danh tính nhưng không tiết lộ công khai.
C. Ẩn danh liên quan đến dữ liệu định lượng, bảo mật liên quan đến dữ liệu định tính.
D. Không có sự khác biệt đáng kể.
28. Mục tiêu chính của thống kê mô tả trong nghiên cứu khoa học xã hội là gì?
A. Dự đoán các xu hướng trong tương lai.
B. Mô tả và tóm tắt dữ liệu.
C. Kiểm định giả thuyết về mối quan hệ nhân quả.
D. Tổng quát hóa kết quả cho quần thể lớn hơn.
29. Giá trị p nhỏ hơn 0.05 thường chỉ ra điều gì trong kiểm định giả thuyết?
A. Giả thuyết null nên được chấp nhận.
B. Kết quả không có ý nghĩa thống kê.
C. Có đủ bằng chứng để bác bỏ giả thuyết null.
D. Cần tăng kích thước mẫu.
30. Loại biểu đồ nào phù hợp nhất để thể hiện phân phối tần số của một biến định lượng liên tục?
A. Biểu đồ cột (Bar chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ tần suất (Histogram).
D. Biểu đồ đường (Line chart).