1. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng, khi kích thước mẫu đủ lớn, phân phối của trung bình mẫu sẽ tiến gần đến phân phối nào?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối chuẩn.
D. Phân phối đều.
2. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất giả thuyết đối là đúng.
C. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn nếu giả thuyết null là đúng.
D. Xác suất quan sát được kết quả mẫu hoặc kết quả ít cực đoan hơn nếu giả thuyết null là đúng.
3. Công suất kiểm định (power of a test) là xác suất:
A. Mắc sai số loại I.
B. Mắc sai số loại II.
C. Bác bỏ đúng giả thuyết null khi nó sai.
D. Chấp nhận đúng giả thuyết null khi nó đúng.
4. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để kiểm định:
A. Trung bình của một tổng thể.
B. Phương sai của một tổng thể.
C. Sự độc lập giữa hai biến định tính.
D. Mối quan hệ tuyến tính giữa hai biến định lượng.
5. Chọn mẫu cụm (cluster sampling) thường được sử dụng khi:
A. Muốn đảm bảo tính đại diện từ mọi tầng lớp xã hội.
B. Tổng thể phân tán rộng về mặt địa lý và việc chọn mẫu ngẫu nhiên đơn giản tốn kém.
C. Tổng thể có kích thước nhỏ.
D. Muốn so sánh giữa các nhóm khác nhau trong tổng thể.
6. Trong phân tích thống kê, 'độ tin cậy' (reliability) đề cập đến:
A. Mức độ đo lường đúng khái niệm cần đo.
B. Tính nhất quán và ổn định của phép đo.
C. Khả năng khái quát hóa kết quả nghiên cứu.
D. Tính khách quan của nghiên cứu.
7. Độ lệch chuẩn (standard deviation) là căn bậc hai của:
A. Trung bình.
B. Phương sai.
C. Mốt.
D. Trung vị.
8. Khoảng tứ phân vị (Interquartile Range - IQR) đo lường điều gì?
A. Toàn bộ phạm vi biến thiên của dữ liệu.
B. Phạm vi biến thiên của 50% dữ liệu ở giữa.
C. Phạm vi biến thiên của 25% dữ liệu nhỏ nhất.
D. Phạm vi biến thiên của 25% dữ liệu lớn nhất.
9. Phân phối chuẩn (normal distribution) còn được gọi là phân phối:
A. Phân phối Poisson.
B. Phân phối Gauss.
C. Phân phối nhị thức.
D. Phân phối mũ.
10. Phương pháp chọn mẫu nào đảm bảo mọi phần tử của tổng thể đều có cơ hội được chọn vào mẫu và cơ hội này là như nhau?
A. Chọn mẫu thuận tiện (convenience sampling).
B. Chọn mẫu phân tầng (stratified sampling).
C. Chọn mẫu ngẫu nhiên đơn giản (simple random sampling).
D. Chọn mẫu cụm (cluster sampling).
11. Mốt (mode) của một tập dữ liệu là giá trị:
A. Trung bình cộng của tất cả các giá trị.
B. Giá trị nằm ở vị trí chính giữa khi dữ liệu được sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất trong tập dữ liệu.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
12. Khoảng tin cậy (confidence interval) cho trung bình tổng thể được xây dựng nhằm:
A. Ước lượng giá trị trung bình mẫu.
B. Ước lượng khoảng giá trị có khả năng chứa trung bình tổng thể.
C. Kiểm định giả thuyết về trung bình tổng thể.
D. Đo lường độ lệch chuẩn của tổng thể.
13. Đại lượng nào sau đây là một tham số (parameter)?
A. Trung bình mẫu (sample mean).
B. Phương sai mẫu (sample variance).
C. Độ lệch chuẩn mẫu (sample standard deviation).
D. Trung bình tổng thể (population mean).
14. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến định lượng?
A. Mức độ biến thiên của mỗi biến.
B. Mức độ phụ thuộc lẫn nhau về mặt nhân quả giữa hai biến.
C. Mức độ mạnh và chiều hướng của mối quan hệ tuyến tính giữa hai biến.
D. Mức độ khác biệt về trung bình giữa hai biến.
15. Trong các loại tỷ lệ đo lường, tỷ lệ nào có tính 'không tuyệt đối' (arbitrary zero)?
A. Tỷ lệ danh nghĩa (nominal).
B. Tỷ lệ thứ bậc (ordinal).
C. Tỷ lệ khoảng (interval).
D. Tỷ lệ tỷ số (ratio).
16. Hiện tượng đa cộng tuyến (multicollinearity) trong hồi quy bội xảy ra khi:
A. Biến phụ thuộc có phân phối không chuẩn.
B. Các biến độc lập có tương quan cao với nhau.
C. Mô hình hồi quy không phù hợp với dữ liệu.
D. Số lượng biến độc lập quá ít.
17. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.
18. Khi nào thì nên sử dụng trung vị thay vì trung bình cộng để đo lường xu hướng trung tâm?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lai (outliers).
C. Khi dữ liệu có tính đối xứng.
D. Khi dữ liệu có dạng rời rạc.
19. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Bác bỏ giả thuyết đối khi nó đúng.
D. Chấp nhận giả thuyết đối khi nó sai.
20. Giá trị R-bình phương (R-squared) trong hồi quy tuyến tính đo lường:
A. Độ mạnh của mối quan hệ nhân quả.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
C. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
D. Độ chính xác của dự đoán.
21. Tính 'hiệu lực' (validity) trong phân tích thống kê đề cập đến:
A. Tính nhất quán của phép đo.
B. Mức độ đo lường đúng khái niệm cần đo.
C. Khả năng áp dụng kết quả nghiên cứu cho các bối cảnh khác.
D. Tính dễ hiểu của kết quả nghiên cứu.
22. Chọn mẫu phân tầng (stratified sampling) thường được sử dụng khi:
A. Tổng thể đồng nhất.
B. Tổng thể có các nhóm (strata) khác biệt nhau.
C. Việc tiếp cận toàn bộ tổng thể là dễ dàng.
D. Không có thông tin về cấu trúc tổng thể.
23. Thống kê mô tả chủ yếu tập trung vào việc:
A. Dự đoán giá trị tương lai dựa trên dữ liệu quá khứ.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định giả thuyết về tổng thể dựa trên mẫu.
D. Xây dựng mô hình toán học để giải thích dữ liệu.
24. Phương sai (variance) là thước đo:
A. Giá trị trung tâm của dữ liệu.
B. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mức độ lệch của phân phối so với phân phối chuẩn.
25. Biến định tính (qualitative variable) được chia thành mấy loại chính?
A. Một loại.
B. Hai loại.
C. Ba loại.
D. Bốn loại.
26. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị điều gì?
A. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
27. Trung vị (median) là thước đo vị trí trung tâm nào?
A. Trung bình cộng.
B. Giá trị chính giữa.
C. Giá trị phổ biến nhất.
D. Giá trị trung bình nhân.
28. Phương pháp thống kê nào thường được sử dụng để so sánh trung bình của hai nhóm độc lập?
A. Phân tích phương sai (ANOVA).
B. Kiểm định t (t-test).
C. Hồi quy tuyến tính (linear regression).
D. Kiểm định Chi-bình phương (Chi-square test).
29. Trong phân tích phương sai (ANOVA), giả thuyết null thường là:
A. Có ít nhất một trung bình nhóm khác biệt.
B. Tất cả các trung bình nhóm đều bằng nhau.
C. Phương sai giữa các nhóm khác nhau.
D. Phương sai trong mỗi nhóm khác nhau.
30. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) và thường được đặt ở giá trị nào?
A. 0.1.
B. 0.05.
C. 0.5.
D. 1.0.