1. Phương pháp bootstrap trong thống kê được sử dụng để làm gì?
A. Kiểm định giả thuyết về trung bình quần thể.
B. Ước lượng khoảng tin cậy và sai số chuẩn bằng cách lấy mẫu lại từ dữ liệu mẫu ban đầu.
C. Phân tích phương sai giữa các nhóm.
D. Xây dựng mô hình hồi quy tuyến tính.
2. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết null khi nó thực sự đúng.
D. Chấp nhận giả thuyết null khi nó thực sự sai.
3. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ biến động của trung bình mẫu từ mẫu này sang mẫu khác.
D. Phương sai của quần thể.
4. Trong phân tích ANOVA (phân tích phương sai), mục đích chính là gì?
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Ước lượng khoảng tin cậy cho trung bình quần thể.
5. Phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) được sử dụng khi nào?
A. Khi tổng thể đồng nhất và dễ tiếp cận.
B. Khi tổng thể có thể chia thành các nhóm đồng nhất (strata) và muốn đảm bảo đại diện từ mỗi nhóm.
C. Khi muốn lấy mẫu một cách nhanh chóng và tiết kiệm chi phí.
D. Khi không có danh sách đầy đủ về tổng thể.
6. Phân tích phương sai lặp lại (repeated measures ANOVA) được sử dụng khi nào?
A. So sánh trung bình của các nhóm độc lập.
B. So sánh trung bình của cùng một nhóm đối tượng được đo lường ở nhiều thời điểm hoặc điều kiện khác nhau.
C. Phân tích mối quan hệ giữa hai biến định lượng.
D. Kiểm tra sự độc lập giữa các biến định tính.
7. Khi nào thì nên sử dụng biểu đồ hộp (boxplot)?
A. Để hiển thị tần số của các biến định tính.
B. Để so sánh trung bình giữa các nhóm.
C. Để hiển thị phân phối và các giá trị ngoại lệ của dữ liệu định lượng.
D. Để thể hiện mối quan hệ giữa hai biến định lượng.
8. Độ lệch chuẩn (standard deviation) là căn bậc hai của đại lượng nào?
A. Trung bình
B. Trung vị
C. Phương sai
D. Khoảng biến thiên
9. Giá trị ngoại lệ (outlier) trong dữ liệu là gì?
A. Giá trị dữ liệu phổ biến nhất.
B. Giá trị dữ liệu nằm gần giá trị trung bình.
C. Giá trị dữ liệu khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị dữ liệu được thu thập từ nguồn không đáng tin cậy.
10. Thống kê mô tả tập trung chủ yếu vào việc nào sau đây?
A. Đưa ra dự đoán về tổng thể dựa trên mẫu.
B. Trình bày và tóm tắt dữ liệu.
C. Kiểm định các giả thuyết về quần thể.
D. Xây dựng mô hình hồi quy.
11. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị điều gì?
A. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ biến thiên của biến phụ thuộc.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
D. Độ mạnh của mối quan hệ tuyến tính.
12. Giá trị trung vị (median) là gì?
A. Giá trị trung bình cộng của tất cả các giá trị.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu đã được sắp xếp.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
13. Biến định tính (categorical variable) còn được gọi là biến gì?
A. Biến số
B. Biến liên tục
C. Biến định lượng
D. Biến phân loại
14. Trong phân tích thống kê, 'độ tin cậy' (reliability) đề cập đến điều gì?
A. Mức độ mà một phép đo đo lường chính xác khái niệm mà nó được cho là đo lường.
B. Mức độ nhất quán và ổn định của một phép đo qua các lần đo khác nhau.
C. Khả năng khái quát hóa kết quả nghiên cứu lên tổng thể.
D. Độ chính xác của các phép tính thống kê.
15. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Ngưỡng ý nghĩa thống kê được chọn trước.
C. Xác suất quan sát được kết quả cực đoan như kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
D. Mức độ tin cậy của kết quả kiểm định.
16. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của hai biến.
B. Mối quan hệ nhân quả giữa hai biến.
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Sự khác biệt trung bình giữa hai biến.
17. Trong thống kê, 'độ mạnh kiểm định' (statistical power) đề cập đến điều gì?
A. Xác suất mắc sai số loại I.
B. Xác suất mắc sai số loại II.
C. Xác suất bác bỏ đúng giả thuyết null khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết null khi nó thực sự đúng.
18. Phân phối chuẩn (normal distribution) có đặc điểm quan trọng nào sau đây?
A. Dữ liệu luôn đối xứng hoàn hảo.
B. Trung bình, trung vị và mốt luôn khác nhau.
C. Hình dạng 'chuông' đối xứng, trung bình, trung vị và mốt bằng nhau.
D. Luôn có độ lệch phải.
19. Phương pháp lấy mẫu nào mà mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (convenience sampling)
B. Lấy mẫu phán đoán (judgment sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling)
D. Lấy mẫu theo cụm (cluster sampling)
20. Loại thang đo nào cho phép xác định thứ hạng và khoảng cách có ý nghĩa giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Định danh
B. Thứ bậc
C. Khoảng
D. Tỷ lệ
21. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric tests) thay vì kiểm định tham số (parametric tests)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ: dữ liệu không phân phối chuẩn, mẫu nhỏ).
D. Khi muốn tăng độ mạnh của kiểm định.
22. Trong thống kê Bayes, 'prior probability' (xác suất tiên nghiệm) là gì?
A. Xác suất được tính toán từ dữ liệu mẫu.
B. Xác suất ban đầu về một sự kiện trước khi xem xét dữ liệu mới.
C. Xác suất sau khi đã cập nhật thông tin từ dữ liệu.
D. Xác suất của giả thuyết null.
23. Tính chệch (bias) trong thống kê là gì?
A. Sự khác biệt ngẫu nhiên giữa mẫu và quần thể.
B. Sai sót hệ thống trong quá trình thu thập hoặc phân tích dữ liệu dẫn đến kết quả không đại diện cho quần thể.
C. Độ phân tán của dữ liệu.
D. Mức độ tin cậy của ước lượng.
24. Hồi quy đa biến (multiple regression) khác với hồi quy tuyến tính đơn giản ở điểm nào?
A. Hồi quy đa biến chỉ sử dụng biến định tính.
B. Hồi quy đa biến có nhiều hơn một biến độc lập để dự đoán biến phụ thuộc.
C. Hồi quy đa biến không có hệ số chặn (intercept).
D. Hồi quy đa biến chỉ sử dụng dữ liệu phi tuyến tính.
25. Trong kiểm định giả thuyết, mức ý nghĩa (alpha, α) thường được chọn là bao nhiêu?
A. 0.1
B. 0.5
C. 0.05
D. 0.95
26. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh hoặc phân tích dễ dàng hơn.
C. Thay thế giá trị thiếu bằng giá trị trung bình.
D. Biến đổi dữ liệu thành phân phối chuẩn.
27. Biến định lượng (quantitative variable) có đặc điểm nào sau đây?
A. Giá trị có thể được sắp xếp theo thứ tự, nhưng khoảng cách không có ý nghĩa.
B. Giá trị là các danh mục hoặc nhóm.
C. Giá trị biểu thị số lượng hoặc độ lớn và có thể thực hiện các phép toán số học.
D. Giá trị chỉ đơn thuần phân biệt các nhóm khác nhau.
28. Phương sai (variance) là thước đo của cái gì?
A. Giá trị trung tâm của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Độ phân tán của dữ liệu so với giá trị trung bình.
D. Hình dạng phân phối của dữ liệu.
29. Phân phối Poisson thường được sử dụng để mô hình hóa loại dữ liệu nào?
A. Chiều cao của người trưởng thành.
B. Điểm kiểm tra.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định (ví dụ: số cuộc gọi điện thoại mỗi giờ).
D. Thu nhập hàng năm.
30. Khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số quần thể.
B. Ước lượng khoảng cho tham số quần thể cùng với mức độ tin cậy.
C. Xác suất tham số quần thể nằm trong khoảng tin cậy.
D. Độ lệch chuẩn của mẫu.