1. Phân phối chuẩn tắc (standard normal distribution) có trung bình và độ lệch chuẩn lần lượt là:
A. Trung bình = 1, Độ lệch chuẩn = 1
B. Trung bình = 0, Độ lệch chuẩn = 1
C. Trung bình = 0, Độ lệch chuẩn = 0
D. Trung bình = 1, Độ lệch chuẩn = 0
2. Giá trị trung vị (Median) của mẫu số liệu sau: 5, 10, 8, 12, 6 là bao nhiêu?
3. Trong một hộp có 5 viên bi đỏ và 3 viên bi xanh. Nếu bạn lấy ngẫu nhiên 2 viên bi mà không hoàn lại, xác suất để cả hai viên bi đều màu đỏ là bao nhiêu?
A. 5/14
B. 10/56
C. 10/28
D. 25/64
4. Giá trị P (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả kiểm định hoặc kết quả cực đoan hơn nếu giả thuyết null là đúng.
C. Xác suất giả thuyết đối thuyết là đúng.
D. Ngưỡng ý nghĩa của kiểm định.
5. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy (confidence interval)?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm đi.
C. Độ rộng khoảng tin cậy không đổi.
D. Không có mối quan hệ rõ ràng.
6. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện trong một khoảng thời gian hoặc không gian cố định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
7. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập.
C. Mối quan hệ phi tuyến tính giữa biến phụ thuộc và biến độc lập.
D. Sự biến thiên lớn trong biến phụ thuộc.
8. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối trung bình mẫu.
D. Sai số ngẫu nhiên trong dữ liệu mẫu.
9. Khoảng tin cậy 95% cho trung bình quần thể có nghĩa là gì?
A. 95% mẫu từ quần thể sẽ có trung bình nằm trong khoảng này.
B. Có 95% khả năng trung bình quần thể nằm trong khoảng này.
C. Khoảng này chứa 95% dữ liệu của mẫu.
D. Khoảng này chứa trung bình mẫu với xác suất 95%.
10. Nếu hai sự kiện A và B là độc lập, thì P(A và B) bằng:
A. P(A) + P(B)
B. P(A) * P(B)
C. P(A) / P(B)
D. P(A) - P(B)
11. Để so sánh tỷ lệ thành công giữa hai nhóm độc lập, kiểm định thống kê nào sau đây là phù hợp nhất?
A. Kiểm định t cặp (Paired t-test)
B. Kiểm định t độc lập (Independent t-test)
C. Kiểm định Z cho hai tỷ lệ (Two-proportion z-test)
D. Phân tích phương sai (ANOVA)
12. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ chính xác của các hệ số hồi quy.
D. Sai số chuẩn của ước lượng.
13. Loại biểu đồ nào thích hợp nhất để biểu diễn phân phối tần số của dữ liệu định lượng liên tục?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ hộp (Box plot)
D. Biểu đồ tần suất (Histogram)
14. Giá trị ngoại lệ (outlier) trong dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong dữ liệu.
B. Giá trị trung bình của dữ liệu.
C. Giá trị cực đoan, khác biệt đáng kể so với các giá trị khác.
D. Giá trị nằm ở giữa của dữ liệu sau khi sắp xếp.
15. Trong thống kê Bayes, 'tiền nghiệm' (prior) đề cập đến điều gì?
A. Dữ liệu quan sát được.
B. Xác suất ban đầu về tham số trước khi có dữ liệu.
C. Xác suất sau khi đã cập nhật thông tin từ dữ liệu.
D. Giả thuyết null trong kiểm định.
16. Khi thực hiện kiểm định giả thuyết, ngưỡng ý nghĩa (alpha - α) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi loại II là 5%.
B. Xác suất chấp nhận giả thuyết null khi nó sai là 5%.
C. Xác suất mắc lỗi loại I là 5%.
D. Độ tin cậy của kiểm định là 95%.
17. Trong kiểm định giả thuyết thống kê, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó sai.
B. Chấp nhận giả thuyết null khi nó đúng.
C. Bác bỏ giả thuyết null khi nó đúng.
D. Chấp nhận giả thuyết null khi nó sai.
18. Điều kiện nào sau đây KHÔNG phải là điều kiện cần thiết để áp dụng Định lý giới hạn trung tâm (Central Limit Theorem)?
A. Mẫu phải được chọn ngẫu nhiên.
B. Kích thước mẫu phải đủ lớn (thường n ≥ 30).
C. Quần thể gốc phải có phân phối chuẩn.
D. Các quan sát phải độc lập với nhau.
19. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Loại bỏ giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn.
C. Đảm bảo dữ liệu có phân phối chuẩn.
D. Tăng độ chính xác của dữ liệu.
20. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba hoặc nhiều hơn nhóm.
D. Ước lượng khoảng tin cậy cho trung bình quần thể.
21. Biến ngẫu nhiên rời rạc X có phân phối Bernoulli với tham số p. Phương sai của X là:
A. p
B. 1-p
C. p(1-p)
D. p^2
22. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) cho trung bình quần thể?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn quần thể đã biết.
C. Khi độ lệch chuẩn quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu có phân phối chuẩn.
23. Hệ số tương quan tuyến tính Pearson đo lường điều gì?
A. Độ mạnh của mối quan hệ phi tuyến tính giữa hai biến.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
C. Mức độ biến thiên của một biến.
D. Giá trị trung bình của hai biến.
24. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở:
A. Cả hai phía của phân phối lấy mẫu.
B. Một phía của phân phối lấy mẫu.
C. Chính giữa phân phối lấy mẫu.
D. Không có vùng bác bỏ trong kiểm định một đuôi.
25. Phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) nhằm mục đích gì?
A. Đảm bảo mỗi phần tử trong quần thể đều có cơ hội được chọn như nhau.
B. Chia quần thể thành các nhóm đồng nhất (strata) và lấy mẫu ngẫu nhiên từ mỗi nhóm.
C. Chọn mẫu một cách hệ thống theo một quy tắc nhất định.
D. Chọn mẫu dựa trên sự thuận tiện của người nghiên cứu.
26. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Mức độ biến thiên của biến độc lập.
C. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
D. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
27. Biến ngẫu nhiên liên tục khác biến ngẫu nhiên rời rạc ở điểm nào?
A. Biến liên tục chỉ nhận giá trị nguyên, biến rời rạc nhận giá trị bất kỳ.
B. Biến liên tục nhận giá trị trong một khoảng, biến rời rạc nhận giá trị đếm được.
C. Biến liên tục có phân phối chuẩn, biến rời rạc không có.
D. Biến liên tục luôn có giá trị dương, biến rời rạc có thể âm.
28. Phương pháp nào sau đây được sử dụng để ước lượng tham số quần thể dựa trên dữ liệu mẫu?
A. Thống kê mô tả
B. Thống kê suy diễn
C. Phân tích phương sai
D. Phân tích hồi quy
29. Trong kiểm định chi bình phương (Chi-squared test) tính độc lập, giả thuyết null (H0) thường là gì?
A. Có mối quan hệ giữa các biến phân loại.
B. Không có mối quan hệ giữa các biến phân loại.
C. Các biến phân loại có phân phối chuẩn.
D. Phương sai của các biến phân loại bằng nhau.
30. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Vị trí trung tâm của dữ liệu.
D. Giá trị lớn nhất và nhỏ nhất của dữ liệu.