1. Độ lệch chuẩn là căn bậc hai của đại lượng nào sau đây?
A. Trung bình
B. Trung vị
C. Phương sai
D. Khoảng biến thiên
2. Giá trị trung vị (median) của một mẫu số liệu là:
A. Giá trị trung bình cộng của mẫu.
B. Giá trị xuất hiện nhiều nhất trong mẫu.
C. Giá trị nằm ở vị trí chính giữa khi mẫu được sắp xếp.
D. Giá trị có tần số thấp nhất trong mẫu.
3. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) cho trung bình quần thể?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
4. Phân phối Poisson thường được sử dụng để mô hình hóa:
A. Chiều cao của con người.
B. Số lỗi đánh máy trên một trang văn bản.
C. Thời gian sống của bóng đèn.
D. Điểm số trong một bài kiểm tra.
5. Chọn phát biểu SAI về phân phối nhị thức (Binomial):
A. Mỗi phép thử có hai kết quả có thể: thành công hoặc thất bại.
B. Các phép thử là độc lập với nhau.
C. Xác suất thành công thay đổi trong mỗi phép thử.
D. Số phép thử là cố định.
6. Biểu đồ hộp (boxplot) thường được sử dụng để:
A. Hiển thị tần số của các giá trị dữ liệu.
B. So sánh trung bình của nhiều nhóm.
C. Tóm tắt phân phối của một tập dữ liệu, bao gồm trung vị, tứ phân vị và giá trị ngoại lai.
D. Hiển thị mối quan hệ giữa hai biến liên tục.
7. Nếu P(A) = 0.4 và P(B) = 0.5 và A, B độc lập, thì P(A ∩ B) bằng bao nhiêu?
A. 0.9
B. 0.2
C. 0.1
D. 0.0
8. Khoảng tin cậy 95% có nghĩa là:
A. Xác suất tham số thực tế nằm trong khoảng này là 95%.
B. 95% dữ liệu mẫu nằm trong khoảng này.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy được tạo ra sẽ chứa tham số thực tế.
D. Khoảng này chứa 95% số lượng mẫu có thể.
9. Chọn phát biểu SAI về lấy mẫu ngẫu nhiên đơn giản:
A. Mỗi đơn vị trong quần thể có cơ hội được chọn như nhau.
B. Dễ thực hiện và ít tốn kém trong mọi trường hợp.
C. Đảm bảo tính đại diện cao cho quần thể.
D. Có thể tạo ra mẫu không đại diện nếu quần thể có cấu trúc phức tạp.
10. Chọn phát biểu ĐÚNG về mối quan hệ giữa kích thước mẫu và sai số chuẩn:
A. Sai số chuẩn tăng khi kích thước mẫu tăng.
B. Sai số chuẩn giảm khi kích thước mẫu tăng.
C. Sai số chuẩn không phụ thuộc vào kích thước mẫu.
D. Sai số chuẩn tỉ lệ thuận với căn bậc hai của kích thước mẫu.
11. Hàm mật độ xác suất (probability density function - PDF) được sử dụng cho loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên rời rạc
B. Biến ngẫu nhiên liên tục
C. Cả biến rời rạc và liên tục
D. Biến định tính
12. Phép kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Kiểm tra sự bằng nhau của hai phương sai.
B. Kiểm tra sự phù hợp của một mẫu dữ liệu với một phân phối lý thuyết.
C. Kiểm tra sự độc lập giữa hai biến phân loại.
D. Kiểm tra giá trị trung bình của quần thể.
13. Trong kiểm định chi bình phương (Chi-square test) về tính độc lập, giả thuyết null thường là gì?
A. Các biến có liên quan đến nhau.
B. Các biến không có mối quan hệ tuyến tính.
C. Các biến độc lập với nhau.
D. Phương sai của các biến bằng nhau.
14. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến số?
A. Giá trị trung bình của mỗi biến.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
C. Phương sai của mỗi biến.
D. Tổng của hai biến.
15. Chọn khẳng định ĐÚNG về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối lệch phải:
A. Trung bình = Trung vị = Mốt
B. Trung bình < Trung vị < Mốt
C. Mốt < Trung vị < Trung bình
D. Trung vị < Mốt < Trung bình
16. Trong thống kê mô tả, đại lượng nào sau đây không phải là thước đo xu hướng trung tâm?
A. Trung bình
B. Trung vị
C. Mốt
D. Độ lệch chuẩn
17. Phương sai đo lường điều gì về một tập dữ liệu?
A. Giá trị trung tâm của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Giá trị lớn nhất và nhỏ nhất của dữ liệu.
18. Trong hồi quy tuyến tính đơn giản, đường hồi quy được sử dụng để:
A. Đo lường độ phân tán của dữ liệu.
B. Ước lượng giá trị trung bình của biến phụ thuộc dựa trên giá trị của biến độc lập.
C. Tính phương sai của biến độc lập.
D. Xác định mối quan hệ phi tuyến giữa hai biến.
19. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối các trung bình mẫu.
D. Sai số ngẫu nhiên trong dữ liệu mẫu.
20. Trong kiểm định giả thuyết thống kê, lỗi loại I xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.
21. Một kỹ thuật lấy mẫu trong đó quần thể được chia thành các nhóm nhỏ (nhóm) và sau đó chọn ngẫu nhiên một số nhóm để khảo sát được gọi là gì?
A. Lấy mẫu ngẫu nhiên đơn giản
B. Lấy mẫu phân tầng
C. Lấy mẫu cụm (cluster)
D. Lấy mẫu hệ thống
22. Biến cố A và B được gọi là độc lập nếu:
A. P(A ∩ B) = P(A) + P(B)
B. P(A ∪ B) = P(A) + P(B)
C. P(A ∩ B) = P(A) * P(B)
D. P(A ∪ B) = P(A) * P(B)
23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra sự khác biệt giữa phương sai của hai quần thể.
B. Kiểm tra sự khác biệt giữa trung bình của hai quần thể.
C. Kiểm tra sự khác biệt giữa trung bình của ba hoặc nhiều hơn quần thể.
D. Đo lường độ tương quan giữa các biến.
24. Khái niệm nào sau đây mô tả tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên?
A. Biến cố
B. Không gian mẫu
C. Xác suất
D. Mẫu số liệu
25. Phân phối chuẩn (phân phối Gaussian) có dạng hình gì?
A. Hình chữ nhật
B. Hình tam giác
C. Hình chuông
D. Đường thẳng
26. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Mức ý nghĩa của kiểm định.
C. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất mắc lỗi loại I.
27. Giá trị tới hạn (critical value) trong kiểm định giả thuyết được sử dụng để:
A. Tính giá trị P.
B. Xác định mức ý nghĩa.
C. Xác định vùng bác bỏ giả thuyết null.
D. Ước lượng tham số quần thể.
28. Giá trị trung bình của một mẫu số liệu được tính bằng cách nào?
A. Lấy giá trị lớn nhất trừ giá trị nhỏ nhất chia đôi.
B. Lấy tổng tất cả các giá trị chia cho số lượng giá trị.
C. Chọn giá trị xuất hiện nhiều nhất trong mẫu.
D. Chọn giá trị ở giữa khi sắp xếp mẫu theo thứ tự.
29. Một hộp chứa 5 bi đỏ và 3 bi xanh. Nếu lấy ngẫu nhiên 1 bi, xác suất lấy được bi đỏ là bao nhiêu?
A. 3/8
B. 5/8
C. 3/5
D. 5/3
30. Trong phân tích hồi quy đa biến, hệ số phóng đại phương sai (Variance Inflation Factor - VIF) được sử dụng để phát hiện điều gì?
A. Giá trị ngoại lai trong dữ liệu.
B. Phương sai không đồng nhất.
C. Đa cộng tuyến (multicollinearity) giữa các biến độc lập.
D. Tính tuyến tính của mối quan hệ.