1. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các phương sai quần thể đều bằng nhau.
D. Tất cả các trung bình quần thể đều bằng nhau.
2. Trung vị của một tập dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị ở giữa tập dữ liệu khi được sắp xếp theo thứ tự.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
3. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Tăng phương sai của dữ liệu.
B. Giảm kích thước mẫu.
C. Đưa dữ liệu về cùng một thang đo để so sánh hoặc phân tích dễ dàng hơn.
D. Loại bỏ các giá trị ngoại lệ.
4. Khi nào thì nên sử dụng kiểm định khi bình phương (chi-square test)?
A. Để so sánh trung bình của hai quần thể.
B. Để kiểm tra sự phù hợp của phân phối lý thuyết với dữ liệu quan sát được hoặc kiểm tra tính độc lập giữa các biến định tính.
C. Để ước lượng trung bình quần thể.
D. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
5. Phân phối chuẩn có đặc điểm gì quan trọng?
A. Luôn luôn lệch phải.
B. Đối xứng và có hình chuông.
C. Có hai đỉnh.
D. Luôn luôn có trung bình bằng 0 và độ lệch chuẩn bằng 1.
6. Phương pháp lấy mẫu ngẫu nhiên đơn giản đảm bảo điều gì?
A. Mỗi phần tử trong quần thể có cơ hội được chọn khác nhau.
B. Mẫu thu được chắc chắn đại diện cho quần thể.
C. Mỗi phần tử trong quần thể có cơ hội được chọn như nhau.
D. Chỉ các phần tử dễ tiếp cận mới được chọn.
7. Giá trị ngoại lệ (outlier) là gì trong thống kê?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị cực kỳ khác biệt so với phần lớn các giá trị khác trong tập dữ liệu.
D. Giá trị nằm ở vị trí trung tâm của tập dữ liệu.
8. Trong phân phối nhị thức, điều gì là cố định?
A. Xác suất thành công.
B. Số lần thử nghiệm.
C. Số lần thành công.
D. Giá trị trung bình.
9. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Phương sai của mẫu.
10. Nếu P(A) = 0.4 và P(B) = 0.5, và A và B là hai biến cố độc lập, thì P(A và B) bằng bao nhiêu?
A. 0.9
B. 0.2
C. 0.1
D. 0.0
11. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên, giữ nguyên mức độ tin cậy?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm xuống.
C. Độ rộng khoảng tin cậy không đổi.
D. Không thể xác định.
12. Đại lượng nào đo mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mode
C. Phương sai
D. Tần số
13. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan như vậy hoặc hơn, giả sử giả thuyết null là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Mức ý nghĩa của kiểm định.
14. Trong hồi quy tuyến tính đơn giản, mục tiêu là gì?
A. Dự đoán giá trị của biến độc lập dựa trên biến phụ thuộc.
B. Mô tả mối quan hệ phi tuyến tính giữa hai biến.
C. Tìm đường thẳng phù hợp nhất mô tả mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập.
D. Tính toán độ lệch chuẩn của biến phụ thuộc.
15. Trong thống kê mô tả, đại lượng nào đo lường vị trí tương đối của một giá trị so với trung bình của tập dữ liệu, tính theo đơn vị độ lệch chuẩn?
A. Trung vị.
B. Tứ phân vị.
C. Z-score.
D. Phương sai.
16. Trong lý thuyết xác suất, tập hợp tất cả các kết quả có thể xảy ra của một phép thử được gọi là gì?
A. Biến cố
B. Không gian mẫu
C. Xác suất
D. Biến ngẫu nhiên
17. Biểu đồ hộp (boxplot) thường được sử dụng để làm gì?
A. Hiển thị tần số của các giá trị dữ liệu.
B. So sánh trung bình của nhiều nhóm.
C. Tóm tắt phân phối của một tập dữ liệu và xác định các giá trị ngoại lệ.
D. Hiển thị mối quan hệ giữa hai biến định lượng.
18. Trong kiểm định giả thuyết, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 là đúng.
B. Không bác bỏ giả thuyết H0 khi H0 là sai.
C. Chấp nhận giả thuyết H1 khi H1 là sai.
D. Không bác bỏ giả thuyết H1 khi H1 là đúng.
19. Chọn phát biểu ĐÚNG về phương pháp Bootstrap trong thống kê.
A. Bootstrap là phương pháp ước lượng tham số quần thể dựa trên toàn bộ dữ liệu quần thể.
B. Bootstrap là phương pháp lấy mẫu lặp lại CÓ hoàn lại từ mẫu ban đầu để ước lượng phân phối lấy mẫu của thống kê.
C. Bootstrap chỉ áp dụng cho dữ liệu tuân theo phân phối chuẩn.
D. Bootstrap là một loại kiểm định tham số.
20. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định về phân phối của dữ liệu không được thỏa mãn (ví dụ, dữ liệu không tuân theo phân phối chuẩn).
D. Khi cần tính toán trung bình quần thể.
21. Trong bài toán kiểm định giả thuyết về tỷ lệ quần thể, thống kê kiểm định thường được sử dụng là gì?
A. Thống kê t-Student.
B. Thống kê khi bình phương.
C. Thống kê z.
D. Thống kê F.
22. Khoảng tin cậy 95% cho trung bình quần thể có nghĩa là gì?
A. 95% các mẫu có trung bình nằm trong khoảng này.
B. Có 95% khả năng trung bình quần thể thực sự nằm trong khoảng này.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa trung bình quần thể thực sự.
D. Khoảng này chứa 95% dữ liệu của quần thể.
23. Giá trị trung bình của một biến ngẫu nhiên rời rạc được gọi là gì?
A. Phương sai
B. Độ lệch chuẩn
C. Kỳ vọng toán học
D. Trung vị
24. Chọn phát biểu SAI về xác suất.
A. Xác suất của một biến cố luôn nằm trong khoảng từ 0 đến 1.
B. Tổng xác suất của tất cả các biến cố sơ cấp trong không gian mẫu bằng 1.
C. Xác suất của biến cố không thể là số âm.
D. Xác suất của biến cố chắc chắn xảy ra là 0.
25. Hệ số tương quan Pearson đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
B. Mức độ phụ thuộc của hai biến định tính.
C. Sự khác biệt giữa trung bình của hai mẫu.
D. Phương sai của một biến.
26. Nếu hệ số tương quan bằng -1, điều đó có nghĩa là gì?
A. Không có mối quan hệ tuyến tính giữa hai biến.
B. Có mối quan hệ tuyến tính thuận chiều hoàn hảo.
C. Có mối quan hệ tuyến tính nghịch chiều hoàn hảo.
D. Có mối quan hệ phi tuyến tính mạnh.
27. Phân phối nào sau đây là phân phối xác suất liên tục?
A. Phân phối nhị thức.
B. Phân phối Poisson.
C. Phân phối chuẩn.
D. Phân phối siêu bội.
28. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian cố định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
29. Khi nào thì nên sử dụng kiểm định t-Student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối nhị thức.
30. Chọn khẳng định ĐÚNG về mối quan hệ giữa phương sai và độ lệch chuẩn.
A. Độ lệch chuẩn là căn bậc hai của phương sai.
B. Phương sai là căn bậc hai của độ lệch chuẩn.
C. Phương sai và độ lệch chuẩn là hai đại lượng đo xu hướng trung tâm.
D. Phương sai luôn nhỏ hơn độ lệch chuẩn.