1. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến ngẫu nhiên.
B. Mức độ tập trung của dữ liệu xung quanh trung vị.
C. Mức độ phân tán của dữ liệu xung quanh giá trị kỳ vọng.
D. Xác suất để biến ngẫu nhiên nhận giá trị lớn nhất.
2. Trong phân tích phương sai (ANOVA), giả thuyết null thường là:
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một cặp trung bình quần thể khác nhau.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai của tất cả các quần thể đều khác nhau.
3. Khoảng tin cậy 95% cho trung bình quần thể có nghĩa là:
A. 95% mẫu từ quần thể sẽ cho trung bình mẫu nằm trong khoảng này.
B. Có 95% xác suất trung bình quần thể nằm trong khoảng này.
C. Khoảng này chứa 95% dữ liệu của quần thể.
D. Nếu lặp lại quá trình lấy mẫu 100 lần, khoảng 95 lần khoảng tin cậy được tạo ra sẽ chứa trung bình quần thể thực sự.
4. Chọn phát biểu SAI về thống kê mô tả:
A. Thống kê mô tả giúp tóm tắt và mô tả các đặc điểm chính của dữ liệu.
B. Thống kê mô tả sử dụng các biện pháp như trung bình, phương sai, và độ lệch chuẩn.
C. Thống kê mô tả cho phép đưa ra kết luận về quần thể dựa trên mẫu.
D. Thống kê mô tả bao gồm việc trình bày dữ liệu bằng biểu đồ và bảng biểu.
5. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả quan sát được, giả sử giả thuyết null là đúng.
D. Xác suất giả thuyết đối thuyết là đúng.
6. Nếu hệ số tương quan giữa hai biến X và Y là 0, điều đó có nghĩa là:
A. Có mối quan hệ tuyến tính mạnh mẽ giữa X và Y.
B. Không có mối quan hệ nào giữa X và Y.
C. Không có mối quan hệ tuyến tính giữa X và Y.
D. Có mối quan hệ phi tuyến tính giữa X và Y.
7. Chọn khẳng định ĐÚNG về mối quan hệ giữa phương sai và độ lệch chuẩn:
A. Phương sai luôn nhỏ hơn độ lệch chuẩn.
B. Phương sai và độ lệch chuẩn là hai khái niệm hoàn toàn độc lập.
C. Độ lệch chuẩn là căn bậc hai của phương sai.
D. Phương sai là căn bậc hai của độ lệch chuẩn.
8. Trong phân phối Poisson, tham số λ (lambda) đại diện cho điều gì?
A. Phương sai của phân phối.
B. Xác suất thành công trong mỗi thử nghiệm.
C. Trung bình số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Tổng số thử nghiệm được thực hiện.
9. Trong phân tích hồi quy tuyến tính đơn giản, mục tiêu chính là gì?
A. Dự đoán giá trị của biến độc lập dựa trên biến phụ thuộc.
B. Mô tả mối quan hệ phi tuyến tính giữa hai biến.
C. Dự đoán giá trị của biến phụ thuộc dựa trên biến độc lập.
D. Phân loại dữ liệu vào các nhóm khác nhau.
10. Chọn phát biểu ĐÚNG về trung vị (median):
A. Trung vị luôn bằng trung bình cộng.
B. Trung vị bị ảnh hưởng mạnh bởi giá trị ngoại lệ.
C. Trung vị chia dữ liệu thành hai phần bằng nhau, 50% dữ liệu nhỏ hơn hoặc bằng trung vị và 50% lớn hơn hoặc bằng trung vị.
D. Trung vị là giá trị xuất hiện nhiều nhất trong tập dữ liệu.
11. Hàm phân phối tích lũy (CDF) của một biến ngẫu nhiên X, F(x) = P(X ≤ x), luôn có giá trị nằm trong khoảng nào?
A. (-∞, +∞)
B. [0, 1]
C. (-1, 1)
D. [0, ∞)
12. Biến ngẫu nhiên rời rạc là biến:
A. Chỉ nhận giá trị trong một khoảng số thực.
B. Có thể nhận bất kỳ giá trị số thực nào.
C. Chỉ nhận một số hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
D. Luôn có hàm mật độ xác suất.
13. Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu bạn lấy ngẫu nhiên 2 bi, xác suất để cả hai bi đều màu đỏ là bao nhiêu?
A. 5/14
B. 10/56
C. 10/28
D. 25/64
14. Phân phối Bernoulli mô tả thí nghiệm ngẫu nhiên với bao nhiêu kết quả có thể?
A. Vô hạn
B. 3
C. 2
D. Nhiều hơn 2
15. Khi kích thước mẫu tăng lên, độ rộng của khoảng tin cậy thường:
A. Tăng lên.
B. Không thay đổi.
C. Giảm xuống.
D. Thay đổi không theo quy luật.
16. Trong thống kê suy diễn, chúng ta sử dụng thông tin từ mẫu để:
A. Mô tả dữ liệu mẫu một cách chi tiết.
B. Đưa ra kết luận hoặc suy luận về quần thể.
C. Tính toán các tham số mẫu.
D. Trình bày dữ liệu mẫu bằng biểu đồ.
17. Cho một biến ngẫu nhiên X có phân phối đều liên tục trên khoảng [a, b]. Hàm mật độ xác suất f(x) có dạng nào trong khoảng này?
A. f(x) = (b-a) cho a ≤ x ≤ b và f(x) = 0 ở nơi khác.
B. f(x) = 1/(b-a) cho a ≤ x ≤ b và f(x) = 0 ở nơi khác.
C. f(x) = x/(b-a) cho a ≤ x ≤ b và f(x) = 0 ở nơi khác.
D. f(x) = (x-a)/(b-a) cho a ≤ x ≤ b và f(x) = 0 ở nơi khác.
18. Trong kiểm định giả thuyết, mức ý nghĩa (α) thường được chọn là bao nhiêu?
A. 0.1
B. 0.01
C. 0.05
D. 1.0
19. Phân phối chuẩn (phân phối Gauss) có đặc điểm nào sau đây?
A. Lệch phải.
B. Không đối xứng.
C. Đối xứng và có dạng hình chuông.
D. Phân phối rời rạc.
20. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để:
A. So sánh trung bình của hai quần thể.
B. Kiểm định sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát.
C. Ước lượng khoảng tin cậy cho trung bình quần thể.
D. Phân tích mối quan hệ tuyến tính giữa hai biến định lượng.
21. Khi thực hiện kiểm định giả thuyết một phía (one-tailed test), miền bác bỏ nằm ở:
A. Cả hai phía của phân phối thống kê kiểm định.
B. Chỉ một phía của phân phối thống kê kiểm định.
C. Trung tâm của phân phối thống kê kiểm định.
D. Không có miền bác bỏ trong kiểm định một phía.
22. Khi nào nên sử dụng kiểm định t (t-test) cho hai mẫu độc lập?
A. Khi muốn so sánh trung bình của hai quần thể khi kích thước mẫu lớn (n > 30).
B. Khi muốn so sánh phương sai của hai quần thể.
C. Khi muốn so sánh trung bình của hai quần thể khi kích thước mẫu nhỏ và độ lệch chuẩn quần thể chưa biết.
D. Khi muốn kiểm định sự độc lập giữa hai biến định tính.
23. Mốt (mode) của một tập dữ liệu là:
A. Giá trị trung bình cộng.
B. Giá trị ở giữa khi dữ liệu được sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
24. Độ lệch chuẩn là căn bậc hai của:
A. Giá trị trung bình.
B. Phương sai.
C. Trung vị.
D. Mốt.
25. Trong kiểm định giả thuyết thống kê, lỗi loại I xảy ra khi:
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Bác bỏ giả thuyết null khi nó sai.
26. Phân phối nào sau đây thường được sử dụng để mô hình hóa thời gian chờ đợi cho sự kiện tiếp theo trong quá trình Poisson?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối mũ (Exponential).
D. Phân phối Poisson.
27. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính bằng công thức nào?
A. Tổng của các giá trị có thể nhân với xác suất tương ứng của chúng.
B. Trung bình cộng của tất cả các giá trị có thể.
C. Giá trị xuất hiện nhiều nhất của biến ngẫu nhiên.
D. Tích của các giá trị có thể và xác suất tương ứng.
28. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mức độ phụ thuộc tuyến tính giữa hai biến định lượng.
C. Mức độ khác biệt giữa hai quần thể.
D. Mức độ phù hợp của một mô hình hồi quy.
29. Khi nào thì phân phối nhị thức (Binomial) có thể được xấp xỉ bằng phân phối Poisson?
A. Khi số thử nghiệm n lớn và xác suất thành công p lớn.
B. Khi số thử nghiệm n nhỏ và xác suất thành công p nhỏ.
C. Khi số thử nghiệm n lớn và xác suất thành công p nhỏ.
D. Khi số thử nghiệm n nhỏ và xác suất thành công p lớn.
30. Mục đích của việc lấy mẫu ngẫu nhiên là gì?
A. Để đảm bảo mẫu có kích thước lớn nhất có thể.
B. Để tránh sai lệch và đảm bảo mẫu đại diện cho quần thể.
C. Để đơn giản hóa quá trình thu thập dữ liệu.
D. Để tập trung vào các phần tử cụ thể của quần thể.