1. Loại dữ liệu nào sau đây là dữ liệu định lượng?
A. Nhóm máu (A, B, AB, O).
B. Tình trạng hôn nhân (độc thân, kết hôn, ly hôn).
C. Thu nhập hàng tháng (VND).
D. Quốc tịch (Việt Nam, Mỹ, Nhật Bản).
2. Phân phối nhị thức (Binomial) mô tả:
A. Số lần sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
B. Xác suất thành công trong một chuỗi các phép thử Bernoulli độc lập.
C. Thời gian chờ đợi cho đến khi sự kiện đầu tiên xảy ra.
D. Phân phối của trung bình mẫu khi kích thước mẫu lớn.
3. Phân phối chuẩn (Normal) có dạng đồ thị hình gì?
A. Hình chữ nhật.
B. Hình tam giác.
C. Hình chuông (bell curve).
D. Đường thẳng.
4. Mức ý nghĩa (Significance level) trong kiểm định giả thuyết, thường ký hiệu α, là:
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi H0 là đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết H0 khi H0 là sai (lỗi loại II).
D. Xác suất chấp nhận giả thuyết H0 khi H0 là đúng.
5. Khoảng tin cậy (Confidence interval) là:
A. Một giá trị đơn lẻ ước tính cho tham số quần thể.
B. Một khoảng giá trị mà tham số quần thể có khả năng cao nằm trong đó.
C. Xác suất mà tham số quần thể nằm trong một khoảng xác định.
D. Sai số chuẩn của ước lượng.
6. Phương sai (Variance) của biến ngẫu nhiên X, ký hiệu Var(X), đo lường:
A. Giá trị trung bình của X.
B. Mức độ tập trung của các giá trị X xung quanh trung bình.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất của X.
D. Xác suất để X nhận giá trị lớn hơn giá trị kỳ vọng.
7. Biến ngẫu nhiên liên tục là biến ngẫu nhiên:
A. Chỉ nhận giá trị là số nguyên.
B. Nhận một số hữu hạn giá trị.
C. Có thể nhận bất kỳ giá trị nào trong một khoảng số thực.
D. Có phân phối xác suất rời rạc.
8. Hồi quy tuyến tính (Linear regression) được sử dụng để:
A. Mô tả phân phối của một biến.
B. Ước lượng và dự đoán giá trị của một biến phụ thuộc dựa trên biến độc lập.
C. Kiểm định sự độc lập giữa hai biến.
D. Tính xác suất của một biến cố.
9. Trung bình (Mean) của một tập dữ liệu được tính bằng:
A. Giá trị ở giữa tập dữ liệu sau khi sắp xếp.
B. Tổng tất cả các giá trị chia cho số lượng giá trị.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Căn bậc hai của tổng bình phương các giá trị.
10. Giá trị p (p-value) trong kiểm định giả thuyết là:
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất quan sát được kết quả thống kê kiểm định cực đoan hơn so với thực tế, giả định H0 là đúng.
C. Mức ý nghĩa của kiểm định.
D. Sai số chuẩn của thống kê kiểm định.
11. Hệ số tương quan (Correlation coefficient) đo lường:
A. Mức độ biến thiên của một biến.
B. Mức độ phụ thuộc tuyến tính giữa hai biến.
C. Giá trị trung bình của hai biến.
D. Phương sai của hai biến.
12. Xác suất của một biến cố A, ký hiệu P(A), luôn nằm trong khoảng nào?
A. (-∞, +∞).
B. (0, 1).
C. [0, 1].
D. (-1, 1).
13. Không gian mẫu trong lý thuyết xác suất là gì?
A. Tập hợp tất cả các biến cố sơ cấp có thể xảy ra của một phép thử.
B. Tập hợp các biến cố không thể xảy ra.
C. Một tập hợp con bất kỳ của các kết quả có thể xảy ra.
D. Số lượng các kết quả có thể xảy ra của phép thử.
14. Phép thử ngẫu nhiên là gì?
A. Một phép thử có kết quả luôn dự đoán được.
B. Một phép thử mà mỗi lần thực hiện chỉ có một kết quả duy nhất.
C. Một phép thử mà kết quả không thể dự đoán trước một cách chắc chắn.
D. Một phép thử được lặp lại nhiều lần để đảm bảo tính chính xác.
15. Nếu hai biến cố A và B độc lập, thì P(A∩B) bằng:
A. P(A) + P(B).
B. P(A) - P(B).
C. P(A) × P(B).
D. P(A) ∕ P(B).
16. Công thức cộng xác suất cho hai biến cố A và B là:
A. P(A∪B) = P(A) + P(B) + P(A∩B).
B. P(A∪B) = P(A) + P(B) - P(A∩B).
C. P(A∪B) = P(A) - P(B) + P(A∩B).
D. P(A∪B) = P(A) - P(B) - P(A∩B).
17. Độ lệch chuẩn (Standard deviation) là căn bậc hai của:
A. Giá trị kỳ vọng.
B. Trung vị.
C. Phương sai.
D. Mốt.
18. Biến cố giao của hai biến cố A và B, ký hiệu A∩B, là gì?
A. Tập hợp các kết quả thuộc A hoặc B nhưng không thuộc cả hai.
B. Tập hợp các kết quả chỉ thuộc B mà không thuộc A.
C. Tập hợp các kết quả thuộc cả A và B.
D. Tập hợp các kết quả không thuộc A hoặc không thuộc B.
19. Loại dữ liệu nào sau đây là dữ liệu định tính?
A. Chiều cao (cm).
B. Cân nặng (kg).
C. Màu sắc mắt (xanh, nâu, đen).
D. Nhiệt độ (°C).
20. Hai biến cố A và B được gọi là xung khắc nếu:
A. A∪B = Ω (không gian mẫu).
B. A∩B = Ω (không gian mẫu).
C. A∪B = ∅ (tập rỗng).
D. A∩B = ∅ (tập rỗng).
21. Biến cố hợp của hai biến cố A và B, ký hiệu A∪B, là gì?
A. Tập hợp các kết quả thuộc cả A và B.
B. Tập hợp các kết quả chỉ thuộc A mà không thuộc B.
C. Tập hợp các kết quả thuộc A hoặc B hoặc cả hai.
D. Tập hợp các kết quả không thuộc A và cũng không thuộc B.
22. Giá trị kỳ vọng (Expected value) của biến ngẫu nhiên X, ký hiệu E(X), thể hiện:
A. Giá trị lớn nhất mà X có thể nhận.
B. Giá trị trung bình của X trong dài hạn.
C. Giá trị xuất hiện thường xuyên nhất của X.
D. Độ lệch chuẩn của X.
23. Biến ngẫu nhiên rời rạc là biến ngẫu nhiên:
A. Nhận giá trị trong một khoảng số thực.
B. Nhận một số hữu hạn hoặc vô hạn đếm được các giá trị.
C. Luôn nhận giá trị là số nguyên dương.
D. Có hàm mật độ xác suất liên tục.
24. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Tổng của các biến ngẫu nhiên độc lập có phân phối chuẩn.
B. Trung bình mẫu của một mẫu đủ lớn sẽ có phân phối xấp xỉ chuẩn, bất kể phân phối gốc.
C. Phương sai của trung bình mẫu bằng phương sai của quần thể.
D. Các biến ngẫu nhiên độc lập luôn có cùng phân phối.
25. Trong lý thuyết xác suất, biến cố sơ cấp là gì?
A. Một tập hợp con của không gian mẫu.
B. Một kết quả duy nhất có thể xảy ra của phép thử.
C. Một biến cố chắc chắn xảy ra.
D. Một biến cố không thể xảy ra.
26. Công thức xác suất có điều kiện P(A|B) được định nghĩa là:
A. P(A∩B) ∕ P(A).
B. P(A∩B) ∕ P(B).
C. P(A∪B) ∕ P(B).
D. P(A∪B) ∕ P(A).
27. Giả thuyết H0 trong kiểm định giả thuyết thường là:
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh.
B. Giả thuyết mặc định hoặc giả thuyết không có sự khác biệt.
C. Giả thuyết đối nghịch với H1.
D. Luôn là giả thuyết đúng.
28. Mốt (Mode) của một tập dữ liệu là:
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị ở giữa tập dữ liệu sau khi sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Giá trị có khoảng cách lớn nhất so với trung bình.
29. Phân phối Poisson mô tả:
A. Xác suất thành công trong một chuỗi các phép thử Bernoulli độc lập.
B. Thời gian chờ đợi cho đến khi sự kiện đầu tiên xảy ra.
C. Số lần sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Phân phối của tổng các biến ngẫu nhiên độc lập.
30. Trung vị (Median) của một tập dữ liệu là:
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị ở giữa tập dữ liệu sau khi sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Giá trị có tần số xuất hiện thấp nhất.