1. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất.
C. Giá trị cực đoan, khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị nằm ở giữa tập dữ liệu.
2. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ phân tán của dữ liệu.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Giá trị trung bình của một biến.
D. Xu hướng trung tâm của dữ liệu.
3. Phương pháp lấy mẫu phân tầng (stratified sampling) được sử dụng khi nào?
A. Khi tổng thể đồng nhất.
B. Khi muốn đảm bảo mỗi nhóm con (strata) trong tổng thể được đại diện trong mẫu.
C. Khi không có danh sách đầy đủ các phần tử của tổng thể.
D. Khi muốn tiết kiệm chi phí và thời gian.
4. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy trở nên không xác định.
5. Thống kê mô tả (descriptive statistics) chủ yếu tập trung vào điều gì?
A. Dự đoán về tổng thể dựa trên mẫu.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định giả thuyết về tham số tổng thể.
D. Xây dựng mô hình hồi quy.
6. Khoảng tin cậy (confidence interval) cho biết điều gì?
A. Giá trị chính xác của tham số tổng thể.
B. Khoảng giá trị mà tham số tổng thể có khả năng cao nằm trong đó.
C. Xác suất tham số tổng thể nằm trong một khoảng cụ thể.
D. Độ chính xác của ước lượng điểm.
7. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Ở cả hai đuôi của phân phối.
B. Chỉ ở một đuôi của phân phối.
C. Ở trung tâm của phân phối.
D. Vùng bác bỏ không tồn tại trong kiểm định một đuôi.
8. Trong kiểm định giả thuyết, lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Không bác bỏ giả thuyết null khi nó sai.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.
9. Kiểm định phi tham số (non-parametric test) được sử dụng khi nào?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi các giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi muốn ước lượng tham số tổng thể.
10. Khi nào thì sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) cho trung bình tổng thể?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn tổng thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn tổng thể chưa biết.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
11. Hồi quy đa biến (multiple regression) khác với hồi quy đơn biến (simple regression) ở điểm nào?
A. Hồi quy đa biến chỉ sử dụng biến định tính.
B. Hồi quy đơn biến có nhiều biến phụ thuộc.
C. Hồi quy đa biến có nhiều biến độc lập để dự đoán một biến phụ thuộc.
D. Hồi quy đơn biến không sử dụng phương pháp bình phương tối thiểu.
12. Mức ý nghĩa (significance level) alpha (α) trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 0.1
B. 0.5
C. 0.05
D. 1.0
13. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
14. Biến định tính (qualitative variable) khác với biến định lượng (quantitative variable) ở điểm nào?
A. Biến định tính luôn có giá trị số.
B. Biến định lượng mô tả thuộc tính hoặc phẩm chất.
C. Biến định tính phân loại đối tượng vào các nhóm hoặc loại.
D. Biến định lượng không thể đo lường được.
15. Độ lệch chuẩn (standard deviation) là căn bậc hai của đại lượng nào?
A. Trung bình
B. Phương sai
C. Trung vị
D. Mốt
16. Trung vị (median) là thước đo vị trí trung tâm nào?
A. Giá trị xuất hiện nhiều nhất trong dữ liệu.
B. Giá trị trung bình cộng của dữ liệu.
C. Giá trị chia dữ liệu đã sắp xếp thành hai phần bằng nhau.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
17. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả đã quan sát, giả sử giả thuyết null là đúng.
C. Mức độ tin cậy của kiểm định.
D. Ngưỡng ý nghĩa thống kê.
18. Loại biểu đồ nào thích hợp nhất để thể hiện tần suất của các biến định tính?
A. Biểu đồ phân tán
B. Biểu đồ đường
C. Biểu đồ cột hoặc biểu đồ tròn
D. Biểu đồ hộp
19. Độ tin cậy (confidence level) của khoảng tin cậy thường được chọn là bao nhiêu?
A. 50%
B. 80%
C. 95%
D. 100%
20. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của tổng thể.
B. Độ lệch chuẩn của mẫu.
C. Độ biến động của trung bình mẫu giữa các mẫu khác nhau.
D. Sai số do đo lường không chính xác.
21. Phân phối Poisson (Poisson distribution) thường được dùng để mô hình hóa sự kiện nào?
A. Chiều cao của người trưởng thành.
B. Số lượng cuộc gọi điện thoại đến tổng đài trong một giờ.
C. Kết quả tung đồng xu.
D. Điểm thi của học sinh.
22. Phân phối nhị thức (Binomial distribution) mô tả số lượng thành công trong bao nhiêu phép thử độc lập?
A. Một phép thử duy nhất.
B. Vô số phép thử.
C. Một số lượng cố định các phép thử.
D. Các phép thử phụ thuộc lẫn nhau.
23. Độ lệch chuẩn của phân phối lấy mẫu trung bình mẫu được gọi là gì?
A. Phương sai mẫu
B. Sai số chuẩn
C. Độ lệch chuẩn mẫu
D. Trung bình mẫu
24. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị trung bình của biến phụ thuộc.
C. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
D. Mức độ phù hợp của mô hình hồi quy.
25. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường độ phân tán của dữ liệu.
26. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Giá trị trung bình
27. Phương pháp nào sau đây giúp giảm thiểu sai số chọn mẫu (sampling error)?
A. Tăng kích thước mẫu.
B. Sử dụng phương pháp lấy mẫu phi ngẫu nhiên.
C. Giảm kích thước mẫu.
D. Chỉ khảo sát những người tình nguyện.
28. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối nào?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gaussian
D. Phân phối mũ
29. Tứ phân vị (quartiles) chia dữ liệu đã sắp xếp thành bao nhiêu phần?
A. Hai phần
B. Ba phần
C. Bốn phần
D. Năm phần
30. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
A. Mỗi phần tử trong tổng thể có cơ hội được chọn khác nhau.
B. Mẫu thu được luôn đại diện hoàn hảo cho tổng thể.
C. Mỗi phần tử trong tổng thể có cơ hội được chọn như nhau.
D. Chỉ chọn các phần tử dễ tiếp cận nhất.