1. Trong phân tích chuỗi thời gian, thành phần nào thể hiện xu hướng biến động dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality)
B. Tính chu kỳ (Cyclicality)
C. Xu hướng (Trend)
D. Tính ngẫu nhiên (Randomness)
2. Mục tiêu của phân tích cụm (cluster analysis) là gì?
A. Dự đoán giá trị của biến phụ thuộc.
B. Phân loại các quan sát thành các nhóm (cụm) sao cho các quan sát trong cùng một cụm tương tự nhau hơn so với các quan sát ở các cụm khác.
C. Kiểm tra mối quan hệ tuyến tính giữa các biến.
D. Giảm số chiều dữ liệu.
3. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để ước tính điều gì?
A. Tỷ lệ rủi ro (hazard ratio).
B. Thời gian sống sót trung bình.
C. Hàm sống sót (survival function), tức là xác suất sống sót theo thời gian.
D. Tỷ lệ tử vong.
4. Trong phân tích rủi ro, 'Value at Risk′ (VaR) được sử dụng để đo lường điều gì?
A. Lợi nhuận kỳ vọng.
B. Độ lệch chuẩn của lợi nhuận.
C. Mức lỗ tối đa có thể xảy ra trong một khoảng thời gian nhất định với một mức độ tin cậy cho trước.
D. Xác suất phá sản.
5. Chỉ số giá tiêu dùng (CPI) được sử dụng để đo lường điều gì trong kinh tế?
A. Tăng trưởng GDP.
B. Tỷ lệ thất nghiệp.
C. Mức độ lạm phát.
D. Tổng sản lượng quốc gia.
6. Khi phân tích dữ liệu định tính, phương pháp nào thường được sử dụng để tóm tắt tần suất xuất hiện của các danh mục?
A. Tính trung bình và độ lệch chuẩn.
B. Sử dụng biểu đồ phân tán.
C. Xây dựng bảng tần số và biểu đồ cột (bar chart).
D. Phân tích hồi quy.
7. Khi dữ liệu không tuân theo phân phối chuẩn và kích thước mẫu nhỏ, kiểm định nào sau đây thường được ưu tiên sử dụng để so sánh hai nhóm liên quan (paired samples)?
A. Kiểm định t ghép cặp (paired t-test).
B. Kiểm định Wilcoxon signed-rank.
C. Kiểm định z.
D. Phân tích phương sai lặp lại (repeated measures ANOVA).
8. Loại thang đo nào sau đây cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Thang đo định danh (Nominal)
B. Thang đo thứ bậc (Ordinal)
C. Thang đo khoảng (Interval)
D. Thang đo tỷ lệ (Ratio)
9. Trong kiểm định giả thuyết, mức ý nghĩa thống kê (alpha level) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi loại II là 5%.
B. Xác suất giả thuyết không là đúng là 5%.
C. Chúng ta chấp nhận rủi ro 5% mắc lỗi loại I (bác bỏ H0 khi H0 đúng).
D. Độ tin cậy của kiểm định là 95%.
10. Trong thống kê Bayes, khái niệm 'prior probability′ (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu quan sát được.
B. Xác suất ban đầu về một giả thuyết trước khi xem xét dữ liệu.
C. Xác suất của giả thuyết sau khi xem xét dữ liệu.
D. Xác suất của giả thuyết không.
11. Phương pháp lấy mẫu phân tầng (stratified sampling) đặc biệt hữu ích khi nào?
A. Khi tổng thể đồng nhất.
B. Khi muốn lấy mẫu nhanh chóng và dễ dàng.
C. Khi tổng thể có các nhóm (strata) khác biệt nhau và muốn đảm bảo tính đại diện của từng nhóm trong mẫu.
D. Khi không có danh sách đầy đủ về tổng thể.
12. Phương pháp 'bootstrap′ trong thống kê được sử dụng chủ yếu cho mục đích gì?
A. Ước lượng trung bình tổng thể.
B. Kiểm định giả thuyết về phương sai.
C. Ước lượng độ tin cậy của các thống kê mẫu (ví dụ: sai số chuẩn, khoảng tin cậy) bằng cách lấy mẫu lại có hoàn lại từ dữ liệu mẫu ban đầu.
D. Phân tích chuỗi thời gian.
13. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Mức độ biến thiên của biến độc lập.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
D. Sai số ngẫu nhiên trong mô hình.
14. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Biến phụ thuộc không tuân theo phân phối chuẩn.
B. Có mối tương quan cao giữa các biến độc lập.
C. Mô hình hồi quy không phù hợp với dữ liệu.
D. Sai số ngẫu nhiên có phương sai thay đổi.
15. Khi nào thì trung vị (median) được ưu tiên sử dụng hơn so với giá trị trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn.
B. Khi muốn tính toán nhanh chóng.
C. Khi dữ liệu có giá trị ngoại lệ (outliers).
D. Khi mẫu có kích thước lớn.
16. Thống kê mô tả khác biệt với thống kê suy luận chủ yếu ở điểm nào?
A. Thống kê mô tả sử dụng mẫu, thống kê suy luận sử dụng toàn bộ tổng thể.
B. Thống kê mô tả tập trung vào việc tóm tắt dữ liệu, thống kê suy luận đưa ra kết luận về tổng thể dựa trên mẫu.
C. Thống kê mô tả dùng số trung bình, thống kê suy luận dùng độ lệch chuẩn.
D. Thống kê mô tả chỉ dùng cho dữ liệu định tính, thống kê suy luận chỉ dùng cho dữ liệu định lượng.
17. Khi nào thì sử dụng kiểm định chi bình phương (Chi-squared test) trong thống kê?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra mối quan hệ tuyến tính giữa hai biến.
C. Để kiểm tra sự độc lập giữa các biến định tính hoặc kiểm định tính phù hợp của phân phối.
D. Để ước tính trung bình tổng thể.
18. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy (confidence interval)?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm đi.
C. Độ rộng khoảng tin cậy không đổi.
D. Không có mối quan hệ rõ ràng.
19. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Tăng kích thước mẫu.
B. Giảm độ lệch chuẩn của dữ liệu.
C. Đưa dữ liệu về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn.
D. Làm cho dữ liệu tuân theo phân phối chuẩn.
20. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ tuyến tính giữa các biến.
21. Sai số loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Chọn sai phương pháp thống kê.
D. Tính toán sai giá trị p.
22. Phương pháp dự báo nào sử dụng trung bình động (moving average) để làm trơn chuỗi thời gian và dự đoán giá trị tương lai?
A. Hồi quy tuyến tính.
B. Mô hình ARIMA.
C. Phương pháp trung bình động.
D. Phân tích chuỗi Fourier.
23. Phương pháp thống kê nào phù hợp để kiểm tra sự khác biệt về trung bình giữa hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t (t-test) cho mẫu độc lập.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Mann-Whitney U.
D. Hồi quy tuyến tính.
24. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết đối (alternative hypothesis) là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quả cực đoan như kết quả mẫu, giả định giả thuyết không (null hypothesis) là đúng.
D. Ngưỡng ý nghĩa thống kê.
25. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mức độ phụ thuộc của biến phụ thuộc vào biến độc lập.
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Sự khác biệt giữa trung bình mẫu và trung bình tổng thể.
26. Khoảng tin cậy (confidence interval) cho trung bình tổng thể được xây dựng nhằm mục đích gì?
A. Ước tính chính xác giá trị trung bình mẫu.
B. Ước tính một khoảng giá trị mà trung bình tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định xem trung bình tổng thể có bằng một giá trị cụ thể hay không.
D. Xác định kích thước mẫu cần thiết.
27. Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
A. Tất cả các trung bình tổng thể đều khác nhau.
B. Có ít nhất một trung bình tổng thể khác biệt.
C. Tất cả các trung bình tổng thể đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm.
28. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn vào mẫu và cơ hội này là như nhau?
A. Lấy mẫu phân tầng (Stratified sampling)
B. Lấy mẫu cụm (Cluster sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu thuận tiện (Convenience sampling)
29. Hệ số phóng đại phương sai (Variance Inflation Factor - VIF) được sử dụng để phát hiện và đo lường mức độ nghiêm trọng của hiện tượng nào trong hồi quy đa biến?
A. Phương sai sai số thay đổi.
B. Tự tương quan.
C. Đa cộng tuyến (multicollinearity).
D. Giá trị ngoại lệ.
30. Trong phân tích ANOVA hai yếu tố, điều gì được kiểm định?
A. Sự khác biệt giữa hai trung bình.
B. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
C. Ảnh hưởng đồng thời của hai yếu tố và tương tác giữa chúng lên biến phụ thuộc.
D. Mối quan hệ tuyến tính giữa các biến.