1. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
2. Chỉ số giá tiêu dùng (CPI) là một ví dụ về loại chỉ số nào?
A. Chỉ số sản xuất
B. Chỉ số chất lượng
C. Chỉ số tổng hợp
D. Chỉ số đơn giản
3. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến tính giữa các biến
B. Tương quan cao giữa các biến độc lập
C. Sai số phương sai thay đổi
D. Thiếu biến quan trọng trong mô hình
4. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa trung bình của hai nhóm
B. Kiểm định sự khác biệt giữa trung bình của ba nhóm trở lên
C. Đo lường mối quan hệ tuyến tính giữa hai biến
D. Dự báo giá trị tương lai của biến số
5. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach′s alpha được sử dụng để đo lường điều gì?
A. Độ giá trị nội dung (content validity)
B. Độ tin cậy tương đương (equivalent reliability)
C. Độ tin cậy nhất quán nội tại (internal consistency reliability)
D. Độ giá trị tiêu chuẩn (criterion validity)
6. Trong phân tích rủi ro, 'phương sai′ thường được sử dụng để đo lường điều gì?
A. Giá trị kỳ vọng của lợi nhuận
B. Mức độ biến động hoặc rủi ro của lợi nhuận
C. Lợi nhuận trung bình
D. Xác suất thành công
7. Phương pháp nào sau đây giúp giảm thiểu tác động của giá trị ngoại lệ (outlier) lên giá trị trung bình?
A. Sử dụng giá trị trung bình (mean)
B. Sử dụng độ lệch chuẩn
C. Sử dụng trung vị (median)
D. Sử dụng phương sai
8. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó đúng
B. Không bác bỏ giả thuyết không khi nó sai
C. Chấp nhận giả thuyết đối khi nó sai
D. Bác bỏ giả thuyết đối khi nó đúng
9. Phương pháp thống kê nào thường được sử dụng để kiểm định sự khác biệt về trung bình giữa hai nhóm độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test)
C. Hồi quy đa biến
D. Thống kê mô tả
10. Phương pháp thống kê nào thường được sử dụng để dự báo doanh số bán hàng trong tương lai dựa trên dữ liệu quá khứ?
A. Phân tích hồi quy đa biến
B. Phân tích chuỗi thời gian
C. Kiểm định t
D. Thống kê mô tả
11. Biểu đồ nào sau đây phù hợp nhất để thể hiện tỷ lệ phần trăm của các hạng mục trong một tổng thể?
A. Biểu đồ đường
B. Biểu đồ cột
C. Biểu đồ tròn
D. Biểu đồ phân tán
12. Trong thống kê, 'mode′ (mốt) là giá trị nào?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị ở giữa của tập dữ liệu đã sắp xếp
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
D. Tổng của tất cả các giá trị chia cho số lượng giá trị
13. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi giả định về phân phối của dữ liệu không được đáp ứng
D. Khi cần tính toán khoảng tin cậy
14. Loại dữ liệu nào sau đây là dữ liệu định tính?
A. Doanh thu hàng tháng (VNĐ)
B. Nhiệt độ (độ C)
C. Màu sắc sản phẩm (xanh, đỏ, vàng)
D. Chiều cao nhân viên (cm)
15. Trong thống kê, 'phân phối chuẩn′ (normal distribution) còn được gọi là gì?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối Gaussian
D. Phân phối đều
16. Giá trị nào sau đây không thể là giá trị của xác suất?
17. Khi thực hiện kiểm định giả thuyết một đuôi (one-tailed test), chúng ta quan tâm đến điều gì?
A. Sự khác biệt theo cả hai hướng so với giả thuyết không
B. Sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn) so với giả thuyết không
C. Sự khác biệt lớn nhất có thể
D. Mức ý nghĩa thống kê cao nhất
18. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) thể hiện điều gì?
A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0
B. Mức độ phù hợp của mô hình hồi quy
C. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị
D. Sai số ngẫu nhiên trong mô hình
19. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu:
A. Chúng không thể xảy ra đồng thời
B. Xác suất xảy ra sự kiện này ảnh hưởng đến xác suất xảy ra sự kiện kia
C. Xác suất xảy ra sự kiện này không ảnh hưởng đến xác suất xảy ra sự kiện kia
D. Tổng xác suất của chúng bằng 1
20. Khi phân tích dữ liệu khảo sát, loại thống kê nào thường được sử dụng để mô tả đặc điểm mẫu (ví dụ: tỷ lệ giới tính, độ tuổi trung bình)?
A. Thống kê suy diễn
B. Thống kê mô tả
C. Phân tích hồi quy
D. Phân tích phương sai
21. Trong kiểm định giả thuyết, 'giá trị p′ (p-value) thể hiện điều gì?
A. Xác suất giả thuyết đối (alternative hypothesis) là đúng
B. Mức ý nghĩa thống kê được chọn trước
C. Xác suất quan sát được kết quả cực đoan như kết quả mẫu, giả sử giả thuyết không (null hypothesis) là đúng
D. Sai số loại I
22. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản
B. Lấy mẫu phân tầng
C. Lấy mẫu thuận tiện
D. Lấy mẫu theo cụm
23. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Phát hiện tính mùa vụ
B. Làm mượt dữ liệu và loại bỏ nhiễu
C. Dự báo dài hạn
D. Xác định chu kỳ kinh tế
24. Trong phân tích chuỗi thời gian, thành phần nào thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality)
B. Tính chu kỳ (Cyclicality)
C. Xu hướng (Trend)
D. Tính ngẫu nhiên (Randomness)
25. Trong thống kê suy diễn, 'khoảng tin cậy′ (confidence interval) được sử dụng để làm gì?
A. Tính toán giá trị trung bình mẫu
B. Ước lượng khoảng giá trị có khả năng chứa tham số tổng thể
C. Kiểm định giả thuyết về tham số tổng thể
D. Mô tả đặc điểm của mẫu
26. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của một biến số
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số
C. Giá trị trung bình của biến số
D. Độ phân tán của dữ liệu
27. Trong phân tích hồi quy, R-squared (hệ số xác định) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy
C. Sai số chuẩn của các hệ số hồi quy
D. Ý nghĩa thống kê của các biến độc lập
28. Thước đo nào sau đây thể hiện mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Giá trị trung bình
C. Độ lệch chuẩn
D. Mốt
29. Loại biểu đồ nào thích hợp để so sánh giá trị trung bình của một biến số giữa các nhóm khác nhau?
A. Biểu đồ phân tán
B. Biểu đồ hộp (box plot)
C. Biểu đồ đường
D. Biểu đồ tần suất
30. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ giá trị ngoại lệ
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh
C. Mã hóa dữ liệu định tính thành số
D. Giảm kích thước dữ liệu